Исследователи создали метод обработки огромных графов на одном компьютере

Изображение:
Технологии Умный дом
Технологии Умный дом

Новая технология T-GPS, позволяющая обрабатывать огромные графы без сохранения в оперативной или постоянной памяти, разработана исследовательской группой из Корейского института передовых технологий (KAIST) под руководством профессора Мин-Су Кима, 6 мая сообщает британский журнал об электронике Electronics Weekly.

«Графы широко используются для представления и анализа объектов реального мира во многих областях, таких как социальные сети, бизнес-аналитика, биология и нейробиология», — заявил Ким.

Количество приложений, использующих представление данных в виде графов быстро растет. Параллельно растут объемы данных, которые необходимо обрабатывать и представлять. Поэтому потребность в новых алгоритмах высокая, считают исследователи.

Типовые алгоритмы представления данных в виде графов работают в два этапа. Сначала формируется граф и сохраняется в оперативную память или на постоянный накопитель. Затем на подготовленных данных выполняется алгоритм укладки, либо иной обработки.

Группа из KAIST разработала алгоритм T-GPS (моделирование обработки графов в триллионном масштабе). T-GPS работает за один проход. Он формирует небольшой граф на реальных данных, а затем синтезирует и обрабатывает только ту часть графа, которая сейчас непосредственно необходима.

Используя такой подход, группа смогла обработать граф с 1 трлн ребер на одном компьютере. При этом накладные расходы на размещение в памяти и обработку оказались ниже в 10 тыс. раз, а скорость выше в 43 раза. Последнее обусловлено, в частности, отсутствием необходимости в сетевом обмене между вычислительными узлами кластера.