Физики СПбГУ создали архитектуру для нейросетей нового поколения

Архитектуру для сверхбыстрых нейросетей нового поколения, разработали физики Санкт‑Петербургского государственного университета, сообщает пресс-служба СПбГУ 6 февраля на официальном интернет-портале.
Традиционные нейросети используют архитектуру фон Неймана, которая представляет собой модель компьютерной структуры с хранением данных в общей памяти. В такое модели обработка информации происходит последовательно через центральный процессор. Главное из ограничений этой системы связано с физическим разделением вычислительного и запоминающего блоков (центрального процессора и оперативной памяти), что приводит к серьезному снижению скорости обмена данными и увеличению энергопотребления.
Руководитель лаборатории оптики спина СПБГУ Алексей Кавокин вместе со старшим научным сотрудником лаборатории Евгением Седовым разработали нейроморфную архитектуру на основе двумерных решеток «световых капель». Она была протестирована на основе решения двух задач: распознавании рукописных цифр (точность распознания системы превысила 97,5%) и распознавании голосовых команд (система превзошла все существующие решения для такой задачи).
«Строительными блоками для такой системы служат бозонные конденсаты экситон‑поляритонов (или просто поляритоны — частицы, образованные при взаимодействии фотонов и экситонов, возбуждений в полупроводниках)», — рассказал Кавокин.
Он пояснил, что когда поляритоны собираются вместе, они могут образовать особое коллективное состояние — конденсат Бозе — Эйнштейна. Когда два таких конденсата находятся рядом, они начинают обмениваться частицами. В результате создается узор из темных и светлых полос.
«Лазерный луч может изменить этот узор, превращая светлые полосы в темные — и наоборот. Это изменение используется как выходной сигнал, поэтому такие структуры работают как искусственные нейроны в нейронной сети», — продолжил физик.
Указывается, что предложенная архитектура относится к классу бинарных нейросетей (Binary Neural Networks, BNN), которые работают с двоичными входными и выходными сигналами нейронов. BNN быстрее традиционных решений обрабатывают информацию. Они требуют меньше памяти по сравнению с обычными нейронными сетями, потребляют меньше энергии и меньше масштабируются. Такие особенности делают их подходящими для устройств, где важна скорость и эффективность, а высокая точность не так критична.