«Сбер» создал нейросеть, генерирующую картинки по тексту на русском языке
Первая в мире нейронная сеть ruDALL-E, генерирующая изображения по описанию на русском языке, была создана компанией «Сбер», 2 ноября сообщили в пресс-службе банка, передает ИА REGNUM.
По словам «Сбера», нейросеть можно применять в первую очередь для дизайна интерьеров как векторные иллюстрации или изображения для стоков как материалы для рекламы, копирайтинга и промышленного дизайна.
«Рисующий» ИИ обучается одновременно на картинках и текстах, позволяя создать неограниченное количество иллюстраций по заданному описанию.
Существует две модели, одна из которых бесплатная — на основе 1,3 млрд параметров. Ее можно загрузить с сервиса Github.
Алгоритм создает изображения в три этапа. Сперва он генерирует определенное число картинок по тексту, затем выбирает более соответствующие описанию и на третьем этапе увеличивает изображения без потери качества.
Сообщается, что для того, чтобы обучить нейросеть, потребовалось 23 тыс. GPU-часов на массиве данных из 120 млн пар текст-изображение. Этот проект стал самым крупным нейросетевым вычислительным проектом в России и СНГ.