1. Реальная Россия
  2. Развитие IT-технологий
Москва, / ИА Красная Весна

«Сбер» создал нейросеть, генерирующую картинки по тексту на русском языке

Изображение: rudalle.ru
Очень красивая собака (нейросеть ruDALL-E)
Очень красивая собака (нейросеть ruDALL-E)

Первая в мире нейронная сеть ruDALL-E, генерирующая изображения по описанию на русском языке, была создана компанией «Сбер», 2 ноября сообщили в пресс-службе банка, передает ИА REGNUM.

По словам «Сбера», нейросеть можно применять в первую очередь для дизайна интерьеров как векторные иллюстрации или изображения для стоков как материалы для рекламы, копирайтинга и промышленного дизайна.

«Рисующий» ИИ обучается одновременно на картинках и текстах, позволяя создать неограниченное количество иллюстраций по заданному описанию.

Существует две модели, одна из которых бесплатная — на основе 1,3 млрд параметров. Ее можно загрузить с сервиса Github.

Алгоритм создает изображения в три этапа. Сперва он генерирует определенное число картинок по тексту, затем выбирает более соответствующие описанию и на третьем этапе увеличивает изображения без потери качества.

Сообщается, что для того, чтобы обучить нейросеть, потребовалось 23 тыс. GPU-часов на массиве данных из 120 млн пар текст-изображение. Этот проект стал самым крупным нейросетевым вычислительным проектом в России и СНГ.