ИИ от «Сбера» научился создавать изображения по описанию

Изображение: (сс) geralt
Искусственный интеллект
Искусственный интеллект

Систему искусственного интеллекта от «Сбера» ruDALL-E научили строить изображения по русскоязычному текстовому описанию, сообщила пресс-служба «Сбера» 3 ноября сайте проекта.

Как сообщается, ruDALL-E строит изображение в три этапа. На первом этапе система генерирует картинки на основании текста пользователя. Второй этап заключается в отборе наиболее подходящих под описание картинок из получившегося массива изображений. В ходе третьего этапа нейросеть масштабирует изображения.

Примеры генерируемых изображений
Примеры генерируемых изображений
изображенийгенерируемыхПримеры

Как сообщается, существует две версии системы. Одна из них — ruDALL-E Malevich — распространяется бесплатно и работает с 1,3 млрд параметров. Загрузить ее можно с GitHub. Вторая система ruDALL-E Kandinsky обучалась на массиве данных, имеющих 12 млрд параметров.

Горы в стиле Ван Гога ruDALL-E Malevich
Горы в стиле Ван Гога ruDALL-E Malevich
MalevichruDALL-EГогаВанстилевГоры

Нейросеть обучалась в течение 37 дней на суперкомпьютере компании «Сбер» «Кристофари». Как отмечается, ruDALL-E Kandinsky сравнима по качеству работы с английской нейросетью DALL-E от OpenAI.

Разработчики отмечают, что система позволяет «учесть точное описание желаемого» и создать такое «изображение, которое раньше не существовало». Предполагается, что такие изображения можно будет использовать «для фото-иллюстрации статей, в копирайтинге, в рекламе».

Проверить систему можно прямо сейчас, пройдя на сайт разработки. Однако ожидание обработки изображения, как сообщает нейросеть, может занять более часа.