ИИ от «Сбера» научился создавать изображения по описанию
Систему искусственного интеллекта от «Сбера» ruDALL-E научили строить изображения по русскоязычному текстовому описанию, сообщила пресс-служба «Сбера» 3 ноября сайте проекта.
Как сообщается, ruDALL-E строит изображение в три этапа. На первом этапе система генерирует картинки на основании текста пользователя. Второй этап заключается в отборе наиболее подходящих под описание картинок из получившегося массива изображений. В ходе третьего этапа нейросеть масштабирует изображения.
Как сообщается, существует две версии системы. Одна из них — ruDALL-E Malevich — распространяется бесплатно и работает с 1,3 млрд параметров. Загрузить ее можно с GitHub. Вторая система ruDALL-E Kandinsky обучалась на массиве данных, имеющих 12 млрд параметров.
Нейросеть обучалась в течение 37 дней на суперкомпьютере компании «Сбер» «Кристофари». Как отмечается, ruDALL-E Kandinsky сравнима по качеству работы с английской нейросетью DALL-E от OpenAI.
Разработчики отмечают, что система позволяет «учесть точное описание желаемого» и создать такое «изображение, которое раньше не существовало». Предполагается, что такие изображения можно будет использовать «для фото-иллюстрации статей, в копирайтинге, в рекламе».
Проверить систему можно прямо сейчас, пройдя на сайт разработки. Однако ожидание обработки изображения, как сообщает нейросеть, может занять более часа.