OpenAI представила нейросеть, редактирующую изображения по описанию

Изображение: pixabay, cc0
Искусственный интеллект
Искусственный интеллект

Нейросеть GLIDE, способная генерировать и редактировать изображения по текстовому описанию, была представлена компанией OpenAI, 20 декабря разработчики поделились результатами своей работы на научном портале arXiv.org.

Нейросеть GLIDE была обучена на 3,5 млрд параметров. Искусственный интеллект (ИИ) распознает как фотографии, так и иллюстрации и способен подстраиваться под стиль художника или отдельного изображения. Изменения, которые за несколько секунд привносит система, учитывают тени и отражения на исходной картине.

«GLIDE позволяет создавать фотореалистичные изображения, объединять концепции правильным образом и осуществлять художественную визуализацию», — отметили в OpenAI.

По словам обозревателей из ZME Science, качество обработанных в GLIDE работ очень часто можно сопоставить с тщательной проработкой в Photoshop. ИИ понимает даже такие сложные запросы как «повесить картину Ван Гога на стену», однако странные запросы вроде «автомобиль с треугольными колесами» ей даются с трудом.

Отметим, OpenAI приобрела свою известность за счет разработанных ранее моделей искусственного интеллекта GPT-3 и DALL-E. На сайте GitHub авторы поделилась исходным кодом сокращенной модели GLIDE.