Нейросеть от OpenAI смогла создать изображение редиски, выгуливающей собаку

Нейросеть DALL-E, разработанную компанией OpenAI, научили рисовать изображения по заданному описанию, сообщается 5 января в блоге компании.

Согласно сообщению, разработчики обучили новую нейросеть DALL-E, основанную на алгоритме обработки естественного языка GPT-3, работать с текстовыми описаниями. Для этого нейросеть «тренировали» на большом наборе пар «текст-изображение».

В качестве примера разработчики приводят следующие текстовые описания: «маленькая редиска дайкон в балетной пачке, выгуливающая собаку», «кресло в форме авокадо», «тот же кот вверху, что и на эскизе внизу».

Нейросеть способна не только определять по одному слову, что нужно нарисовать, но и формировать определенные ассоциации из словосочетаний. Тем не менее чем сложнее описание, тем хуже работает нейросеть.