Выпущен ИИ, способный генерировать связные тексты еще лучше

Изображение: pixabay, cc0
Искусственный интеллект
Искусственный интеллект

Свой первый платный инструмент, генерирующий вполне связные тексты, выпустила некоммерческая организация OpenAI, 14 июня сообщает The Guardian.

Инструмент назвали очень просто — API (application programming interface, интерфейс для программного доступа — набор методов взаимодействия одной компьютерной программы с другой). Он основан на модели GPT-3, созданной OpenAI для генерации текстов. Плата взымается за использование инструмента, а не получение его копии, т. е. по сути API платным сервисом.

Предыдущая версия модели GPT-2 стала доступной для свободного использования еще год назад, но она обучена 13 млрд параметрах или 40 Гб текстов. GPT-3 обучили на 175 млрд параметрах или 570 Гб текстов.

ИИ на базе модели GPT-3 способен вполне приемлемо (для ИИ) отвечать на вопросы по заданному тексту, разгадывать анаграммы, осуществлять перевод и даже писать художественные тексты и стихи.

Список текстов для обучения модели включает в себя подборку от проекта Common Crawl, статьи Википедии, два набора книг и комплект текстов веб-страниц WebText. На предыдущей версии WebText обучали GPT-2.

Особенностью GPT-3 является возможность выполнять задачу, основываясь на минимальном заданном тексте. В качестве примера приводится автодополнение по первой строке романа-антиутопии Джорджа Оруэлла «1984» — «Был яркий холодный апрельский день, часы били тринадцать» вполне связным текстом. Впрочем, этим функционал не ограничивается, система вполне способна работать и с биржевыми данными.

Пока что API работает в режиме закрытой бета-версии. «Нам нужно провести эксперименты, чтобы выяснить, что она может делать. Если вы не можете предвидеть все способности модели, вы должны подтолкнуть ее, чтобы увидеть, на что она способна. Есть много людей, которые думают, как ее можно использовать злонамеренно», — заявил представитель OpenAI Джек Кларк.

Кларк также добавил, что постараются оградить сервис (и модель, соответственно) от «вредных сценариев использования».