Компания Open AI научила ИИ сопровождать тексты видеорядом

П. А. Сведомский. Погребённые в цветах. 1886
П. А. Сведомский. Погребённые в цветах. 1886

В четверг компания OpenAI представила инструмент, который может генерировать видео из текстовых подсказок, пишет 16 февраля газета The Guardian.

Новая модель, получившая название Sora (по-японски «небо»), может создавать реалистичные кадры продолжительностью до минуты, которые соответствуют инструкциям пользователя как по тематике, так и по стилю. Согласно сообщению, размещенному в блоге компании, модель также способна создавать видео на основе неподвижного изображения или дополнять существующие кадры новым материалом.

Одно видео, включенное в число нескольких первоначальных примеров от компании, было основано на такой подсказке: «Трейлер фильма о приключениях 30-летнего космонавта в красном шерстяном вязаном мотоциклетном шлеме, голубое небо, пустыня, кинематографический стиль, снято на 35-миллиметровую пленку, яркие цвета».

Компания объявила, что открыла доступ к Sora нескольким исследователям и создателям видео. Эксперты «перепроверят» продукт — протестируют его на соответствие условиям предоставления услуг OpenAI, которые запрещают «экстремальное насилие, сексуальный контент, изображения, вызывающие ненависть, сходство со знаменитостями или использование персональных данных третьих лиц».

The Guardian напоминает, что компания дебютировала с генератором неподвижных изображений Dall-E в 2021 году и чат-ботом AI ChatGPT в ноябре 2022 года, который быстро набрал 100 миллионов пользователей. Другие компании, работающие с искусственным интеллектом, представили инструменты для генерации видео, хотя эти модели смогли создать всего несколько секунд видеоматериала, который часто не имеет большого отношения к их подсказкам.