Нейросеть против кинокамеры, или Кто будет снимать фильмы завтра?

В феврале очередной раз заговорили про «убийцу» кинематографа. Китайская компания ByteDance представила нейросеть Seedance 2.0, которая генерирует 15-секундные видео в 2K-разрешении. Пользователи с помощью этой модели начали клепать «вирусные» ролики с популярными актерами. Голливудские студии уже подали иски против компании, а профсоюз актеров SAG-AFTRA бьет тревогу, указывая на то, что сгенерированный контент позволяет очень точно создавать образы и голоса артистов без их разрешения.
Появление инструментов, способных создать зрелищные видео, поставило вопрос: нужны ли будут оператор и кинокамера завтра? Попробуем также разобраться, пора ли хоронить кинематограф или еще рано?
Игра в имитацию
Сразу стоит отметить, что сгенерированные ролики вызывают удивление от того, насколько они похожи на реальные, только первые секунды, а потом чувствуется фальшь. Во-первых, изображение человека остается отталкивающим из-за неточностей, которые заметны скорее на подсознательном уровне. Во-вторых, окружающая среда выглядит нереалистично из-за стремления нейросети к идеальному изображению, которое зритель считывает как «мертвое» и не доверяет ему.
ИИ-аватары имеют ограниченный диапазон движений и выразительности лица. Какими бы реалистичными они ни казались, остается эффект «зловещей долины» — негативной реакции на не совсем реальные гуманоидные фигуры. Полностью воспроизвести эмоциональный диапазон человека так, чтобы передать волшебство актерской игры, пока не удается. И вряд ли удастся в обозримом будущем.
Лучше всего у нейросетей получаются экшен-сцены с персонажами в масках (Человек-паук, Бэтмен) или монстрами. С одной стороны, в этих случаях не видно лиц и неестественной мимики, с другой стороны, внимание отвлекается на динамику происходящего и не успевает замечать деталей, которые выдают неестественность происходящего. Кроме того, в музыкальных клипах уже стало нормой их «глянцевость» и отсутствие эмоций, поэтому сгенерированные клипы мало отличаются от настоящих. Это также относится к рекламным роликам и простым анимациям.
Когда же приходится смотреть диалоги, которые должны раскрыть персонажей, или непрерывные кадры, которые длятся более двух-трех секунд, то это уже раздражает, а не завораживает. Пока с помощью Seedance 2.0 не делали длинных фильмов, но подобный контент от других нейросетей не становился популярным, хотя некоторые короткие ролики от них становились «вирусными».
Оператор работает со светом, оптикой и живым актером в реальном времени. Он принимает решения на площадке, исходя из того, что видит глазами, и на основе личного опыта, который недоступен машине. Тот, кто пишет промпт, для создания видео работает с языком и ограничениями модели. Он описывает то, что представляет, но не взаимодействует с реальностью напрямую.
Длинные сцены с живым светом, актерской игрой и сложным звуком остаются недоступными для ботов. Физика мира в сгенерированных видео только на первый взгляд выглядит реалистично. Стремление к идеальной «картинке» приводит к стерильному изображению, которое еще хуже воспринимается из-за ряда неестественных деталей.
Также нужно понимать, что нейросети работают на основе усреднения, то есть они не способны создать что-то новое. Видео от них вызывают ощущение, что нечто подобное уже где-то было. Боты могут копировать стиль, но не создать новый.
Иллюзия обмана
При этом нельзя просто отмахнуться от развития технологии. Цифровые инструменты повлияют на кинопроизводство и уже влияют. Они позволяют сильно сэкономить затраты на съемках. Дешевизна — главный аргумент за ИИ, который делает его использование неизбежным.
Нейросети можно использовать для раскадровки и создания черновиков при тестировании идей. Вопрос в том, в каких случаях зритель будет «прощать» использование нейросетей, например, сгенерированную массовку. Также можно с уверенностью говорить, что в экшен-сценах ИИ будет применяться широко. Подобные съемки сложны, дороги, и не так много специалистов, которые могут их грамотно ставить.
Оператор останется там, где нужно не просто выполнить движение, а найти единственно верное пластическое решение, почувствовать ритм сцены, поймать взаимодействие актеров. Движение крана с камерой можно запрограммировать, но выбор ракурса за человеком. ИИ остается инструментом и не способен стать мозгом, как бы его ни имитировал. Искусство — это всегда высказывание, а нейросеть остается лишь компилятором.
Возможно, нейросети заменят кинорежиссеров, снимающих проходные фильмы и сериалы и дешевую типовую рекламу, но не тех, кто создает искусство. ИИ не научился оживлять мертвые глаза сгенерированных «актеров», даже если они очень похожи на своих прототипов.
Послезавтра
Также стоит вспомнить, что кинематограф уже не раз «хоронили». При появлении телевидения говорили, что в кино теперь ходить не будут. Потом такие же опасения были после появления видеомагнитофонов и DVD-проигрывателей. Когда же появилась возможность бесплатно скачивать фильмы из интернета, крах индустрии кино казался неизбежным. Но этого не произошло.
Нейросети — это очень мощные и порой пугающие инструменты. Их создание приведет к трансформации кинематографа. Но создателем по-прежнему останется человек с его болью, точкой зрения и гениальностью. Хотя наверняка многие будут использовать ИИ для штамповки дешевых поделок, и их станет много.
(теги пока скрыты для внешних читателей)