Новый искусственный интеллект научился строить причинно-следственные связи
Гибридный искусственный интелект (далее — ИИ) и новый набор данных и эталонов для оценки возможностей алгоритмов ИИ в рассуждениях о действиях содержащихся в видеоинформации представлен исследователями из IBM, MIT, Harvard и DeepMind на конференции ICLR 2020, 17 мая сообщает TheNextweb.
Новый набор данных и исследовательская среда, представленные на ICLR 2020, называются «CoLlision Events for Video REpresentation and Reasoning» («События совпадений для представления и обоснования видео») или CLEVRER. Они основаны на CLEVR, визуальном наборе вопросов и ответов, разработанном в Стэнфордском университете в 2017 году. CLEVR — это набор задач, представляющих неподвижные изображения твердых объектов. Агент ИИ должен уметь анализировать сцену и отвечать на несколько вопросов о количестве объектов, их атрибутах и их пространственных отношениях.
В качестве решения сложной для классического ИИ задачи, исследователи представили модель нейро-символического динамического мышления, сочетание нейронных сетей и символического искусственного интеллекта.
Результаты показали, что включение нейронных сетей и символических программ в одну модель ИИ может объединить их сильные и преодолеть их слабые стороны. «Символическое представление обеспечивает мощную общую основу для видения, языка, динамики и причинно-следственных построений», — отмечают авторы, добавляя, что символические программы дают модели возможность «явно уловить композиционность, лежащую в основе причинной структуры видео и логики вопроса».
Преимущества таким систем ограничиваются и безусловными недостатками. Данные, используемые для обучения модели, требуют дополнительных аннотаций, которые могут быть слишком энергоемкими и дорогостоящими в реальных приложениях.