Google предложил потестировать свои нейросети, отвечающие на вопросы
Google открыл доступ к нейросети проекта TAPAS, нацеленного давать ответы на вопросы, написанные естественным языком, заявил сотрудник Google Research Томас Мюллер. 30 апреля он сообщил об этом в своем блоге на площадке googleblog.
Необходимый для использования создаваемых по подходу TAPAS нейросетей программный код выложен на ресурсе GitHub в репозитории tapas. Таким образом компания Google намерена получить помощь от программистского сообщества в тренировке и тестировании своего подхода по построению отвечающей на вопросы системы искусственного интеллекта.
Компания Google разработала подход к построению нейросетей, отвечающих на вопросы, сформулированные в виде предложений на естественном языке. В качестве примера приводятся такие вопросы: «Какой рестлер становился чемпионом наибольшее число раз?», «Сколько есть рестлеров, бывших чемпионами только один раз?»
Новый подход, названный TAPAS (от Table Parsing — обработка таблиц), работает с таблицами данных. Алгоритм ищет ответ в ячейках таблиц, как напрямую, так и используя суммирование, усреднение и другие операторы. Также он может искать ответ среди нескольких таблиц сразу.
Разработчики TAPAS натренировали нейросеть на 6,2 млн пар «таблица-текст», взятых из Википедии. Для проверки нейросеть должна была восстановить пропущенные слова как в таблицах, так и в текстах, на которых она не тренировалась. Точность восстановления составила 71,4%.
Подход TAPAS был описан 5 апреля 2020 года в статье «TAPAS: Weakly Supervised Table Parsing via Pre-training» на ресурсе arXiv.org Корнеллского университета. Он является расширением подхода BERT, ставшего доступным для публичного тестирования 2 ноября 2018 года.
Отметим, что 13 июля 2017 года компания Facebook открыла доступ к своему проекту DrQA, также отвечающему на вопросы. Создатели DrQA исходили из того, что ответом на задаваемый фактологический вопрос будет цитата из Википедии.