Говорящая собака-робот изменит жизнь людей с проблемами зрения

Что, если бы вы могли спросить свою собаку-поводыря, где находится ближайший фонтан с водой, и услышать ее ответ с указанием маршрута и предполагаемого времени пути? Исследователи из Университета штата Нью-Йорк в Бингемтоне создали робота-поводыря, который может делать что-то близкое к этому: вести простые беседы о навигации со своим владельцем, описывать окружающую обстановку и обсуждать по дороге варианты маршрута. Об этом рассказал 9 апреля портал Study Finds.
Настоящие собаки-поводыри — замечательные компаньоны, но они могут реагировать только на несколько коротких команд. Они не могут рассказать человеку, что их окружает, или объяснить, что, чтобы попасть на кухню, нужно пройти через две двери.
И проблема ошеломляет: только около 2% людей с нарушениями зрения в Соединенных Штатах используют собак-поводырей, отчасти потому, что разведение и дрессировка занимают годы, а овладевают необходимыми навыками менее половины собак, проходящих обучение. В Китае этот разрыв еще больше: примерно 400 собак-поводырей обслуживают более 10 миллионов людей с нарушениями зрения.
Команда Бингемтона решила изменить это, наделив четвероногого робота тем, чего нет ни у одной биологической собаки-поводыря: способностью объяснять маршруты словами. Их работа, представленная на 40-й ежегодной конференции AAAI по искусственному интеллекту, объединяет большую языковую модель, систему, которая понимает и генерирует язык, с навигационным планировщиком. Вместе они позволяют роботу понимать открытые запросы, предлагать пункты назначения и корректировать планы на лету.
Для тестирования говорящего робота-поводыря с реальными пользователями исследователи привлекли семь слепых людей в возрасте от 40 до 68 лет, двое из которых ранее имели опыт общения с настоящими собаками-поводырями. Участники передвигались по офисному помещению, а робот вел их за собой. В целях безопасности опытный оператор управлял физическими движениями робота дистанционно: робот еще не научился передвигаться самостоятельно.
Такая настройка позволила команде сосредоточиться на том, насколько хорошо работают функции ведения беседы. Каждый участник попробовал три варианта: минимальное словесное взаимодействие во время прогулки, только описание сцен и полноценная система, объединяющая информацию о маршруте перед отправлением с описаниями сцен по пути.
Используя GPT-4 для моделирования работы пользователя с нарушениями зрения, исследователи проверили, может ли система определить, куда хочет перейти человек, исходя только из косвенных выражений. Такого рода симуляция не совсем точно отражает то, как говорят реальные люди, но при разрешении уточняющих вопросов система правильно определяла предполагаемый пункт назначения в 94,8% случаев.
Они также провели стресс-тестирование системы на искажение речи, имитируя ошибки, которые возникают в условиях реального шума, с большим количеством имитируемых речевых ошибок, при которых почти каждый третий символ может быть искажен. Даже в этих суровых условиях точность снизилась всего на 5 процентных пунктов.
Миллионы людей с нарушениями зрения по всему миру никогда не будут иметь доступа к обученной собаке-поводырю. Робот, способный вести диалог с навигатором, может стать следующим лучшим вариантом, а в некоторых ситуациях и практичной альтернативой, констатирует Study Finds.