Машина не может понимать необычные вопросы — эксперт
Проблемы искусственного интеллекта применительно к задачам машинного перевода обсудил эксперт и предприниматель в области информационных технологий Игорь Ашманов 29 октября в интервью изданию «Бизнес-газета».
Бизнесмен заявил, что важным событием в развитии искусственного интеллекта стало решение задачи распознавания образов. Если двадцать лет назад она казалась непонятной и нерешаемой, то сейчас готовые системы, основанные на нейронных сетях, уже считаются ширпотребом.
Но если за последние восемь лет задачу распознавания образов удалось решить, то работа с текстом не может похвастаться подобными успехами.
В качестве примера ограниченности современных информационных систем Ашманов привел то, что они не в состоянии поддерживать диалог с человеком на естественном языке. Многочисленные чат-боты нашего времени, в том числе и умеющие синтезировать речь, всё еще не способны поддерживать связный диалог, удерживать фокус и распознавать необычные вопросы.
Чтобы в этом убедиться, пояснил он, не нужно быть экспертом. Достаточно обменяться с любой из систем несколькими связанными репликами, «и вы поймете, насколько он всё еще тупой».
Проблема распознавания текста распространяется и на смежные области, в частности, на проверку орфографии и машинный перевод.
По опыту Ашманова, для того, чтобы информационная система смогла найти и исправить ошибки, необходимо, чтобы исходный текст был достаточно высокого качества. По различным оценкам, пороговое число ошибок составляет от двух до шести слов на страницу текста.
Точно так же обстоит дело и с переводом, несмотря на очевидный прогресс, достигнутый за четверть века в этой области. При этом обратной стороной успехов техники стало то, что переводческие фирмы уже не могут обойтись без машинного перевода.
Повсеместным стал подход, при котором «стало невозможно заказать чисто человеческий литературный перевод». Сначала текст переводит машина, а затем человек лишь дорабатывает его. При этом артефакты — следы машинного перевода, устранить не удается.