Китайский алгоритм машинного зрения распознает изображения лучше людей
Уровень точности ответов на распознавание изображений компьютерной моделью искусственного зрения AliceMind от Alibaba Group Holding превысил точность ответов человека, сообщает 19 августа издание South China Morning Post, со ссылкой на результаты международного конкурса Visual Questing Answering (VQA) Challenge.
Занявший первое место в конкурсе VQA алгоритм AliceMind показал точность 81,26%, тогда как точность распознавания изображений человеком составила 80,83%. Для оценки точности необходимо было опознать изображение и дать точный ответ на вопрос, связанный с данным изображением.
Всего в 2021 году конкурсное задание состояло из 250 000 изображений и 1,1 млн вопросов. Результаты, продемонстрированные AliceMind, превзошли показатели такого мирового игрока на рынке компьютерных технологий, как Microsoft.
Хотя пока разница между искуственным зрением ИИ и человеком невелика, но компьютерные алгоритмы совершенствуются, к тому же компьютерная модель может работать без перерывов с одинаковой погрешностью, а у человека концентрация внимания снижается уже после 2-3 часов работы.
Однако руководитель отдела обработки естественного языка (NLP) в Alibaba DAMO Academy Си Луо заявил: «Это не означает, что однажды люди будут заменены роботами. Скорее, мы уверены, что умные машины могут использоваться для помощи в нашей повседневной работе и жизни, и, следовательно, люди могут сосредоточиться на творческих задачах, в которых они справляются лучше всего».
Компьютерное зрение — одна из наиболее активных сфер исследований и разработок в области ИИ в Китае. По словам Си, технология VQA может использоваться в самых разных областях, включая поиск продуктов на сайтах электронной коммерции, анализ медицинских изображений для первичной диагностики заболеваний, а также для автоматического вождения.