В ОАЭ представили ​​крупнейшую модель цифровой обработки арабского языка

Изображение: geralt, pixabay, cc0
Искусственный интеллект
Искусственный интеллект

Передовой исследовательский центр Абу-Даби представил в ОАЭ крупнейшую в мире модель обработки естественного языка для арабского языка, 15 апреля сообщает The National.

Обработка естественного языка, или NPL, является ключевой частью бурно развивающегося сектора искусственного интеллекта, помогая компьютерам декодировать устную и письменную речь, чтобы ускорить разработку всего — от инструментов языкового перевода до интеллектуальных помощников в стиле Siri и Alexa.

Модель Noor, разработанная в Институте технологических инноваций, может дать арабскому миру новое преимущество в стремлении к цифровизации, поскольку такие инструменты, как чат-боты, рыночная аналитика и машинный перевод, сильно востребованы на англо- и китайскоязычных рынках.

«Приоритет состоит в том, чтобы найти способы использования Noor компаниями и учеными для создания новых инструментов, таких как анализ настроений в социальных сетях или разработка новых виртуальных помощников на арабском языке», — рассказала Эбтесам Алмазруэй, директор TII, руководивший проектом.

Но она сказала, что уменьшенная версия Noor также будет доступна для общественности в качестве модели с открытым исходным кодом.

Раньше самой крупной доступной арабской моделью была AraGPT — модель, обученная на 1,5 миллиарда параметров. Noor прошла обучение по 10 миллиардам параметров, включая набор данных, который объединяет веб-данные с книгами, поэзией, новостными статьями и технической информацией, чтобы значительно расширить возможности приложений, которые можно с его помощью создавать.

По данным TII, это самый большой из когда-либо созданных высококачественных кросс-доменных наборов арабских данных.

«В масштабе 10 миллиардов наша модель может решать более сложные задачи и принимать более сложные инструкции от людей к машинам», — сказала доктор Алмазроуи.

Например, он может обобщать тексты, помогать в написании пресс-релиза. Также его можно использовать для питания более естественных и эффективных чат-ботов или даже для оценки языкового уровня сотрудников.

TII, прикладное исследовательское подразделение Совета по исследованиям в области передовых технологий Абу-Даби, является важной частью усилий ОАЭ по диверсификации от зависимости от экспорта нефти и развитию экономики, основанной на знаниях.

Noor — это первый шаг в усилиях исследовательского центра по внесению вклада в более широкую стратегию ОАЭ в отношении искусственного интеллекта путем ускорения внедрения и интеграции ИИ в более широкую экономику.