1. Экономическая война
  2. Развитие IT-технологий
Иннополис, / ИА Красная Весна

В РФ создали алгоритм, автоматически меняющий текст в документах полиции

Изображение: pixabay.com
Информационные технологи
Информационные технологи

Алгоритм, позволяющий избавить сотрудников МВД от рутинных задач, разработала в ходе хакатона «Цифровой прорыв» команда Университета Иннополис, заявил лидер команды, сотрудник Центра искусственного интеллекта Университета Иннополис Семен Киселев, сообщает 30 ноября «Хайтек».

В ходе хакатона команда Университета Иннополис работала над решением задания от департамента информационных технологий, связи и защиты информации МВД РФ. Разработчикам необходимо было создать алгоритм, который проводит лингвистический анализ документов и преобразует повествование от первого лица в текст от третьего лица. Например, фразу «Я увидел, что Иванов подошел ко мне» требовалось преобразовать в текст «Он увидел, что Иванов подошел к нему».

«Разработанное решение протестировали эксперты из МВД РФ. Алгоритм показал отличные результаты на их примерах. Мы за 48 часов разработали кросс-платформенный автономный продукт, который готов к внедрению в ведомство и способен избавить сотрудников органов внутренних дел от рутинных задач», — соощил Киселев.

Команда обучила нейронную сеть на датасете новостных сводок объемом 12 Гб. Она может размечать принадлежность сказуемого к нужному подлежащему, определять форму слова и морфологические категории. Результаты нейросети были использованы для написания Python-алгоритма на основе эвристик и правил русского языка.

Разработанное решение учитывает особую специфику ведомственных текстов, способно обрабатывать и художественные тексты. Алгоритм подвергает обработке местоимения, предлоги, глаголы, цитаты, прямую речь, определяет принадлежность местоимений к именам и выделяет героев, суммы денег, даты, локации.

Сотрудники университета предложили внедрить алгоритм в комплексный сервис с веб-интерфейсом, где пользователь может вставить текст, загрузить текстовые файлы различных форматов, аудиофайлы для распознавания речи и изображения с текстом. Кроме того, разработан плагин для LibreOffice с выделением измененных частей текста.

За первое место в соревновании команда университета «Иннополис» получила 750 тыс. руб.

Напомним, хакатон «Цифровой прорыв» — это всероссийский конкурс для IT-специалистов, дизайнеров и управленцев в сфере цифровой экономики. 27–29 ноября проходил финал конкурса в формате 48-часового онлайн-хакатона. В финале было представлено 15 реальных кейсов-заданий от партнеров конкурса, участвовали 350 команд.