Польские ученые создали алгоритм, распознающий «фейки» по стилю

Постер (фрагмент) к фильму «Терминатор» Реж. Джеймс Кэмерон.1984. США
Постер (фрагмент) к фильму «Терминатор» Реж. Джеймс Кэмерон.1984. США

Компьютерный алгоритм распознавания ложной информации в Интернете разрабатывают специалисты Польской академии наук, 4 декабря сообщает Польское агентство печати.

Алгоритм основан на запоминании и последующем сравнении стиля написания текста. Действуя таким образом, разработчики хотят обнаруживать не только «фейковые» новости, но и ботов, которые их генерируют.

Руководитель проекта доктор технических наук Петр Пшибила заявил, что алгоритм получился сложный и уже сейчас содержит более 900 функций. Его точность доходит до 90%, но этого пока недостаточно.

«Наша модель машинного обучения как бы обучается сама по себе — мы даем ей входные данные с определенной маркировкой и функциями, которые описывают эти данные. Затем алгоритм должен принять решение о связывании функций с надежностью», — заявил Пшибила.

Пшибила отметил, что необходимо преодолеть склонность алгоритма к обобщениям. Например, если какая-то конкретная информация от британского издания BBC была правдивой, то это не значит, что вся информация, написанная в этом стиле, тоже будет правдивой.

Алгоритм разбирает текст на части речи (существительные, прилагательные, глаголы и т. д.), отбрасывает суждения, касающиеся морали и других человеческих ценностей, отбрасывает проявление человеческих страстей (стремление к власти, к уважению в обществе и т. д.), убирает положительные и отрицательные эмоции. В сухом остатке получается набор вероятностей в правдоподобности того или иного высказывания.