Грамотность авторов постов в соцсетях может быть определена автоматически

Разработан алгоритм автоматического распознавания по сообщениям в социальных сетях уровня грамотности авторов, заявил 1 сентября заведующий лабораторией вычислительных социальных наук Института образования НИУ ВШЭ Иван Смирнов в публикации в журнале «EPJ Data Science».

Предложенный алгоритм позволяет дифференцировать авторов сообщения по академической успеваемости с точностью 94%.

Анализировались при помощи этого алгоритма посты в социальных сетях «ВКонтакте» и Twitter.

В результате проделанной работы по анализу более, чем двух тысяч сообщений в социальных сетях, выяснилось, в частности, что для отличников характерны длинные содержательные тексты с большим количеством отсылок к литературе, физике, с описанием характера мыслительных процессов, а тексты двоечников пестрят ошибками, засорены смайлами, эмоциональными восклицаниями, словами, написанными с использованием заглавных букв.

Алгоритм тестировался на анализе текстов примерно сотни сообщений студентов крупнейших вузов России, уровень образованности которых был известен.

Напомним, результаты проделанной работы показывают серьезную уязвимость конфиденциальности социальных сетей. На основе анализа текстов из сетей при помощи предложенного алгоритма и ему подобных может быть определен не только уровень грамотности автора, но и его эмоциональное состояние, а также черты характера.

Комментарии
Загружаются...