Разработан алгоритм, «сокращающий» научные документы в 238 раз

Густав Климт. Музыка. 1895
Густав Климт. Музыка. 1895

Программное приложение, позволяющее в очень кратком виде отражать основное содержание научных документов, создано исследователями из Института искусственного интеллекта Аллена в Сиэтле. 30 апреля статья с описанием основных принципов работы программы опубликована для обсуждения на сайте Корнеллского университета.

Программа ориентирована на «сжатие» научных работ по информатике. Применив данную программу к тексту статьи, можно получить его краткое изложение, отражающее основной смысл работы. При среднем объеме научной публикации по информатике около 5000 слов, краткое изложение содержит в среднем 21 слово.

Таким образом, программа сокращает тексты более чем в 238 раз. Использование данной программы позволит сократить до минимума время, необходимое для быстрого ознакомления с научными публикациями. Кроме того, программа может послужить полезным подспорьем при написании резюме публикаций.

Алгоритмы по «сжиманию» текстов разрабатывались и ранее. Сообщается, что ближайшие конкуренты новой программы были способны сжимать тексты в 40 раз. Примечательно, что резюме самой научной статьи о разработанной программе содержит более 100 слов.