Разработан алгоритм, «сокращающий» научные документы в 238 раз
Программное приложение, позволяющее в очень кратком виде отражать основное содержание научных документов, создано исследователями из Института искусственного интеллекта Аллена в Сиэтле. 30 апреля статья с описанием основных принципов работы программы опубликована для обсуждения на сайте Корнеллского университета.
Программа ориентирована на «сжатие» научных работ по информатике. Применив данную программу к тексту статьи, можно получить его краткое изложение, отражающее основной смысл работы. При среднем объеме научной публикации по информатике около 5000 слов, краткое изложение содержит в среднем 21 слово.
Таким образом, программа сокращает тексты более чем в 238 раз. Использование данной программы позволит сократить до минимума время, необходимое для быстрого ознакомления с научными публикациями. Кроме того, программа может послужить полезным подспорьем при написании резюме публикаций.
Алгоритмы по «сжиманию» текстов разрабатывались и ранее. Сообщается, что ближайшие конкуренты новой программы были способны сжимать тексты в 40 раз. Примечательно, что резюме самой научной статьи о разработанной программе содержит более 100 слов.