Новый метод восстановления древних текстов предложили ученые

Герард Дау. Ученый, затачивающий перо. 1633
Герард Дау. Ученый, затачивающий перо. 1633
Герард Дау. Ученый, затачивающий перо. 1633

Один из лучших способов узнать о любом историческом периоде — это пообщаться с людьми, которые пережили его. Однако общение с людьми из далекого прошлого — невыполнимая задача, пишет 25 марта веб-сайт Phys.org.

Ученые-компьютерщики из Италии, Великобритании и Пакистана объединились, чтобы воскресить мертвых по записям, на которые наложило отпечаток время, разработав метод, позволяющий вернуть документам более разборчивое и расшифровываемое состояние. В статье «Реставрация и контент-анализ древних рукописей с помощью сегментации на основе цветового пространства», опубликованной в журнале PLOS ONE, команда подробно описывает метод своей цифровой реставрации и экспериментальные результаты.

Мы получаем представление о древних цивилизациях из созданных ими трудов, как тривиальных, так и глубоких. Шумерская клинопись на глиняных табличках повествует о торговых сделках 4000-летней давности, геометрических расчетах и поэзии, подробно описывающей падение великого города. Если бы все фиксировалось на бумаге, вряд ли бы это дошло до наших дней.

Но были и историки, оставлявшие на бумаге память о древних событиях. У нас есть письма солдат, участвовавших во всех крупных конфликтах за последние четыреста лет, письменные свидетельства о большинстве крупных или даже незначительных событий со времен промышленной революции, и все это на бумаге, которая подвержена старению и деградации.

В записях конца 1980-х годов есть небольшой пробел, поскольку люди использовали гибкие диски для хранения важных документов только для того, чтобы выбросить их всего несколько лет спустя — к счастью, в те годы ничего важного не произошло, отмечает издание.

Чтение старых документов, даже находящихся в хорошем состоянии, может потребовать от читателя стать на время криптологом, расшифровывающим закодированные сообщения. Не столько потому, что автор намеренно скрывал свои тексты, сколько потому, что сочетание грамотности автора, разборчивости почерка, стиля письма, устаревших орфографических и грамматических условностей или специальных сокращений для экономии места может заставить даже родной язык казаться незнакомым.

Возьмите документ и попробуйте сложить воедино его содержание после того, как текст пострадал за счет выцветания чернил, расширения надписей из-за воздействия влаги, просачивания или переноса пигмента с одной страницы на другую. Это может стать поистине сложной задачей.

Одним из аспектов нынешних усилий, который сильно отличается от прошлых методов, является использование цвета. Типичная цифровая реконструкция преобразует документ в черный текст на белом фоне в попытке выявить текст с помощью фильтрации шума и повышения контрастности. При существующем методе цветопередачи изображение в гораздо большей степени восстанавливается, сохраняя большую часть внешнего вида и виртуальных ощущений исходного документа.

Исследователи применили сложную интеграцию нескольких методов цифровой интерпретации цвета и моделей гауссовой смеси для идентификации и разделения элементов текста, бумаги и артефактов. Это позволяет выборочно извлекать различные слои информации на основе иногда едва заметных спектральных различий. Таким образом, пользователь в состоянии решить, важны ли для понимания нацарапанные обозначения, оформление страницы, штамп, пятно от донышка кофейной кружки или другой элемент, добавив или удалив слои.

В некоторых случаях этот метод может сохранить особенности, которые в противном случае были бы утеряны, такие как слабые водяные знаки производителя бумаги, которые могли бы дать историкам важную информацию. Например, знаменитые работы Леонардо да Винчи, которые сохранились в замечательном состоянии и не были частью текущего исследования, написаны на страницах с водяными знаками от различных поставщиков бумаги, что позволило историкам сгруппировать их по вероятным периодам написания.

Согласно статье, такая обработка может быть выполнена на стандартном ПК (core i5, 4 ГБ оперативной памяти, Windows 10). Алгоритму требуется всего несколько минут, чтобы виртуально вернуть документу большую разборчивость. Такой уровень удобства в использовании сделал бы его отличным инструментом как для исследователей исторических документов, так и для людей, пытающихся расшифровать старинные семейные рецепты, констатирует издание.