Нейросеть от ученых МГУ прочитала 10 тысяч астрономических рукописей
Перевод с высокой точностью в цифровой формат рукописных записей о солнечной активности, сделанных в обсерватории Цюриха в конце XIX — начале XX веков, помогла осуществить нейросеть, созданная математиками МГУ, сообщает 4 июля пресс-служба университета.
10 тысяч астрономических рукописей прочитала нейросетевая модель, разработанная сотрудниками механико-математического факультета МГУ, чтобы перевести их в цифровой формат, который позволил астрономам восстановить картину солнечной активности за более чем 30 лет и уточнить ее характер и особенности солнечных циклов того времени.
Над оцифровкой астрономических данных работали также ученые из Института механики сплошных сред УрО РАН (Пермь) и Потсдамского астрофизического института им. Лейбница (Германия). Результаты их работы опубликованы в журнале Solar Physics в статье «Реконструкция солнечной активности по каталогам Цюрихской обсерватории».
В ней авторы указывают, что каталоги Цюрихской обсерватории содержат информацию о расположении солнечных пятен, протуберанцев и факелов с конца XIX — начала XX веков. Эта база данных представляет собой рукописные записи в таблицах и ранее систематически не анализировалась.
Один из авторов статьи, кандидат физико-математических наук, доцент кафедры теории вероятностей механико-математического факультета МГУ Егор Илларионов рассказал:
«Мы разработали нейросетевую модель, которая с высокой точностью читает рукописный текст. В нашем случае текстом были координаты активных областей Солнца, записанные в таблицы. Примечательно, что ни одна из готовых программ, которые мы тестировали в начале процесса, не показывала удовлетворительного качества. Поэтому пришлось разрабатывать собственную модель — за это отвечали сотрудники МГУ».
Егор Илларионов пояснил, что уникальность модели в том, что, кроме собственно распознавания числа, она дает оценку уверенности и числа целиком, и каждого отдельного символа в этом числе, предлагая одновременно набор возможных интерпретаций этого символа. Это позволяет уточнить результат.
Также она обладает возможностью в процессе работы подстраиваться под конкретный почерк делавшего записи человека, и изменения в структуре таблиц. Эти ее особенности позволили значительно повысить точность по сравнению с моделью, работающей с фиксированными параметрами, установленными в период обучения.
Цифровой формат информации облегчит астрономам ее анализ и поможет уточнить представления о характере солнечной активности и особенностях солнечных циклов в историческом периоде.
Кроме того, разработанная технология распознавания рукописного текста в документах может быть адаптирована под различные задачи, особенно там, где ручная обработка займет слишком много времени из-за больших объемов текстов, указал Егор Илларионов.