Как Microsoft Excel повлиял на науку. Ученые вынуждены переименовывать гены

Изображение:
Митрофанушка. Иллюстрация к комедии Д. И. Фонвизина «Недоросль»
Митрофанушка. Иллюстрация к комедии Д. И. Фонвизина «Недоросль»

Названия генов, которые программа Excel трактует как даты, будут изменены, чтобы сократить количество ошибок в научных публикациях, сообщает 6 августа портал The Verge.

Геном человека содержит десятки тысяч генов — участков спирали ДНК и РНК. Генам, функция которых установлена присваиваются идентификаторы. Некоторые идентификаторы табличный редактор Excel трактует как даты. Например, название MARCH1 получено как сокращение от Membrane Associated Ring-CH-Type Finger 1. Ecxel трактует его как первое марта и в таблице появляется 1-Mar.

Проверка 3597 работ, проведенная в 2016 году обнаружила, что в пятой части работ присутствуют ошибки внесенные Excel’ем. Отключить автоматическое распознавание дат в Excel невозможно.

Для избежания ошибок требуется вручную назначить тип выбранным ячейкам. При загрузке данных из других форматов, например CSV, избежать искажений невозможно.

Комитет номенклатуры генов (HGNC) выдал рекомендации по именованию генов. Отныне ген MARCH1 будет называться MARCHF1, SEPT1 переименован в SEPTIN1. Всего переименовано 27 генов

Компания Microsoft не ответила на запрос ученых. Элспет Бруфорд, координатор HGNC, предположил, что доля биологов среди пользователей Excel слишком мала, чтобы заинтересовать программного гиганта в изменении одного из основных продукта.