Казанские химики идут на прорыв с помощью искусственного интеллекта
Внедрение искусственного интеллекта (ИИ) в самые разнообразные сферы жизни набирает обороты. Он находит применение в военной сфере, в медицине, в финансовой деятельности. Разумеется, научное сообщество также ищет способы применить ИИ для решения своих задач.
Заведующий кафедрой органической химии в Казанском федеральном университете, член-корреспондент РАН Игорь Антипин рассказал в ходе онлайн-беседы с кандидатом технических наук Александром Приказщиковым, размещённой в его телеграм-канале, о проблемах современной химии и о том, как они могут быть решены с помощью ИИ.
Зачем ИИ в науке?
Проблема создания искусственного интеллекта — одна из актуальнейших задач. И могу сказать, страна, которая в этой гонке будет лидером, будет самой высокотехнологичной державой с высокоразвитой промышленностью. Потому что искусственный интеллект позволяет решать проблемы, которые для человеческого мозга могут быть труднорешаемы.
Особенно это касается так называемых многофакторных задач. Задач, в которых многое базируется на громадном количестве данных, которые имеются в литературе, патентах, периодике. Химия — это как раз та область, где применение ИИ очень важно.
Особенно актуально применение ИИ в органической химии. Дело в том, что сейчас в базах данных находятся сотни миллионов реакций. Чтобы все их обобщить, конечно, необходим искусственный интеллект.
В связи с этим, начиная где-то с 2013 года на кафедре органической химии Казанского государственного университета мы создали лабораторию хемоинформатики и молекулярного моделирования с участием ведущего специалиста в этой области профессора Страсбургского университета Александра Варнека.
В настоящий момент создана группа, состоящая из нескольких молодых и одаренных ученых, ее возглавляет кандидат химических наук, доцент Тимур Маджидов. Задача этой лаборатории, этой группы, как раз состоит в том, чтобы применить ИИ для решения именно химических задач.
Какие проблемы может помочь решить ИИ в химии?
Проблема распадается на несколько частей. Первая принципиально важная проблема — научить компьютер понимать химическую символику. Химические формулы компьютеру очень тяжело понимать.
Эта задача в общем-то решена, и не только нами, но и многими другими исследователями из этой области. Существуют методы, которые позволяют добиться, чтобы компьютер это делал быстро, эффективно, находил те или иные структурные блоки в химическом соединении.
Вторая проблема, с которой мы также сейчас работаем — это, конечно же, обучение. Основное свойство ИИ — способность обучаться, выявлять закономерности и на основании этого принимать те или иные решения.
И здесь очень важно наличие верифицированных баз химических данных. В литературе сейчас много данных, причем очень часто эти данные не полные, не полностью приведены все экспериментальные условия, а иногда даже есть и ложные данные.
Вот одна из задач, которую предстоит решить, использование при обучении ИИ правильных данных. Это важно при любом обучении, не только в системах искусственного интеллекта.
Третья задача, к которой мы сейчас приступили — это использование ИИ для решения тех или иных практических химических задач. В частности, к нам поступают заказы на прогнозирование свойств полимерных материалов и другие. Интерес к этой тематике в стране растет. Наша главная задача как химиков-органиков — создать, назовем это так, «поваренную компьютерную книгу химика-органика».
К примеру, решил фармацевт, что некоторое соединение будет очень активно. Ему нужно иметь это соединение на руках, чтобы проверить. Целые институты, целые научные группы, высококвалифицированные специалисты придумывают, как синтезировать то или иное соединение. Задача нашей системы как раз в том, чтобы она выдала исследователю, каким путем можно пройти, какие подобрать условия синтеза.
Перспективные направления для развития
Сейчас мы пытаемся перейти к четвертому этапу — созданию робохимика. Дело в том, что сейчас уже существуют экспериментальные методы, проточные реакторы, которые позволяют не только нарисовать структуру, не только описать, как надо получать ее, а даже провести эту реакцию и оптимизировать ее.
С первого раза, как правило, ничего не получается, требуется регулировка условий, чтобы оптимизировать выход. И это тоже может делать ИИ в химии.
Начинается новый этап развития химии. ИИ может предоставлять оптимальные предложения по органическому синтезу.
Вместо того, чтобы лазить по базам данных, искать какие-то аналогии, можно применить систему искусственного интеллекта и сделать эту работу значительно быстрее для того, чтобы максимально сэкономить время ученого на творческую деятельность.
Что тормозит прогресс?
В свете этого я хотел бы обратиться к химикам. Все первоначальные химические данные должны вводиться в цифровом виде. В Европе это уже четкая тенденция, четкая политика. Бумажные носители приводят к тому, что мы теряем очень много информации. Для ИИ очень важны отрицательные результаты.
Очень часто эти отрицательные результаты оказываются похоронены в лабораторных папках и журналах, и никто их не видит. А для обучения ИИ эта информация не менее значима, чем положительные результаты.
У нас в стране много государственных организаций, поэтому нужна какая-то политическая воля, чтобы химики, экспериментаторы, начиная от студента, кончая ведущими преподавателями и учеными, перешли на «цифру». Вот это будет истинная цифровизация. То, что мы оцифровываем старые данные — это конечно хорошо, это помогает. Но надо смотреть вперед.
Кроме того, наличие таких вот исходных данных позволяет и работодателю, и руководителю любого уровня контролировать эти работы. Но главное, что они никогда не потеряются. А они имеют исключительную ценность. У нас в стране есть и возможности, и задачи для более широкой цифровизации не только в химии, но в химии тоже.
(теги пока скрыты для внешних читателей)