Ученые улучшат процесс поиска кандидатов на лекарственные препараты
Рекомендации по эффективному использованию методов многозадачного обучения для улучшения процесса создания новых лекарств и поиска новых кандидатов на лекарственные препараты разработала команда ученых Сколковского института науки и технологий, Венского университета и Университета «Сириус» (Сочи), 28 марта сообщает пресс-служба Сколтеха.
Результаты исследования предложенных методов ученые представили в статье «Улучшение многозадачного обучения за счет обогащения данных: применение для поиска лекарств», опубликованной в Journal of Computer-Aided Molecular Design.
Одновременное изучение физики и математики, двух связанных курсов, позволяет студентам лучше понимать эти предметы. Подобное происходит при изучении нового языка, которое значительно легче дается тем, кто уже владеет родственным языком.
Аналогичный процесс происходит в машинном обучении. Если нейронная сеть «изучает» одновременно несколько «предметов», то «понимает» их лучше. Команда исследователей поставила перед собой задачу помочь нейронной сети одновременно изучить и спрогнозировать свойства молекул в отношении нескольких биологических мишеней.
Для анализа ученые использовали три датасета (структурированные массивы данных), один из которых содержал информацию о противовирусной активности молекул, а два других информацию о воздействии молекул на различные белки в нашем организме, отличаясь при этом полнотой информации по каждому из белков или вирусов.
Исследование модели показало, что в случае добавления дополнительных данных в датасет прогнозирование значительно улучшается. При этом результат тем лучше, чем информативнее исходный датасет.
Обобщив полученные результаты, ученые разработали набор рекомендаций использования технологии «обогащения» данных для повышения качества и стабильности прогноза, а также описали способы объективной оценки такого улучшения.
Ведущий автор проекта, выпускница аспирантуры Сколтеха Екатерина Соснина пояснила выбор направления исследования:
«Многозадачное обучение широко применяется во многих областях науки. Не удивительно, что оно стало всё чаще применяться для создания новых лекарственных средств. Однако возможности такого подхода до конца не изучены, что оставляет перед нами множество нерешенных задач. Мы вдохновились возможностью применения многозадачного обучения для поиска кандидатов в лекарственные средства и провели работу по поиску путей улучшения применения данного подхода».
Она отметила, что применение разработанных командой рекомендаций повысит точность предсказания моделей и ускорит поиск новых потенциальных лекарственных средств.