Дата публикации: 09.06.2023
Языковые нейромодели
на службе фармацевтики.
Исследования ИИ для фармацевтики – давно не новость, но это ‒ настоящий прорыв. Источник.
У научной фармацевтики есть огромные «библиотеки» лекарственных соединений, многие из которых ‒ потенциально ‒ могут оказаться исключительно полезными в лечении онкологии, сердечных и других заболеваний. В идеале, конечно, нужно бы экспериментально проверить каждое из этих соединений на всех возможных недугах, но проведение такого исследования займёт слишком много времени. Конечно, мы можем констатировать, что в последние годы учёные-вычислители добились больших успехов, путём обучения поискам различных алгоритмов глубокого обучения.
Тем не менее, многие из этих новых методов всё также требуют чрезвычайно много времени, поскольку им приходится просчитывать всё-таки трёхмерные структуры, ведь аминокислотные последовательности каждого целевого белка ‒ это объёмные фигуры. Так что целевой процесс построения прогнозов (с какими именно лекарственными молекулами каждый белок будет взаимодействовать) может быть выполнен только после расчётов самого устройства белка.
Это была затяжная проблема, и вот теперь учёные из MIT и Университета Тафтса разработали альтернативный подход этим вычислениям: они взяли за основу большую языковую модель. Этому виду нейромоделей ‒ таких, как ChatGPT ‒ вполне по плечу анализ просто огромных объёмов информации. На примере текста они способны определить, какие слова чаще всего встречаются вместе, что очень помогает и в случае с аминокислотами. На базе этой возможности учёные создали свою модель, названную ConPLex, которая может сопоставлять целевые белки с потенциальными молекулами лекарств без необходимости выполнения этапа вычисления структуры молекул, требующего больших вычислительных ресурсов.
Используя этот метод, исследователи могут протестировать более 100 миллионов соединений за один день — намного больше, чем любая существующая модель, использующая обычный пошаговый подход.
«Эта работа направлена на удовлетворение потребности в эффективном и точном скрининге потенциальных лекарств in silico [«в кремнии», то есть – в компьютерной симуляции], а масштабируемость модели позволяет проводить крупномасштабные скрининги для оценки нецелевых эффектов, перепрофилирования лекарств и определения влияния мутаций на связывание лекарств» ‒ говорит Бонни Бергер, профессор математики Саймонса, руководитель группы вычислений и биологии в Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) и один из старших авторов данного исследования.
Альтернативный подход команды Массачусетского технологического института был основан на модели белка, которую она впервые разработала в 2019 году. Благодаря этому, работая с базой данных из более чем 20 000 белков, языковая модель может закодировать информацию не только о каждой аминокислотной последовательности, но и о связях между этой последовательностью и структурой.
Хотя в этом исследовании учёные сосредоточились в основном на тестировании низкомолекулярных препаратов, сейчас они работают над применением этого подхода к другим типам лекарств ‒ таким, например, как терапевтические антитела. Этот тип моделирования также может оказаться полезным для определения токсичности потенциальных лекарственных соединений.
«Одна из причин, по которой разработка лекарств стоит так дорого, заключается в том, что они имеют высокий процент неудач. Если мы сможем снизить количество отказов, заявив заранее, что это лекарство вряд ли сработает, это может значительно снизить стоимость разработки лекарства», ‒ говорит Сингх.
По материалам АРМК.