Ученые российского Института искусственного интеллекта AIRI и немецкого Constructor University представили DiMA — инновационную ИИ-модель для генерации искусственных белков, необходимых для разработки новых лекарственных препаратов (ЛП). Разработка в 100 раз компактнее аналогов, при этом превосходит их в эффективности, сообщает пресс-служба AIRI.
«DiMA способна напрямую генерировать белковые последовательности, которые никогда не встречались в природе, но точно соответствуют заданным исследователем критериям, например определенной трехмерной укладке или функциональным свойствам», — отметил ведущий научный сотрудник группы дизайна белков Центра ИИ-разработки новых лекарственных препаратов AIRI Павел Страшнов.
Для создания искусственных белков уже применяли различные типы языковых моделей. Авторегрессионные работают подобно ChatGPT — генерируют белковые последовательности побуквенно. Дискретные — создают всю последовательность, «слово», сразу. Однако оба подхода требуют большого размера модели и огромного количества данных для обучения.
В DiMA использован принципиально новый подход, основанный на так называемой непрерывной гауссовой диффузии, которая активно используется в нейросетях для генерации изображений, постепенно удаляющих «шум» с создаваемой картинки. Сначала модель обучили генерировать разнообразные белки, которые всегда получаются биологически осмысленными и при этом не повторяют дословно природные. Затем «сузили» задание, дообучив генерировать белки с определенными критериями. «Такой подход позволяет не только расширять представления о теоретически возможных белковых конфигурациях, но и решать конкретные прикладные задачи в биотехнологиях и медицине», — отмечается в сообщении.
К 2030 году мировой рынок ИИ в здравоохранении вырастет в 6,5 раза — с $22 млрд до $130–160 млрд. Аналогичная динамика ожидается и в России: с 12 млрд рублей в 2024-м до 78 млрд рублей к 2030-му. О том, как новые технологии трансформируют работу ученых, врачей и опыт пациентов, читайте в материале GxP News.
