Пандемия вывела на новый уровень использование интеллектуальных алгоритмов в фармотрасли: индустрии понадобилось радикально ускорить разработку новых препаратов. Использование искусственного интеллекта и накопленные данные в будущем станут важнейшими элементами в борьбе с редкими заболеваниями, в изучении новых молекул и поиске пациентов. 

Автор: Ирина Ефименко, основатель и генеральный директор Semantic Hub

История вопроса

Внедрение алгоритмов интеллектуального анализа больших данных в сфере фармацевтики и медицины началось до появления концепции big data — именно для медицины были созданы первые экспертные системы, которые сейчас чаще называют системами поддержки принятия решений, например MYCIN, разработку которой Стэнфордский университет начал в 1970-е годы. Поскольку тема искусственного интеллекта (ИИ) сейчас на слуху, то возникает впечатление, будто все достижения в этой области — дело последних лет, а сам ИИ равен нейросетям. Однако теоретические основы современных решений были почти полностью заложены в 1960–1980-е годы. 

Тем не менее появление больших данных и рост вычислительных мощностей позволили вывести технологии ИИ и алгоритмы поддержки принятия решений на совершенно новый уровень. Теперь стало чем кормить алгоритмы и модели, и некоторые решения впервые удалось перевести в практическую плоскость. 

Аналогичную роль сыграла и пандемия COVID-19. Она стала катализатором для развития ИИ в медицине, так как по всему миру стали собирать огромные объёмы медицинских данных, которые могут стать основой для будущих исследований.

Разработка препаратов

Инвестиции в разработку и внедрение инновационного препарата могут достигать 3 млрд долларов, а сам процесс занимать до 14 лет. Значительная часть (от 45 % и выше) финансовых и временных затрат на вывод новых лекарств связана с ранними этапами разработки, в том числе доклиническими исследованиями. При этом далеко не все препараты в итоге выходят на рынок. В последние годы фармкомпании внедряют инструменты, которые могут ускорить доклинические исследования и сделать разработку новой терапии более предсказуемой. 

По некоторым оценкам, в ближайшие несколько лет использование ИИ может привести к снижению на десятки миллиардов долларов затрат на поиск и разработку новых молекул. Именно поэтому стадия поиска и разработки молекулы-кандидата (Drug Discovery, DD) — одна из тех, где ИИ применяется наиболее активно. Рынок применения интеллектуальных технологий для разработки молекул растёт очень быстро. По данным компании Deloitte, со 160 млн долларов в 2018 году он вырастет к 2025-му до 3 млрд долларов (среднегодовой темп роста — 52 %). 

Сейчас основная роль ИИ заключается в прогнозировании взаимодействия между молекулами: как будущее лекарство станет работать с мишенью в организме человека. Также искусственный интеллект может использоваться для изучения механизмов самого заболевания. С помощью ИИ реализуется поиск новых биомаркеров, оптимизация молекул-кандидатов, ведь в среднем из 10 тысяч соединений показывает достаточный уровень эффективности и безопасности и успешно доходит до рынка только одно. 

ИИ помогает и в процессе перепрофилирования лекарств для других показаний. Кроме того, разработчики решений в области DD создают огромные базы по существующей терапии, мишеням и другим данным, чтобы представители биотеха могли использовать эту информацию для быстрого поиска ответов на сложные исследовательские вопросы (один из примеров — компания geneXplain, основанная командой из России). Также разработчики берут на себя обработку всевозможных так называемых сырых данных, которые компании могут использовать для своих нужд. 

Ещё один нестандартный пример решения, ориентированного на ранние стадии создания терапии, — игра Foldit. По сути, это краудсорсинговая платформа, где добровольцы могут внести вклад в исследования, экспериментируя со структурами белков. Недавно разработчики игры выпустили новый «пазл» для коронавируса. К теме Drug Discovery относится и автоматизированный анализ больших объёмов научных публикаций. Он применим также для чуть более поздних стадий, например для технологического скаутинга или аудита и оценки при принятии решения об инвестиции в ту или иную молекулу крупной фармкомпанией. 

Сейчас в мире проблематикой ИИ в сфере Drug Discovery занимаются по меньшей мере 200 компаний: от стартапов до глобальных корпораций уровня Microsoft. Десятки компаний бигфармы внедряют наиболее успешные решения в этой сфере. 

Разработки имеют теперь не только теоретическое, но и прикладное значение и трансформируют индустрию. В 2019 году компания Exscientia, в создании которой участвовали в том числе учёные из Оксфордского университета, объявила о партнёрстве с Roche, а также начала сотрудничество с компанией Bayer. Недавно о создании новой платформы, протягивающей мост от этапа DD к оптимизации клинических исследований, заявила Valo Health. Гонконгская компания с российскими корнями Insilico Medicine объявила об открытии новой мишени и потенциального кандидата (новой терапии) для идиопатического лёгочного фиброза с возможностью выхода на этап клинических исследований в рекордно короткие сроки.

Другой интересный тренд — использование мини-устройств, так называемых organ-on-a-chip. Это 3D-клеточные модели, в которых можно воссоздать биологию человека in vitro. Они воспроизводят микроархитектуру и функции живых человеческих органов: лёгкие, кишечник, костный мозг и др. Это потенциальная альтернатива традиционным испытаниям на животных. Изобрела эту технологию компания Emulate родом из Института Висса при Гарвардском университете. В 2018 году Emulate вступила в партнёрство с Roche и Takeda. Также она подписала соглашение о совместных исследованиях и разработках c американским агентством FDA.

Клинические исследования

Следующей областью, которую в ближайшее время трансформируют интеллектуальные технологии, станут клинические исследования. Это крайне дорогостоящий, долгий и высокорисковый процесс: некоторые клинические исследования не заканчиваются никогда. В 2018 году в реестре клинических испытаний, находящемся в ведении Национальной медицинской библиотеки США, ClinicalTrials.gov, было зарегистрировано 30 тысяч клинических исследований, а с 2000 года их накопилось 300 тысяч. Однако результаты в 2018 году были опубликованы лишь для 5 тысяч испытаний (менее 35 тысяч с 2000-го). 

Цифровая трансформация области клинических исследований идёт многие годы, например через применение решений Electronic Data Capture. Что касается сферы использования ИИ, то здесь на передний план часто выходят технологии, относящиеся к анализу естественного языка (Natural language processing, NLP, или Natural language understanding, NLU), а также данные «реальной клинической практики» (Real World Data, RWD). 

В последние несколько лет наблюдается рост интереса ведущих фармкомпаний к NLP. Одно из самых заметных событий в этой сфере — приобретение корпорацией Roche компании Flatiron, анализирующей RWD в области онкологии с применением в том числе технологий NLP. В клинических исследованиях NLP и RWD используются для подбора пациентов, а также для генерации «данных сравнения» вместо данных по группе пациентов на плацебо.

По некоторым оценкам, к 2025 году в мире будет накоплено до 175 зеттабайт* данных в области здравоохранения. Эти массивы могут включать важные для медицины сведения: геномные и другие омиксные данные, записи с носимых медицинских устройств. Часто это будет неструктурированная текстовая информация — один из самых содержательных, но одновременно и сложных для обработки источников данных. Речь о миллионах научных статей, патентах, свидетельствах о собственном опыте диагностики и лечения пациентов и их близких, и эти данные имеют особую ценность в случае тяжёлых и редких заболеваний. 

 

Недавно подобные свидетельства были опубликованы для миодистрофии Дюшенна. RWD и формируемые на основе их анализа «клинические доказательства» (Real World Evidence, RWE) — это отдельная обширная тема. Она также трансформирует рынок. По данным Deloitte, уже в 2018 году 60 % биофармацевтических компаний использовали технологии машинного обучения для анализа RWD, остальные планировали внедрить соответствующие решения в ближайшие годы. 

Особенно интересный сегмент — поиск пациентов с орфанными, в том числе недиагностированными заболеваниями, а также пациентов для исследований со сложными критериями включения и исключения. Такой поиск реализует компания Semantic Hub с помощью технологий семантического анализа (понимания текстов по смыслу) «голоса пациента», Patient Voice. Речь о больших данных класса Web 2.0, то есть об анонимизированных историях пациентов из открытых источников: соцсетей, форумов или порталов типа «врач — пациент». Анализ «голоса пациента» применим и для формирования успешной стратегии запуска инновационной, часто первой в мире терапии, и для более ранних этапов, включая не только набор участников клинического исследования, но и определение его формата.

В целом «голос пациента» крайне важен с точки зрения этапов жизненного цикла препарата. Не случайно такой тип данных всё чаще признаётся в мире одним из видов RWD. Об этом говорится в монографии «Исследования реальной клинической практики» под общей редакцией А. С. Колбина, которая вышла недавно в России. Ранее ключевым типом RWD считались электронные медицинские карты, однако их качество не всегда высокое. Они, несомненно, полезный источник данных по отдельным направлениям, например по результатам терапии, но некоторые сведения, включая особенности восприятия терапии пациентами, всевозможные аспекты качества жизни и бремени заболевания, в электронных картах не фиксируются, и получить их можно только из уст пациентов или их близких. 

Контуры будущего

Осознание особой роли пациентов, а также значимости RWD способствует повышенному вниманию фармкомпаний к основанным на ИИ решениям сегмента B2C (то есть ориентированным на конечного пользователя, а в случае тяжелых заболеваний — также на его близких). Ведь в фокусе тех, кто заботится о создании прорывной терапии, — не только «путь препарата», но и «путь пациента». Не случайно ведущие фармкомпании запускают в этой области собственные акселераторы: AstraZeneca, Sanofi, Novartis, Janssen, Bayer и другие. В России ряд таких программ запущен совместно с инновационным центром «Сколково». 

Часто решения B2C ориентированы на поддержку принятия решений в области диагностики. Особый вид RWD генерируют персональные медицинские устройства — с учётом развития гаджетов этот процесс становится всё более стремительным. Любые решения, применяемые в клиниках, включая лабораторные исследования, функциональную диагностику и так далее, в результате цифровизации тоже становятся источником больших мультимодальных медицинских данных. Это одновременно вызов для разработчиков ИИ и новые возможности для исследовательской работы в области медицины и фармацевтики.

Пандемия COVID-19 привела к стремительному росту объёмов некоторых типов данных. Сведения о качестве жизни, коморбидности и некоторые другие аспекты опыта пациентов могут стать основой для определения «незакрытых потребностей» и последующего решения о создании новой терапии для определённого сегмента пациентов. Опыт пациентов в части диагностики и лечения — основной источник важных знаний для формирования ценностного предложения нового лекарства и создания кампаний по повышению осведомлённости. Наконец, общение пациентов друг с другом и врачами онлайн может быть использовано для выявления сигналов в области фармакобезопасности, что, в свою очередь, генерирует ценные открытия именно для R&D и приводит к ранним этапам разработки препаратов.

В конце концов, именно трансформация роли пациента и пациентоцентричность — те ключевые общемировые тренды, которые способны вывести фармацевтику и здравоохранение в целом на фундаментально новый уровень.


* Единица измерения количества информации, 1 ЗБайт = 1021 байт.