Большие данные в медицине способны ускорить время разработки лекарств и перспективность поиска новых молекул, повысить качество профилактики и сделать лечение персонализированным. Но пока эти возможности остаются лишь частично реализованными. Причина — системные барьеры, с которыми сталкиваются и регуляторы, и разработчики: от несовместимости ИТ-платформ до вопросов безопасности персональной информации.
Большие данные малыми дозами
К 2030 году в системе здравоохранения каждого региона России, согласно цели Национальной стратегии развития искусственного интеллекта, должно действовать не менее 10 решений на базе технологий ИИ. Полноценная цифровая трансформация здравоохранения невозможна без эффективного использования больших медицинских данных. Сегодня именно они становятся «строительным материалом цифровизации», обеспечивая развитие самых разных направлений отрасли — от искусственного интеллекта и клинической аналитики до оценки технологий здравоохранения и разработки лекарств.
Однако реальность такова, что доступ к этим данным остается крайне ограниченным. Накопленные массивы трудно объединить и использовать в полном масштабе. Инфраструктура разрознена, а ключевые блоки экосистемы не синхронизированы между собой. Решения проблемы искали на форуме «Что происходит на фармрынке?».
Как рассказала старший юрист практики фармацевтики и здравоохранения VERBA Legal Карина Колобова, сегодня в России медицинские данные распределены по множеству различных платформ, которые порой не пересекаются. Так, данные из медицинских информационных систем в клиниках, где формируется первоисточник информации, передают в региональные и интеграционные платформы. А затем оттуда они могут поступать в Единую государственную информационную систему в сфере здравоохранения (ЕГИСЗ).
Однако пока что эта конструкция работает преимущественно в «восходящем» режиме: данные уходят «снизу вверх» — из лечебных учреждений в государственную систему. Но горизонтального обмена практически нет, поэтому полный профиль пациента собрать невозможно. Разница форматов ввода, несовместимость систем, отсутствие единых правил обработки — все это делает массивы данных труднодоступными для анализа.
Ситуацию осложняют и правовые ограничения. Медицинская информация относится к специальной категории персональных данных, а значит, ее обработка требует индивидуального письменного согласия, после чего данные обезличиваются. Это сделано для безопасности самих пациентов. Но зачастую именно это и блокирует использование уже накопленных данных.
«Правовой статус обезличенных данных в России недостаточно определен. Даже после обезличивания они формально остаются персональными, что сужает возможности их использования в исследовательских целях», — отмечает Карина Колобова.
Границы для информации
На наднациональном уровне также существуют барьеры в передаче данных. Как отметил в своем выступлении участник рабочей группы по лекарственным средствам при Евразийской экономической комиссии доцент кафедры биохимии медицинского института РУДН Александр Солодовников, в теории применение больших данных в рамках Союза целесообразно, но на практике почти невозможно.
«Дело в том, что, согласно законодательству, данные должны обрабатываться строго внутри национальных юрисдикций, трансграничная передача персональной информации запрещена даже между государствами — участниками Союза», — подчеркнул он.
При этом единых требований к обезличиванию данных до сих пор не существует — ни в России, ни в большинстве других стран ЕАЭС. В результате становится невозможным создать общий массив данных, который мог бы использоваться в исследовательских и регуляторных целях на уровне всего Союза.
Решением проблемы, по мнению эксперта, могла бы стать «федеративная модель обработки информации». Она бы позволила совместно использовать данные без их прямого обмена. То есть данные хранились бы у стран-владельцев, а для анализа к ним бы направлялся верифицированный код. Таким образом можно было бы соблюсти требование национального законодательства о персональных данных. Однако эта модель потребовала бы сложной координации участников и высоких технических требований.
Но даже в случае устранения юридических вопросов актуальной остается проблема проверки их качества. По оценкам экспертов, более 80% медицинской информации в системах здравоохранения ЕАЭС остается неструктурированной: тексты, изображения, комментарии врачей. Эти массивы сложно стандартизировать и анализировать автоматически.
Несовместимость форматов приводит к искаженным результатам. Так, менее 15% электронных медицинских карт сегодня пригодны для обучения ИИ-моделей из-за фрагментарности и неполноты сведений. Поэтому для принятия регуляторных решений требуется не только доступ к данным, но и их воспроизводимость, понятность, прозрачность обработки, подчеркнул Солодовников.
Единый оператор
В 2024 году во всем мире в разработке находилось более 30 препаратов, созданных или оптимизированных с применением ИИ. И если раньше на формирование научной гипотезы могли уходить десятилетия, то теперь — порядка 18 месяцев, отметил в ходе конференции исполнительный директор ассоциации «Инфарма» Вадим Кукава.
«По имеющимся оценкам, в России рынок ИИ в медицине сейчас составляет около 0,6 млрд рублей. Прогноз на 2030 год — порядка 40 млрд рублей. У нас уже реализуется ряд пилотных проектов: систематизация данных реальной клинической практики, контроль качества, подсказки для врачей и провизоров, системы поддержки клинических решений в онкологии, кардиологии и других областях, анализ медицинских изображений», — рассказал он.
Однако, чтобы масштабировать успех, нужно иметь доступ к большим данным. По словам экспертов, сегодня главным вызовом в развитии ИИ-решений для здравоохранения становится именно невозможность данные объединить, проверить и применять.
«Использование обезличенных медицинских данных — стратегический ресурс развития отрасли. На их основе можно точнее планировать исследования и производство, обеспечивая пациентам своевременный доступ к терапии. Ассоциация ведет диалог с государством о формировании прозрачных правил доступа к данным для целей стратегического планирования», — подчеркнул Вадим Кукава.
Чтобы переломить ситуацию, фарме нужен новый отраслевой подход, предусматривающий единые стандарты, упрощение правовых процедур и создание инфраструктуры вторичного доступа. Ключевым элементом такой системы может стать единый оператор больших медицинских данных — структура, которая обеспечит стандартизацию и контроль качества данных, безопасный интеграционный обмен между всеми участниками и доступ исследователей и разработчиков к обезличенным массивам, считает Карина Колобова.
По сути, речь идет о создании полноценного «озера данных» здравоохранения, где информация из всех источников аккумулируется и становится доступной для обработки на благо отрасли и пациентов. «Важно не только собирать данные от различных источников, но и чтобы этот единый оператор мог с этими данными работать», — подчеркивает она.
28 октября ассоциация «Инфарма» обратилась в Минпромторг с предложением по дополнению Стратегии развития фармпромышленности до 2030 года. В частности, представители отрасли попросили власти создать механизм предоставления обезличенных данных из ЕГИСЗ для научно-исследовательских целей.
