03-05
апреля
2025
года
VII Международный конгресс
«новые технологии в акушерстве, гинекологии, перинатологии и репродуктивной медицине»

Заполните, пожалуйста, Ваши контактные данные для регистрации участия в Международном конгрессе «Новые технологии в акушерстве, гинекологии, перинатологии и репродуктивной медицине»

Посмотреть важную информацию для участников

отправить

ГЕНЕТИЧЕСКИЕ ДЕТЕРМИНАНТЫ ТЕРАПЕВТИЧЕСКОГО ОТВЕТА ПРИ РАКЕ МОЛОЧНОЙ ЖЕЛЕЗЫ: РАЗРАБОТКА СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ НА ОСНОВЕ МАШИННОГО ОБУЧЕНИЯ

С. А. Шифон1, И. В. Евгенов1, А. А. Приходько4,
С. В. Сидоров2, А. А. Христин2, Л. Ф. Гуляева3

1 Новосибирский государственный университет
2 Городская клиническая больница № 1, Новосибирск
3 Научно-исследовательский институт
молекулярной биологии и биофизики, Новосибирск
4 ООО «ОнкоАналитика», Новосибирск

Аннотация. Разработана комплексная система поддержки принятия терапевтических решений для персонализированного лечения рака молочной железы, основанная на интеграции клинических данных и транскриптомного профилирования. На основе анализа данных 753 пациентов из проектов METABRIC и TCGA методом Deep Embedded Clustering идентифицированы молекулярно-генетические кластеры опухолей, ассоциированные с различными биологическими процессами. Выявленные генетические кластеры демонстрируют значимые корреляции с эффективностью определенных терапевтических комбинаций.

Abstract. We have developed a clinical decision support system for personalized breast cancer therapy based on the integration of clinical data and transcriptomic profiling. Analysis of 753 patients from METABRIC and TCGA projects using Deep Embedded Clustering revealed molecular genetic tumor clusters associated with distinct biological processes. These genetic clusters showed significant correlations with the effectiveness of specific therapeutic combinations.

Актуальность. Рак молочной железы (РМЖ) остается одним из наиболее распространенных онкологических заболеваний, характеризующимся значительной биологической гетерогенностью. Несмотря на активное внедрение алгоритмов машинного обучения для анализа клинических данных, существующие подходы не учитывают полный спектр молекулярно-биологических особенностей опухоли. Интеграция методов машинного обучения с анализом генетических кластеров открывает новые возможности в персонализированной медицине, позволяя идентифицировать молекулярные подтипы опухолей и их корреляцию с терапевтическим ответом, что подтверждается исследованиями в области других онкологических заболеваний [1].

Цель исследования — разработка комплексной системы поддержки принятия терапевтических решений для персонализированного лечения рака молочной железы, основанной на интеграции клинических характеристик, транскриптомных данных и предшествующего терапевтического опыта с применением методов машинного обучения.

Методология. Исследование базируется на анализе данных 753 пациентов из проектов METABRIC (n = 130, 17,27 %) и TCGA (n = 623, 82,73 %), существенно различающихся по клиническим характеристикам в силу разных подходов к формированию выборок.

Когорта METABRIC, включающая преимущественно пациентов с распространенными формами заболевания (33,08 % IV стадия, 17,69 % III стадия), характеризуется высокой частотой метастазирования (98,46 %) с типичным для рака молочной железы паттерном — преобладание костных метастазов (70,0 %) над печеночными (37,69 %) и легочными (19,23 %). Распространенность заболевания определила терапевтическую стратегию: 65,38 % пациентов получали две линии терапии при среднем количестве препаратов 2,19 в линии, что отражает необходимость смены схем лечения при прогрессировании.

Когорта TCGA, напротив, представлена преимущественно локализованными формами (59,55 % II стадия, 1,28 % IV стадия) с низкой частотой метастазирования (5,46 %), что обусловило преобладание монолинейной терапии (96,15 %) с более высоким средним количеством препаратов в линии (2,68), направленным на предотвращение рецидива заболевания.

Молекулярное профилирование выявило сходное распределение подтипов в обеих когортах с преобладанием Luminal A (52,31 % в METABRIC и 56,02 % в TCGA), что свидетельствует о биологической репрезентативности выборок, несмотря на клинические различия. TNM-классификация в METABRIC характеризуется высокой долей неопределенных статусов (58,46 % Tx, 59,23 % Nx), тогда как в TCGA преобладают четко определенные стадии (T2 60,51 %, N0 47,67 %, N1 32,26 %).

Сравнительный анализ терапевтических подходов выявил значимые различия между когортами (p < 0,001). Когорта METABRIC характеризовалась преобладанием двухлинейной терапии (65,38 %, n = 85) над однолинейной (33,08 %, n = 43), при среднем количестве препаратов 2,19 в линии и высокой частоте метастазирования (98,46 %, n = 128). Напротив, в когорте TCGA доминировала однолинейная терапия (96,15 %, n = 599) с более высоким средним количеством препаратов в линии (2,68) и низкой частотой метастазирования (5,46 %, n = 34). Наблюдаемые различия обусловлены как исходными характеристиками пациентов (преобладание IV стадии в METABRIC против II стадии в TCGA), так и особенностями протоколов лечения в различных медицинских системах, что требует учета при интерпретации результатов машинного обучения.

Генетическое профилирование осуществлялось на основе анализа мутаций, влияющих на белок-кодирующие последовательности (миссенс, нонсенс мутации), с установленными пороговыми значениями частоты мутантного аллеля > 5 % и количества прочтений > 5. Формирование матрицы «пациент — ген» производилось с последующей фильтрацией по частоте встречаемости мутаций (> 5 % в когорте). Кластеризация генетических данных реализована методом Deep Embedded Clustering с последующей функциональной аннотацией кластеров с использованием баз данных DAVID, KEGG, GSEA и инструмента enrichr.

Разработанная модель машинного обучения интегрирует анализ клинических параметров (возраст, пол, стадия заболевания, гистологический тип, статус рецепторов, терапевтический анамнез) и молекулярно-генетических характеристик (мутации, копийность генов, транскриптомные данные). Предобработка данных включала импутацию пропущенных значений, кодирование категориальных переменных и нормализацию количественных показателей. Модель реализована посредством двухкомпонентного подхода, где клинический компонент основан на градиентном бустинге решающих деревьев, а генетический компонент реализован через нейронную сеть. Финальный прогноз формируется метамоделью, объединяющей результаты обоих компонентов.

Результаты. Применение метода Deep Embedded Clustering к транскриптомным данным позволило идентифицировать четко различимые мутационные подтипы опухолей молочной железы, каждый из которых характеризуется специфическим набором генетических альтераций. Функциональный анализ выявленных кластеров продемонстрировал их ассоциацию с различными биологическими процессами: регуляцией клеточного цикла, сигнальными путями пролиферации, ангиогенезом и механизмами репарации ДНК. Наблюдаемая гетерогенность мутационных профилей между кластерами подтверждает гипотезу о существовании молекулярно-генетических подгрупп внутри стандартных молекулярных подтипов РМЖ.

Анализ корреляций между выделенными генетическими кластерами и эффективностью различных терапевтических подходов выявил значимые ассоциации. Для каждого кластера определены оптимальные комбинации препаратов, демонстрирующие наибольшую эффективность.

Разработанная модель машинного обучения демонстрирует различные алгоритмы работы для первичного и метастатического РМЖ. В случае первичного РМЖ модель первоначально определяет молекулярный подтип опухоли и формирует перечень терапевтических опций согласно действующим клиническим рекомендациям. Последующая генетическая кластеризация в рамках установленного подтипа позволяет идентифицировать оптимальную терапевтическую комбинацию среди рекомендованных схем лечения.

Для метастатического РМЖ, характеризующегося множественными линиями терапии и более широким спектром терапевтических опций, генетическая кластеризация применяется как первичный критерий выбора терапии. Отсутствие строгой привязки к молекулярному подтипу при выборе схем лечения метастатического РМЖ позволяет использовать принадлежность к генетическому кластеру как основной предиктор эффективности различных терапевтических комбинаций.

Интеграция клинических параметров с данными мутационного профилирования в единой модели машинного обучения обеспечивает повышенную точность прогнозирования терапевтического ответа. Полученные результаты формируют базис для разработки персонализированных терапевтических подходов в клинической практике.

Выводы. В современной медицинской практике методы машинного обучения приобретают значимость благодаря способности выявлять сложные нелинейные закономерности в многомерных клинических данных. Разработанная система объединяет методы машинного обучения с комплексным анализом генетического профиля опухоли, что отличает ее от традиционных подходов, основанных на анализе отдельных клинически значимых мутаций.

Предложенный подход использует транскриптомные данные не для выявления единичных мутаций в известных генах, а для формирования целостного мутационного профиля опухоли посредством кластерного анализа [2]. Данная стратегия обеспечивает более детальную персонификацию по сравнению со стандартным молекулярно-генетическим типированием при выборе терапевтических опций.

Идентификация ключевых генов, определяющих принадлежность к конкретному кластеру, открывает перспективы для разработки диагностической тест-системы на основе таргетного секвенирования панели генов-маркеров. Такой подход позволит определять принадлежность пациента к генетическому кластеру и оптимизировать выбор терапевтической стратегии.

Интеграция клинических, терапевтических и генетических данных в модели машинного обучения формирует инструмент поддержки принятия клинических решений, направленный на повышение эффективности персонализированного подхода к лечению РМЖ.

 

Список литературы

1. Chapuy B., Stewart C., Dunford A. J. et al. Molecular subtypes of diffuse large B-cell lymphoma are associated with distinct pathogenic mechanisms and outcomes // Nat. Med. 2018. Vol. 24 (5). P. 679–690.

2. Dyikanov D., Zaitsev A., Vasileva T. et al. Comprehensive peripheral blood immunoprofiling reveals five immunotypes with immunotherapy response characteristics in patients with cancer // Cancer Cell. 2024. Vol. 42 (5). P. 759–779.