Insilico Medicine научит нейросеть транскриптомному анализу
Основным инструментом современных биоинженерных исследований являются алгоритмы для анализа транскриптомных профилей. С помощью программ типа GSEA или SPIA ученые могут сравнивать экспрессию отдельных генов в биологических образцах и искать закономерности, которые лежат в основе изучаемых молекулярных процессов. Однако эти методы не рассчитаны на оценку динамических взаимодействий между генетическими ансамблями - внутриклеточными сигнальными путями. Предполагается, что изучение этих путей может дать более точные профили транскриптомов.
В новой работе компания Insilico Medicine в сотрудничестве с группой ученых из Университета Джона Хопкинса и других учреждений представила метод, который позволяет связывать не экспрессию генов, а работу сигнальных путей. Он получил название iPANDA (Pathway Activation Network Decomposition Analysis, декомпозиционный анализ сетевой активации сигнальных путей). Входными данными для алгоритма служат показатели реальной и среднестатистической экспрессии генов. Затем программа оценивает их коэкспрессию, группирует и присваивает каждому пути определенное количество очков активации.
Система тестировалась на наборах генов, полученных от пациентов с раком молочной железы. Этот вид опухолей является наиболее сложным для терапевтического прогнозирования из-за высокого уровня гетерогенности (разнообразия клеток). Задачей авторов было оценить эффективность предстоящей терапии с помощью паклитаксела, а также найти пути-маркеры, связанные с активностью рецептора эпидермального фактора роста человека 2 типа (HER2). Избыток этого белка на поверхности опухолевых клеток определяет развитие новообразования и является главной мишенью такого прогноза.
Авторы составили профиль из 30 самых чувствительных к паклитакселу сигнальных путей для пациентов с положительным и отрицательным HER2-статусом. Так, в перечень вошли известные ранее пути ERBB, PTEN, BRCA1 и другие. При этом программа указала значимые различия в сигнальных путях в зависимости от типа заболевания несмотря на многочисленные пересечения. Это соответствует данным о резистентности некоторых типов рака к препарату. Сравнение iPANDA с другими методами (Affymetrix, Agilent) показало, что новый алгоритм значительно точнее в оценке экспрессии (коэффициент корреляции r = 0,89).
По словам ученых, применение iPANDA может прояснить генетическую основу различных заболеваний и разработать против них более эффективные препараты. Кроме того, он позволит сделать медицину более персонализированной. Следующим шагом станет автоматизация метода: сейчас он работает только в сочетании с другими программами для сбора данных. Для этого исследователи уже обучают анализу транскриптомных профилей искусственную нейросеть.