Машинное обучение создает реалистичные геномы воображаемых людей
Машинное обучение используется для майнинга существующих биобанков и создания фрагментов геномов человека, которые не принадлежат реальным людям. При этом у них характеристики настоящих. Результаты исследования публикует журнал PLOS Genetics.
Благодаря новым алгоритмам и достижениям в области компьютерных технологий машины теперь могут изучать сложные модели и даже генерировать высококачественные синтетические данные, такие как фотореалистичные изображения или даже резюме воображаемых людей. В исследовании, недавно опубликованном в международном журнале PLOS Genetics, машинное обучение используется для майнинга существующих биобанков и создания фрагментов геномов человека, которые не принадлежат реальным людям, но имеют характеристики настоящих геномов.
"Существующие геномные базы данных - это бесценный ресурс для биомедицинских исследований. Однако они либо недоступны для общественности, либо защищены долгими и изнурительными процедурами подачи заявок из-за серьезных этических проблем. Это создает серьезный научный барьер для исследователей. Искусственные геномы помогут нам преодолеть эту проблему", - объясняет Бурак Ельмен, первый автор исследования и младший научный сотрудник современной популяционной генетики Тартуского университета.
Многодисциплинарная команда провела несколько анализов, чтобы оценить качество сгенерированных геномов по сравнению с реальными. "Удивительно, но эти геномы, возникающие из случайного шума, имитируют сложности, которые мы можем наблюдать в реальных человеческих популяциях. По большинству свойств они неотличимы от других геномов из биобанка, который мы использовали для обучения нашего алгоритма, за исключением одной детали: они действительно не принадлежат к какому-либо донору", - подчеркивает д-р Лука Пагани, один из ведущих авторов исследования и сотрудник Mobilitas Pluss.