Суперкомпьютер узнает, выживем ли мы на Марсе: устройство изучает мутации ДНК прямо на МКС
12 августа суперкомпьютер Spaceborne Computer-2 (SC2) справился с первым набором рабочих нагрузок при секвенировании генов на борту Международной космической станции.
Американская корпорация запустила космический эксперимент совместно с Hewlett Packard Enterprise (HPE), отправив суперкомпьютер на МКС в феврале 2021 года. Разработчики решили проверить, насколько хорошо SC2 справится со сложными научными исследованиями на периферии и в облаке. Для этого суперкомпьютер подключили к секвенсору генов на борту МКС, который регулярно анализирует образцы крови астронавтов. Эксперимент покажет, как ДНК людей меняется в космосе, и не погубит ли их путешествие на Марс или на другие планеты.
В ходе секвенирования аппарат выдает около 200 ГБ данных об одном человеке, тогда как Spaceborne выделили всего два часа в неделю для передачи информации на Землю, да еще и со скоростью 250 Кбайт/с. Таким образом отправка лишь одного набора займет два года - это очень долго, учитывая постоянное обновление клинической базы данных, с которыми сравниваются полученные гены.
Суперкомпьютер SC2
"Это как вернуться в 90-е, когда в ходу были модемы", - цитирует Data Centre Dynamics Дэвида Вайнштейна, главного менеджера по разработке программного обеспечения подразделения Microsoft Azure Space.
Разработчики нашли выход из ситуации, заставив суперкомпьютер сравнивать полученные последовательности с эталонными ДНК для поиска различных отклонений и мутаций, которые могут возникать под воздействием космической радиации. Такие данные выделяются из общего массива, и лишь они отправляются на наземную станцию HPE, что значительно экономит время и позволяет вложиться в час. Во время первого этапа SC2 успешно обработал 120 МБ.
Дальше за дело принимается облачная система Azure от Microsoft Genomics, которая сопоставляет короткие последовательностей основных пар генов (порядка 70 штук) из загруженных данных с полным геномом человека. Такая процедура позволяет обнаруживать любую мутацию и ее тип (удаление, добавление, репликация или замена). Полученные результаты сверяются также с базой Национального института здравоохранения США (NIH), чтобы определить, как конкретные отклонения могут повлиять на здоровье.
Схема эксперимента Microfoft и НРЕ
Эксперимент доказал, что совместную работу на периферии и в облаке можно использовать для поддержки важных процессов на МКС, которые, в противном, случае были бы невозможны из-за ограничений вычислительных ресурсов и пропускной способности. Предварительная обработка данных секвенатора генов и поиск генных мутаций сокращает объем данных примерно до 1,5 ГБ.
Microsoft ожидает, что запланированные тесты еще больше увеличат это соотношение. Представитель HPE сообщил, что компания провела 4 подобных эксперимента, работает над 4-мя другими и планирует провести еще 29.
Все основные программные компоненты, которые сделали возможным проведение эксперимента, (как на базе ISS, так и на базе Azure) были написаны на Python и bash с использованием Visual Studio Code, GitHub и библиотек Python для функций Azure и хранилища BLOB-объектов Azure.
Космический суперкомпьютер SC2 состоит из двух 1U-узлов в корпусе с мощными системами питания и охлаждения. Первый узел представлен сервером HPE Edgeline EL4000 с одним CPU и одним ИИ-ускорителем, 64 Гбайт RAM и 4-мя SSD-дисками по 240 ГБ. Второй узел - сервер HPE ProLiant DL360 Gen10 с 2-мя CPU, 192 Гбайт RAM и десятью SSD по 240 ГБ. Производительность системы относительно невелика (чуть больше 2 Тфлопс), но в космос столь мощный компьютер отправили впервые.