Western Digital и Microsoft будут развивать системы хранения данных на ДНК
Человечество с каждым днем генерирует все больше данных, и немало из них хочет сохранить надолго. К 2030 году, прогнозируют в Western Digital, половина новых носителей будет предназначена для архивов. Громадные деньги будут тратиться на сохранение данных, тогда как плотность носителей будет увеличиваться очень медленно. Переломить тенденцию смогут только новые методы записи, например, на ДНК.
Вчера компании Western Digital, Microsoft, Twist Bioscience и Illumina объявили о создании Альянса по хранению данных на ДНК (DNA Data Storage Alliance). Организация ставит перед собой цель разработать "дорожную карту" создания экосистемы для записи информации с помощью ДНК, включая соответствующие устройства для записи и считывания. Также альянс будет продвигать и популяризировать идею хранения информации на ДНК, как и заниматься обучением.
В составе альянса компания Twist BioScience будет предоставлять фрагменты ДНК и технологии записи данных на них. Компания Illumina специализируется на секвенировании ДНК (считывании). Компания Microsoft имеет значительный опыт в постановке экспериментов с записью данных на ДНК. Что касается четвертого основателя альянса - компании Western Digital, то она интересуется этой областью как крупнейший игрок на рынке накопителей для записи данных.
Кроме четверки основателей в альянс вошли такие компании и организации, как Ansa Biotechnologies, CATALOG, The Claude Nobs Foundation, DNA Script, EPFL, ETH Zurich, imec, Iridia, Molecular Assemblies и Лаборатория молекулярных информационных систем Вашингтонского университета.
Запись информации на ДНК обещает недорогую и чрезвычайную плотность хранения. Так, один грамм носителя ДНК может хранить порядка одного зеттабайта данных. Для записи всей информации сегодняшнего мира понадобится мерее 20 граммов носителя. Теоретическое время сохранности такой записи может достигать тысячелетий, ведь даже сегодня ученые могут расшифровывать фрагменты ДНК из живой природы, которым сотни тысяч лет.
Интересно, что для записи данных на ДНК предлагается использовать не двоичный подход, а кодирование из четырех базовых символов. В частности, с помощью соединений из четырех оснований нуклеиновых кислот ДНК; аденина (A), гуанина (G), цитозина (C) и тимина (T). Например, 00 = A, 01 = C, 10 = G и 11 = T. Закодированные этими кислотами данные записываются в короткие фрагменты ДНК и упаковываются для сохранения в какой-то контейнер, например стеклянный шарик.
Сегодня это выглядит фантастикой. Пока на запись и считывание пяти байт данных, записанных в ДНК, требуется около суток. Но когда-нибудь это может стать реальностью. Другой вопрос, что подавляющее большинство генерируемых сегодня данных - это цифровой мусор, практическая польза от хранения которого очень и очень неочевидна.
Microsoft Вашингтон Университеты