Исследователи разрабатывают файловую систему для хранения на основе ДНК

Исследователи разрабатывают файловую систему для хранения на основе ДНК

Большинство ваших ячеек содержат полный набор инструкций для создания человека, хранящегося в ДНК. Ученые много лет работали над разработкой технологии хранения, которая могла бы использовать невероятную плотность ДНК для хранения данных других типов, но она идет медленно. Теперь команда из Microsoft Research и Вашингтонского университета, возможно, взломали код, чтобы сделать ДНК жизнеспособным носителем информации.

Кодирующая последовательность ДНК описывается четырьмя парами оснований: цитозином, гуанином, аденином и тимином. Это A, C, T и G, которые вы всегда видите в ДНК-последовательностях. В ваших клетках базы считываются по три за раз, и каждый набор из трех описывает другую аминокислоту. Поместите аминокислоты вместе, и вы получите белок. Чтобы хранить что-то еще как ДНК, вам нужно разработать другую схему кодирования, и есть несколько способов сделать это. Реальная проблема заключается в том, как вы читаете и извлекаете данные.

Чтобы прочитать данные, которые вы закодировали в ДНК, вам нужно нарезать их на более короткие последовательности, так как нет возможности прочитать полную, неразрывную часть ДНК. Таким образом, системе хранения ДНК нужны маркеры, которые сообщают вам, где каждая последовательность подходит. Вероятно, вы можете увидеть, куда это происходит - вам нужно прочитать всю последовательность, чтобы получить один файл. Работа Microsoft и Университета Вашингтона связана с добавлением произвольного доступа к хранилищу ДНК. Исследователи разработали новые маркеры последовательности, которые могут ориентироваться на определенные файлы, не обращаясь к ненужным файлам.

Исследователи разрабатывают файловую систему для хранения на основе ДНК

Ключ заключается в нахождении достаточной последовательности маркеров для маркировки всех ваших файлов, и команда определила тысячи, которые будут работать. Это означает, что вы можете усилить определенную последовательность, которая идентифицирует нужные вам файлы, и просто упорядочить их. Если вы хотите сохранить больше файлов, чем у вас есть маркеры, вам просто нужно сохранить дополнительные отдельные пулы ДНК. Другим новаторским подходом к хранению ДНК в новом исследовании является использование операции сбрасывания битов (XOR) в длинных строках одинаковых оснований. Секвенирование ДНК имеет тенденцию становиться беспорядочным, когда слишком много повторяющихся оснований. Команда использовала XOR для вставки случайной последовательности, чтобы разбить эти длинные прогоны и сделать данные быстрее для чтения.

Microsoft Research и Вашингтонский университет в основном описали файловую систему ДНК. Это приближает нас к использованию ДНК для хранения, но вряд ли это заменит ваш SSD. Даже с улучшениями, это медленнее и значительно сложнее в использовании, чем электронное хранилище. Тем не менее, ДНК может быть ценной для архивирования с плотностями данных, измеренными в сотнях петабайт на грамм.