Исследователи разрабатывают файловую систему для хранения на основе ДНК

Исследователи разрабатывают файловую систему для хранения на основе ДНК

Большинство ваших ячеек содержат полный набор инструкций для создания человека, хранящегося в ДНК. Ученые много лет работали над разработкой технологии хранения, которая могла бы использовать невероятную плотность ДНК для хранения данных других типов, но она идет медленно. Теперь команда из Microsoft Research и Вашингтонского университета, возможно, взломали код, чтобы сделать ДНК жизнеспособным носителем информации.

Кодирующая последовательность ДНК описывается четырьмя парами оснований: цитозином, гуанином, аденином и тимином. Это A, C, T и G, которые вы всегда видите в ДНК-последовательностях. В ваших клетках базы считываются по три за раз, и каждый набор из трех описывает другую аминокислоту. Поместите аминокислоты вместе, и вы получите белок. Чтобы хранить что-то еще как ДНК, вам нужно разработать другую схему кодирования, и есть несколько способов сделать это. Реальная проблема заключается в том, как вы читаете и извлекаете данные.

Чтобы прочитать данные, которые вы закодировали в ДНК, вам нужно нарезать их на более короткие последовательности, так как нет возможности прочитать полную, неразрывную часть ДНК. Таким образом, системе хранения ДНК нужны маркеры, которые сообщают вам, где каждая последовательность подходит. Вероятно, вы можете увидеть, куда это происходит - вам нужно прочитать всю последовательность, чтобы получить один файл. Работа Microsoft и Университета Вашингтона связана с добавлением произвольного доступа к хранилищу ДНК. Исследователи разработали новые маркеры последовательности, которые могут ориентироваться на определенные файлы, не обращаясь к ненужным файлам.

Исследователи разрабатывают файловую систему для хранения на основе ДНК

Ключ заключается в нахождении достаточной последовательности маркеров для маркировки всех ваших файлов, и команда определила тысячи, которые будут работать. Это означает, что вы можете усилить определенную последовательность, которая идентифицирует нужные вам файлы, и просто упорядочить их. Если вы хотите сохранить больше файлов, чем у вас есть маркеры, вам просто нужно сохранить дополнительные отдельные пулы ДНК. Другим новаторским подходом к хранению ДНК в новом исследовании является использование операции сбрасывания битов (XOR) в длинных строках одинаковых оснований. Секвенирование ДНК имеет тенденцию становиться беспорядочным, когда слишком много повторяющихся оснований. Команда использовала XOR для вставки случайной последовательности, чтобы разбить эти длинные прогоны и сделать данные быстрее для чтения.

Microsoft Research и Вашингтонский университет в основном описали файловую систему ДНК. Это приближает нас к использованию ДНК для хранения, но вряд ли это заменит ваш SSD. Даже с улучшениями, это медленнее и значительно сложнее в использовании, чем электронное хранилище. Тем не менее, ДНК может быть ценной для архивирования с плотностями данных, измеренными в сотнях петабайт на грамм.

Читать далее

Обзор Xbox Series X: игровой компьютер для гостиной, которого я (в основном) всегда хотел
Обзор Xbox Series X: игровой компьютер для гостиной, которого я (в основном) всегда хотел

Xbox Series X выйдет через пять дней, и мы можем говорить об этом. Я никогда раньше не делал обзоров консоли, поэтому я рассмотрел это с точки зрения того, к чему я привык - компьютерных игр. Здесь Microsoft объективно есть чем гордиться.

Сенаторы призывают к минимальному стандарту широкополосной связи 100 Мбит / с
Сенаторы призывают к минимальному стандарту широкополосной связи 100 Мбит / с

Многие сенаторы США призывают США принять в 2021 году стандарт широкополосной связи со скоростью 100 Мбит / с в восходящем / нисходящем направлении. Пандемия пролила свет на дыры в инфраструктуре США, особенно в сельских районах.

Милан AMD приносит Zen 3 в Epyc с в основном положительными результатами
Милан AMD приносит Zen 3 в Epyc с в основном положительными результатами

Новый процессор AMD Milan не входит в комплект Epyc третьего поколения. В основном это позитивные новости для производителя, с умеренным приростом производительности по сравнению с Zen 2.

Intel развязывает процессор 3-го поколения CPU на основе Ice Lake Sp
Intel развязывает процессор 3-го поколения CPU на основе Ice Lake Sp

Масштабируемые чипы Xeon Intel TEL GEN TEN выходят и предлагают реальные повышения производительности по сравнению с предыдущими частями каскадного озера, но они недостаточно, чтобы выиграть общий лидерство Intel Performance в сегменте.