Субота, 2 Листопада, 2024

Ваша інформація плаватиме в пробірці: дата-центр на базі ДНК з’явиться за 5-10 років

ДНК є ємнісним накопичувачем інформації, і уже багато років розвиваються технології зберігання даних у цих біологічних молекулах. Поки що це лише лабораторні експерименти, хоча Microsoft ще у 2020 році створила альянс для просування такої технології. Сьогодні експерти очікують, що перший центр на базі обробки даних ДНК запрацює протягом п’яти-десяти років. Дані не зберігатимуться у вигляді нулів і одиниць на жорсткому диску, а знаходитимуться в біологічних молекулах ДНК. Такий центр обробки даних мав би форму лабораторії, у багато разів меншої, ніж сьогодні.

Прогноз стосовно термінів запуску першого центру обробки даних з накопичувачами на базі ДНК надав професор Том де Ґріф з Ейндховенського технологічного університету. Разом із аспірантом Басом Бегельсом, корпорацією Майкрософт і групою партнерів з університету Де Ґріф розробив нову техніку, яка дозволяє масштабувати інноваційне зберігання даних із синтетичною ДНК. Результати були опублікованів журналі Nature Nanotechnology. Де Ґріф працює на кафедрі біомедичної інженерії та в Інституті складних молекулярних систем (ICMS) Університету Ейндховена, а також є запрошеним професором в Університеті Радбауд.

В одній частині такого дата-центру буде відділ кодування файлів, в якому нулі та одиниці цифрової інформації перетворюватимуться на молекули синтезованої ДНК.

Інша частина буде складом для зберігання даних і міститиме великі поля капсул, кожна капсула представлятиме упакований файл.

Коли потрібно буде отримати доступ до інформації, роботизована рука вийме капсулу, прочитає її вміст і помістить назад. Приблизно так само сьогодні працюють сховища на базі магнітної плівки – на стелажах знаходяться касети, які виймає робот і розміщує в зчитувач. Цей тип магнітного носія забезпечує неперевершену надійність та дешевизну в перерахунок на гігабайт.

У ДНК-дата-центрі базові молекули ланцюга ДНК склеюють у певному порядку, щоб утворити синтетично створені ланцюги ДНК. Файли та фотографії, які зараз зберігаються в центрах обробки даних, потім можна буде зберігати в ДНК.

Поки що ця техніка придатна лише для архівного зберігання. Це пояснюється тим, що читання збережених даних є дуже дорогим, тому економічно вигідно якомога рідше звертатися до файлів, що зберігаються у форматі ДНК.

Зберігання даних у ДНК пропонує багато переваг. Наприклад, файл у форматі ДНК займатиме набагато менше місця. Також у нього в рази триваліший термін зберігання даних.

Але, мабуть, найголовніше те, що ця нова технологія робить великі центри обробки даних, застарілими. Адже «хмари», за прогнозами, до 2030 року складуть в найкращому випадку 8%, у гіршому – 21% глобального енергоспоживання.

Також є питання фізичної наявності накопичувачів для зберігання усіх даних, попереджає Де Ґріф. За три роки ми згенеруємо стільки даних у всьому світі, що не зможемо зберегти половину, каже він.

Ідея використання ниток ДНК для зберігання даних виникла у 1980-х роках, але на той час була надто складною та дорогою. Це стало технічно можливим через три десятиліття, коли синтез ДНК почав розвиватися. Джордж Черч, генетик з Гарвардської медичної школи, розкрив цю ідею в 2011 році. Відтоді синтез і зчитування даних стали експоненціально дешевшими, що нарешті вивело технологію на ринок.

Використана Де Ґріфом і його групою техніка PCR (ПЛР, полімеразна ланцюгова реакція), називається «довільний доступ», дуже схильна до помилок. Тому можна читати лише один файл за раз, і, крім того, якість даних надто погіршується кожного разу при зчитуванні файлу.

Ось як це працює: ПЛР (полімеразна ланцюгова реакція) створює мільйони копій потрібного фрагмента ДНК шляхом додавання праймера з потрібним кодом ДНК. Наприклад, на цьому базуються тести на COVID-19: навіть мізерна кількість біологічного матеріалу коронавірусу стає помітною при багаторазовому її копіюванні.

Але якщо треба читати кілька файлів одночасно, вам потрібно кілька пар праймерів, які виконують свою роботу одночасно. Це створює багато помилок у процесі копіювання.

Ось тут і вступають в дію капсули. Група Де Грефа розробила мікрокапсулу з білків і полімеру, а потім закріпила один файл на капсулу.

Ці капсули мають теплові властивості, які можна використати на нашу користь. При температурі вище 50 градусів за Цельсієм капсули закриваються, дозволяючи процесу ПЛР проходити окремо в кожній капсулі. Тоді мало місця для помилок. Де Ґріф називає це «термозамкнутою ПЛР». У лабораторії йому наразі вдалося прочитати 25 файлів одночасно без істотних помилок.

Якщо потім знову знизити температуру, копії від’єднаються від капсули, а закріплений оригінал залишиться, що означає, що якість носія оригінального файлу не погіршиться.

«Зараз ми втратили 0,3 відсотка після трьох читань, порівняно з 35 відсотками за існуючого методу», – каже Де Ґріф.

Де Ґріф також зробив бібліотеку даних ще простішою для пошуку. Кожен файл має флуоресцентну мітку, а кожна капсула – свій колір. Роботизована рука може розпізнавати кольори та відокремлювати їх один від одного, що дозволяє акуратно вибрати потрібний файл із набору капсул на полиці.

Це вирішує проблему читання даних. Де Ґріф: «Тепер залишається лише почекати, доки витрати на синтез ДНК не впадуть ще більше. Тоді техніка буде готова до застосування».

У результаті він сподівається, що Нідерланди незабаром зможуть відкрити свій перший у світі центр обробки даних ДНК.

За матеріалами: Science Daily

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися