如何將你的照片存儲1000年?哈佛大學最新研究:用這個
在計算機技術飛速發展、數字生態日新月異的今天,數據存儲技術變得愈發重要。
然而當前,用于數據存儲的設備,比如光學介質、磁介質和閃存,使用壽命通常不到 20 年,并且還需要消耗大量能量來維護。
一直以來,盡管科學家們始終在探索以高密度和無電的方式來存儲信息的其他方法,比如 DNA 分子或其他聚合物,但這些方法也會受到相對成本高和讀寫速度慢等因素的限制。
那么,有沒有一種更好的方法呢?近日,哈佛大學化學與化學生物系 George Whitesides 教授團隊及其合作者,就開發了一種全新且原理簡單的光學分子存儲方法。
他們使用熒光染料分子編碼二進制信息,成功將各類文字、圖像信息寫入并讀取出來,讀/寫速度分別可以達到 128 bits/s 和 469 bits/s,甚至可以讀寫視頻或其他任何可以數字存儲的信息。
同時,比起傳統存儲技術,該方法還具有存儲密度高、存儲壽命長(理論上可達數千年或更久)、成本可接受等優點。
相關研究論文以“Storing and Reading Information in Mixtures of Fluorescent Molecules ”為題,已發表在科學期刊 ACS Central Science 上。
研究人員表示,這種光學分子技術并不要求對分子內部的結構或序列進行復雜編碼,非常簡單易懂,也為存儲能耗、成本和抗消耗能力等新興分子信息存儲技術面臨的重要問題提供了解決方案。
不僅快,還“保真”
當前,用于存儲數字信息的技術多種多樣,包括光盤、閃存和驅動硬盤等,但其工作壽命大約只有幾十年。另一種可行的方法是將信息存儲在一些分子中,例如 DNA——受大自然將各種復雜的生物遺傳信息存儲在 DNA 中的啟發,科學家嘗試人工創造類似的分子,以有目的地存儲數字信息。
這樣的方法在理論上具有非常高的存儲密度,而且無需能耗維護;更妙的是,根據科學家推斷,可以存儲信息數千年乃至更久。 然而,這些分子系統也存在劣勢:讀/寫速度不夠快,多次讀取容易造成信息損失,成本較高,以及尺寸縮小導致噪聲增加。
因此,為解決分子存儲技術存在的問題,Whitesides 等人開創性地使用熒光分子來將目標信息編碼成二進制并存儲,并使用熒光顯微鏡來讀取信息。 使用這種方法,他們成功在一塊小至 7.2 mm^2 的基板上存儲了約 14KB 的數字信息,文本和圖像均可存入,空間信息密度高達 271.5 bytes/mm^2。
圖|團隊使用噴墨打印機成功將信息存儲在很小的樹脂基板上,而電腦程序能夠放大看到其上各染料的點狀分布(動圖素材來源:YouTube)
此外,通過重復讀取信息 1000 次以上,研究團隊發現熒光信號強度的損失較少(低于 20%),且每次都能成功讀取。
而在讀寫速度方面,研究團隊也取得了不菲的成績——在使用噴墨打印機將熒光分子寫入信息時,速度可以達到 16 bytes/s。同時,只需要簡單判別某處有無熒光染料分子,就可以讀取對應的二進制信息。因此,該方法能夠并行多通道讀取信息,速度達到 58.6 bytes/s。
圖|用該技術將“電學之父”法拉第的圖像(3.95 KB)轉換成熒光染料圖案,并存儲在 4.2mm^2 大小的環氧樹脂基底上,打印錯誤率只有 0.4%(來源:該論文)
因此,這種方法能夠以可接受的成本實現高密度、快速讀/寫的信息存儲技術,以及對單個分子集的多次讀取而不丟失信息,可以說很好地解決了一直以來分子存儲技術中存在的問題。
熒光分子如何編碼數字信息?
實際上,此次的技術是一種基于數據磁帶(Write Once Read Many,WORM)的分子信息存儲方法,不能重復寫入且不允許修改,但可以重復讀取。
首先,研究人員選擇了 7 種可在不同波長發光的熒光染料分子,這些染料都很容易買到。他們使用染料來分別標記 ACSII 碼的每一位,如果染料存在則代表“1”,反之則代表“0”。
圖|熒光分子對文本信息“Arts”進行二進制編碼和打印成像示意圖(來源:該論文)
接下來,該團隊使用噴墨打印機將染料混合物根據信息編碼打印在環氧樹脂表面的小點中,環氧樹脂基底中含有活性氨基,會與染料發生反應并形成穩定的共價鍵,從而固定住染料分子并防止后續讀取時有過高損耗。
然后,他們使用配備有多通道熒光檢測器的熒光顯微鏡,讀取每個點上染料分子的發射光譜并解碼信息。這樣一來,該檢測器可以同時且互不干擾地分辨出基底上任意點的染料信息組合,計算機程序再將二進制碼還原為圖像/文本,讀取過程隨即完成。
圖 | 熒光顯微鏡讀取基板上某點的染料顏色,分析出對應信息示意圖(來源:論文)
研究人員表示,以這種方式存儲的數據可以在數千年內保持可讀。另外,它還不容易受到水的破壞、不能被遠程黑客攻擊、不會受到現有存儲系統的尺寸限制,并且它的存儲不需要任何能源。
數字信息存儲技術盤點
從古至今,信息存儲從最傳統原始的書籍文字演變至今天的數字信息,一路變遷,如今仍在廣泛應用的數字信息存儲技術有哪些?
硬盤:采用磁介質的數據存儲設備,希捷(Seagate)在 1980 年生產了第一款 5.25 英寸硬盤(HDD),同年 IBM 推出的第一款 1 GB 硬盤則是個龐然大物,重達 550 磅。到了今天,1T 硬盤都不再新鮮,科學家們一直在努力突破磁介質技術,以提高硬盤密度、擴充容量、降低能耗。
光盤:1960 年代,一位名叫 James T. Russel 的發明家致力于將光作為一種機制來記錄并重播音樂。直到 1975 年,索尼出資完成該項目,生產出 CD 和 DVD。
閃存:2000 年末問世,采用電子式可清除程序化只讀存儲器的形式,允許在操作中被多次擦或寫的非易失性存儲器。主要用于手持式移動設備,例如存儲卡、U 盤等。
數據孤島與數據湖:大數據的有用來源,以原始格式存儲數據,并允許處理這些數據,其用戶可以通過互聯網訪問大部分信息。
云數據存儲:互聯網基于云服務器進行數據存儲與傳輸,云本質上為用戶提供了無限量的存儲空間,同時需要加密和身份驗證。
分子存儲:利用 DNA、蛋白質等分子內部結構原理對信息進行存儲。2019 年,同樣是來自哈佛大學的一個研究團隊開發出一種基于寡肽的分子存儲技術,當時的數據寫入和讀取的平均速率分別為 8 bit/s 和 20 bit/s。值得一提的是,該團隊正是來自 George Whitesides 實驗室。
參考資料:
https://news.harvard.edu/gazette/story/2021/10/harvard-researchers-use-dyes-to-store-data/
https://pubs.acs.org/doi/10.1021/acscentsci.1c00728
https://www.youtube.com/watch?v=EHg2Li52qUI
https://gmwgroup.harvard.edu/
本文來自微信公眾號“學術頭條”(ID:SciTouTiao),作者:吳婷婷,36氪經授權發布。