DNA:?人类的终极U盘

点击标题下「大数据文摘」可快捷关注

?欢迎熟悉外语(含各种“小语种”)的朋友,加入大数据文摘翻译志愿者团队,回复“翻译”和“志愿者”了解详情。

“医疗大数据”专栏诚招:如果您是专业人士并愿意与大家分享,请后台留言,附自我介绍及微信ID,加入我们,一起把这个平台和专栏做得更好。

来源:科技日报

原文标题:DNA或成终极数据存储器

宽客网,量化投资,宽客俱乐部

导读DNA是一种双链结构的分子,主要功能是长期性的资讯储存,被喻为“蓝图”或“食谱”。DNA不仅紧凑而且复杂,因此,从理论上来说,1克DNA就能将互联网巨头谷歌和脸谱上所有海量数据囊括其中,且还有富裕空间。

扪心自问一下,我们存储在硬盘或移动闪存内的信息可以保存多久呢?5年?10年?还是更久?

据美国有线电视新闻网(CNN)近日报道,目前,一家名为Backblaze的在线备份服务商正在同时运行2.5万个硬盘,它们希望借此将这个问题查个水落石出。尽管该调查目前仅仅进行了5年,但研究结果表明,4年的损耗率就高达22%。Backblaze公司表示,有些服务器的寿命可能有10多年,而有些则不足1年。但不管怎样,存储设备无法永远存在。

因此,科学家们开始四处寻觅,希望找到能使数据存续数百万年之久的存储方法。

DNA或成终极数据存储器

瑞士苏黎世理工学院的研究人员相信,答案可能就在每个活体细胞都有的数据存储系统:脱氧核糖核酸(DNA)内。DNA是一种双链结构的分子,主要功能是长期性的资讯储存,被喻为“蓝图”或“食谱”。DNA不仅紧凑而且复杂,因此,从理论上来说,1克DNA就能将互联网巨头谷歌和脸谱上所有海量数据囊括其中,且还有富裕空间。

研究人员表示,这1克DNA能容纳455EB(艾字节)的数据,相当于4550GB字节的数据,而5EB就相当于至今全世界人类所讲过的话语。

化石作用让DNA长期保存

众所周知,化石作用让古生物化石中的DNA在特殊条件下可以被保存下来,人们可以从中获得动物的整个基因组。迄今为止,科学家们已经对11万年前的北极熊和70万年前的马的基因组进行了提取和测序。

苏黎世理工学院化学和应用生物科学系讲师罗伯特?格拉斯表示,DNA也存在着巨大的问题,那就是它会很快降解。格拉斯在接受CNN采访时表示:“我们已经发现了使DNA非常稳定的简单方法,希望能找到办法,将DNA的高存储密度和稳定性这两个属性结合起来,应用于数据存储方面。”

格拉斯说:“就目前的情况来看,化石中的DNA最多能保存70万年,不过,也有人推断能在化石骨头内发现存在时间长达百万年之久的遗传物质。我们已经证明,我们制造出的DNA和信息存储的衰变速度同化石DNA的相同,因此,我们或能得到大约100万年的存储时间。”

考古学领域的最新发现也进一步刷新了人们对DNA保存能力的认知。据媒体报道,2013年年底,古生物学家从一根来自西班牙的40万年前的股骨中提取出了DNA,这些化石是上世纪90年代从西班牙北部一处叫做“骨坑”(Sima de los Huesos)的地方发掘出来的,这段DNA是公开发表的最古老的人类DNA,将此前纪录提前了足足30万年。其中的神奇之处在于,这个DNA能在墓穴这个相对来说比较寒冷但非冰冻的环境下存活下来。

格拉斯说:“还有很多谜题有待解开,我们希望进一步弄清楚DNA的衰变机制。”

人工模拟化石作用

现在,我们都知道,水和氧气是DNA生存的敌人。在一个试管中且暴露在空气中的DNA只能存活2年到3年;而将DNA密封在一个玻璃(一个无菌且中性的环境)内并对其进行冷却,可以增加其生存几率。

研究人员解释道,人工办法其实也模拟了自然界中发生的现象,如果化石能让DNA处于寒冷、干燥且密封的状态,那么,微型玻璃圆球也能让双链中包含的信息数千年毫发无伤。格拉斯说:“溶胶—凝胶技术可以利用小分子制造固体物质,因此,我们能借用这一过程制造出包围DNA分子的玻璃。”

该研究可与科幻大片《侏罗纪公园》相媲美。在《侏罗纪公园》中,研究人员利用琥珀中吸食恐龙血液的蚊子,最终克隆出恐龙,并建造了一个侏罗纪时代公园。不过,格拉斯说,通过琥珀内的史前昆虫来获得史前DNA,这一想法并不靠谱。他说:“最好的DNA来源是陶瓷和干燥的物体,因此,牙齿、骨头甚至蛋壳更有可能。”

成本有望不断降低

迄今为止,该研究团队通过仅仅保存83KB的数据来对最新方法进行测试。格拉斯介绍说:“我们保存了两个大文件,一个是《1921年瑞士联邦宪章》;另一个是阿基米德重写本。我们希望通过存储这些文件来证明,我们的方法不仅有用,而且很重要。”

他推断,在1万年内,信息是可读的;而如果在冰冻状态下,可以存储100万年之久。据悉,为这86KB的信息编码的成本大约为2000美元,目前来看有点昂贵,但格拉斯乐观地认为,医学分析领域取得的进步很有可能让成本大幅降低。

格拉斯说:“人类基因组测序的价格已经从几年前的数百万美元下降到现在的数百美元。现在,似乎到了我们将医学分析和基因组分析领域取得的进步整合进信息技术领域的时刻了,一旦如此,整个信息技术将呈现出崭新的面貌。”

【医疗大数据栏目介绍】

2015年2月7日“医疗大数据专栏”正式成立。随着基因芯片及DNA测序技术的发展,生物医疗大数据迅猛发展,既是大数据技术发展的原动力,也是大数据技术的受益者。大数据文摘2013年7月成立,我们专注数据,每日坚持分享优质内容,从未间断,我们努力为读者和志愿者打造一个分享和交流平台。作为大数据文摘的志愿者群,我们中有不少人从事医疗大数据相关工作,关心医疗大数据的发展,愿意通过这个专栏,和大家一起分享医疗大数据的点点滴滴。

【主编介绍】

孙强,资深生物信息专家,现在服务于美国国立癌症研究所,从事癌症基因组数据库管理工作。热爱大数据,加入大数据文摘志愿者行列一年有余,愿以文会友,广结大数据善缘。旅居美国多年,现在定居于大华府地区。

读过的学校:山东大学,中科院植物所,加大洛杉矶分校( UCLA )

生活过的城市:淄博,济南,北京,洛杉矶,华盛顿

其他爱好:足球,钓鱼,打牌

大数据格言:Big data is better data

如果您是专业人员,愿意与大家分享,请加入我们,我们把这个平台和专栏做得更好。精准医疗的革命时代到来了,让我们一起关注医疗大数据技术的发展。

有意联系译者的朋友,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢!
数据分析, 数据挖掘, dna, 大数据

原文发布于宽客论坛,点击阅读原文

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部