设置

关灯

第150章 深蓝存储(4000字)(第3/4页)

    物存储的制造方法和理论基础,想想都知道是信息量很大的一份文件。

    如果直接出现在姜炎大脑里,那瞬时的信息传输量就会很大,万一能观测到呢。

    类比的话就像小鱼在海面下游动,人是无法用肉眼观测到异常的,但是鲨鱼在海面下游弋,人是能观测到水花溅起。

    万一找到这种信号,连带着把梅林找到了呢

    大家还是抱有很高的期望。

    姜炎话音落下后,专门负责对接的研究员打开门走进来“姜老,怎么了”

    姜炎无奈道“梅林给了我一个网址和一个密钥,生物存储的制造方法和理论基础直接去网址里下载。”

    “梅林好像知道我们想干嘛一样。”

    其他研究员知道后,议论纷纷

    “网址下载这更像论坛了。”

    “不愧是老式bbs的风格,以前的bbs论坛下载就是这样,直接放网址链接。”

    “梅林一定是蓝星人,这些细微的习惯跟蓝星人太像了,而且一定是在bbs论坛盛行前出生的。”

    “dna作为天然遗传信息的载体,了一种稳定、高效且可持续的数据存储解决方案。”

    “自从蓝星上的生命一开始,大自然就以自己的方式解决了如何把信息遗传给下一代的问题

    它以四个碱基a、t、c、g的独特顺序存储定义有机体的信息,这些碱基位于微小的称为脱氧核糖核酸dna的分子,这种存储信息的方式已经持续了 30 亿年。

    dna分子作为信息载体,与传统的存储介质相比具有许多优势。

    其高存储密度、潜在的低维护成本等优良特性使其成为信息存储的理想替代品”

    “介质存储信息的能力我们用香农信息指数来衡量,由于dna分子是由脱氧核糖核苷酸单体的线性链组成的异质聚合物。

    每个单体采用四种碱基a、t、c和g中的一种,特定排列即序列了一定量的信息。

    根据香农信息的定义,单个碱基所能容纳的最大自我信息量h 为

    自我信息对碱基分布的依赖性在表1中给出,其中a是“概率分布偏差”,即碱基出现的频率与 025 的平均频率之间的差异。”

    “对于dna分子来说,如果四个碱基中的每一个都与自身完全对应,那么h xy0,i xy2bit碱基,传输中的平均互信息等于源熵,它给出了传输信息量的上限。

    但是,在写入和读取dna序列的过程中,信息可能会发生扭曲,导致输入集x和输出集y不匹配,从而降低了传输过程中的平均互信息。例如,如果每个碱基对应于除自身以外的其他三个碱基的概率为 110。

    碱基读数的失真大大降低了 dna 中信息传输的效用。

    不同传输错误率i下的平均交互信息一个碱基被错误地读出为其他三个碱基之一的概率,假设 2 位碱基输入。平均互信息随输入基础偏差和传输错误率存在一定的关联性。

    我们可以通过某种手段来规避这种错误,完美的发挥dna分子应有的存储效率。”

    “在dna中增加存储数据的纠错码。通过存储模型,其中数据集由一组无序的  序列表示,每个序列的长度为 。该模型中的错误是整个序列的丢失和序列内的点错误,例如插入、删除和替换。

    我们在此存储模型中推导出纠错码的可实现基数的 gibertvarshaov 下界和球体上界。

    进
    (本章未完,请翻页)