《第08章 生物计算机课件.pptx》由会员分享,可在线阅读,更多相关《第08章 生物计算机课件.pptx(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、8.1 8.1 生物计算机概述生物计算机概述8.2 8.2 基因调控开关和生物芯片基因调控开关和生物芯片8.3 8.3 神经(神经(元元)计算机)计算机8 8.4 DNA.4 DNA计算机计算机8 8.5 .5 细胞细胞计算机计算机8.6 8.6 纳米纳米机器人机器人习题习题8 88.1.1 生物计算机的特点生物计算机生物计算机(Bio-Computer)也称仿生计算机仿生计算机,主要原材料是生物工程技术产生的蛋白质分子,并以此作为生物芯片来替代半导体硅片,利用有机化合物如核酸分子存储数据,以生物酶及生物操作作为信息处理工具。生物计算机又称为湿计算机湿计算机(Wet Computer),目前的
2、电子计算机可以称为干干计算机计算机(Dry Computer)。生物计算机具有如下特征:(1)体积小,密集度高,功效高。(2)具有很高的可靠性,永久性和自我修复性可靠性。(3)速度快。(4)生物计算机的存储具有巨大优势。(5)无发热与信号干扰。(6)数据错误率低。(7)拟人性。8.1.2 生物计算机种类(1)生物分子或超分子芯片(2)自动机模型(3)仿生算法(4)生物化学反应算法8.2.1 转换开关 转换开关(inverter)因其输出是输入的转换函数而得名,即输入为低时输出是高,反之亦然。天然系统中有许多基因调控的转换开关存在,其中大家比较熟悉的正控阻遏系统(即效应物分子的存在使激活蛋白处于
3、非活性状态,转录不进行),即可以看做是天然的转换开关。8.2.2 Riboswitch 生物体能够通过各种精巧的机制控制基因表达的时间和数量,Riboswitch就是这些精巧机制中的一种。Riboswitch主要是通过核糖核酸(RNA)构象的改变来实现“开关”的功能,阻止或开启目的蛋白的生成。8.2.3 双稳态开关最早的基因开关模型是由Gardner等人在2000年构造的,主要由两个启动子(Promoter)和一个抑制子(Repressor)构成,启动子启动子可以诱导基因表达生成相应的抑制子,抑制子抑制子通过结合对方基因的启动子而抑制它的表达。图8.1 Gardner等构造的基因开关模型该数学
4、模型由一组微分方程组成,如式(8.1)、(8.2)。其中U、V分别表示两种阻遏蛋白的量;1、2为两种启动子(包含核糖体结合位点共同作用)在没有阻遏蛋白时的表达速率;-U、-V表示两种阻遏蛋白的自然降解速率;而、为启动子的抑制参数,数值越大,表示阻遏蛋白对启动子的抑制作用越强。U、V的变化速率为0时,说明两种阻遏蛋白的含量处于相对稳定的状态,即系统处于稳态。当两种启动子的启动能力比较相近,即1和2的数值比较接近时,整个系统有两个稳定状态,V含量相对较多的状态1和U含量较多的状态2。8.2.4 8.2.4 生物芯片生物芯片生物芯片(biochip或bioarray),又称蛋白芯片蛋白芯片,基基因芯
5、片因芯片(Gene Chip)、DNADNA微阵列微阵列(DNA Microarray),一般指高密度固定在互相支持介质上的生物信息分子(如基因片段、DNA片段或多肽、蛋白质、糖分子、组织等)的微阵列(micro-arrays)杂交型芯片,阵列中每个分子的序列及位置都是已知的,并且是预先设定好的序列点阵。微流控芯片(microfluidic chips)和液相生物芯片是微阵列芯片之后发展的生物芯片新技术。8.3.1 神经(元)计算机的概述神经计算机(Neural Computer,NC),又称为神经元计算机,或神经电子计算机,标志着电子计算机的发展已经进入了第六代。神经电子计算机的信息不是存在
6、存储器中,而是存储在神经元之间的联络网中。若有节点断裂,电脑仍有重建资料的能力,还具有联想记忆,视觉和声音识别能力。冯诺依曼也是人工神经网络研究的先驱之一。1948年,冯诺依曼在研究工作中比较了人脑结构与存储程序式计算机的根本区别,提出了以简单神经元构成的再生自动机网络结构。8.3.2 神经网络的结构与算法生物生物神经网络神经网络:一般指生物的大脑神经元、细胞、触点等组成的网络。在人体内从大脑到全身存在大约1010个神经元。神经元的组成包括:细胞体细胞体:它是神经元的本体,内有细胞核和细胞质,完成普通细胞的生存功能。树突树突:它有大量的分枝,多达103数量级,长度较短(通常不超过1毫米),用以
7、接收来自其它神经元的信号。轴突轴突:它用以输出信号,有些较长(可达1米以上),轴突的远端也有分枝,可与多个神经元相连。突触突触:它是一个神经元与另一个神经元相联系的特殊部位,通常是一个神经元轴突的端部靠化学接触或电接触将信号传递给下一个神经元的树突或细胞体。人工神经网络人工神经网络(Artificial Neural Networks,ANNs),也简称为神经网络(Neural Networks,NNs),或称作连接模型(Connection Model),它是一种模仿生物神经网络行为特征,进行分布式并行信息处理的算法数学模型。处理单元处理单元(Processing Element,PE)就是
8、人工神经元,也称为结点,通常用圆圈表示。处理单元PE的基本结构包括若干个输入信号和输出信号。输入信号来自外部(用黑色圆点表示输入端点)或别的处理单元的输出,在数学上表示为行向量x:x = (x1, x2, xN) (8.3)其中:xi为第i个输入的激励电平,N表示输入数目。连接到结点j的加权表示为加权向量:wj=(w1j, w 2j, w Nj)(8.4)其中,wij表示从结点i(或第i个输入点)到结点j的加权,或称i与j结点之间的连接强度。转移函数转移函数f()也称激励函数激励函数、传输函数传输函数或限幅函数限幅函数,其作用就是将可能的无限域变换到一指定的有限范围内输出,这类似于生物神经元具
9、有的非线性转移特性。常用的转移函数有:线性函数、斜坡函数、阶跃函数、符号函数、Sigmoid函数、双曲正切函数。根据神经网络的层次结构不同,还可以分成单层神经网络、多层神经网络。回归回归型网络型网络(反馈网络反馈网络):一般来说,凡包含反馈连接的网络均称为回归型网络。在神经网络中,对外部环境提供的模式样本进行学习训练,并能存储这种模式,则称为感知器感知器;对外部环境有适应能力,能自动提取外部环境变化特征,则称为认知器认知器。神经网络在学习中,一般分为有教师学习有教师学习和无教师学无教师学习习两种。感知器采用有教师信号进行学习,而认知器则采用无教师信号学习的。这种学习系统分成三个部分:输入部,训
10、练部和输出部。学习机构可用图8.4所示的结构表示。图8.4 学习机构8.3.3 神经网络的学习方式(1)感知器的学习感知器是有单层计算单元的神经网络,由线性元件及阀值元件组成。感知器的数学模型:图8.5 感知器(2)反向传播学习的BP算法反向传播算法也称BP算法,有时也称BP模型。BP算法是为了解决多层前向神经网络的权系数优化而提出来的,所以BP算法也通常暗示着神经网络的拓扑结构是一种无反馈的多层前向网络。有时也称无反馈多层前向网络为BP模型。图8.6 BP模型学习结构它含有输人层、输出层以及处于输入输出层之间的中间层。中间层有单层或多层,由于它们和外界没有直接的联系,故也称为隐层隐层。在隐层
11、中的神经元也称隐单元隐单元。隐层虽然和外界不连接,但是,它们的状态则影响输入输出之间的关系。这也是说,改变隐层的权系数,可以改变整个多层神经网络的性能。反向传播算法分二步进行,即正向传播和反向传播。u 正向传播:输入的样本从输入层经过隐单元一层一层进行处理,通过所有的隐层之后,则传向输出层;在逐层处理的过程中,每一层神经元的状态只对下一层神经元的状态产生影响。在输出层把现行输出和期望输出进行比较,如果不等,则进入反向传播过程。u 反向传播:反向传播时,把误差信号按原来正向传播的通路反向传回,并对每个隐层的各个神经元的权系数进行修改,以望误差信号趋向最小。8.4.1 DNA计算机概述1998年9
12、月,美国普林斯顿研究所的两位科学家获得了世界上首个DNA计算机专利,通过基因技术和发酵技术制作了DNA分子,能像经典计算机一样处理数据。目前,DNA计算机已经能够求解赫姆霍兹(Helmholtz)等数学问题。DNA计算机的特点主要表现在6个方面。(1)工作的并行性(最大优点)(2)极低的能耗(3)极高的集成度(4)运算速度快(5)抗电磁干扰能力强(6)成本低廉8.4.2 DNA计算机的模型(1)粘贴模型粘贴模型粘贴模型是一种被证明具有计算完备性的DNA检索模型,配对识别操作是按照DNA碱基互补特性完成的。该模型的优势是运算过程不需要酶的参与。(2)剪接模型剪接模型剪接模型是另一类被证明具有计算
13、完备性的系统。DNA分子剪接是通过分子生物学操作的,即利用限制性内切酶、DNA连接酶、DNA聚合酶和外切酶等实现DNA的切割、连接与扩增。(3)等价检查模型等价检查模型等价检查模型是将DNA双链序列形成的符号串看作两个记忆单元,然后对这两个单元进行等价性检查。这种模型的优点是模型简单,适合分子计算。8.4.3 DNA计算机的体系结构(1)DNA分子结构DNA的基本单位是脱氧核苷酸,每个脱氧苷酸是由一分子磷酸,一分子脱氧核糖和一分子含氮碱基组成。核普酸按从属于它们的化学基因或碱基分成4种:腺嘌呤(Adenine,A),鸟嘌呤(Guanine,G),胞嘧啶(Cytosione,C),胸腺嘧啶(Th
14、ymine,T)。(2)DNA的代数结构构成DNA的四个元素A、C、G、T天然形成了一个良好的代数结构,可以用含4个元素的字母表=A,C,G,T对信息编码,形成域的代数结构,即由4个不同符号A、C、G、T连成的串可以表示一个DNA单链,形成了“域”的代数结构。图8.8 DNA四元域(3)DNA并行计算体系 DNA并行运算可以解决电子计算机难以解决的计算问题,如非多项式问题(nonpolynomial problem, NP 问题)。NP问题的计算时间,随着变量数目的增加呈指数增加,因此电子计算机在变量数目较大时就对NP问题无能为力了。8.5.1 细胞计算机概述细胞细胞计算机计算机(Cellul
15、ar Computer)采用系统遗传学(System Genetics)原理、合成生物技术,人工设计与合成基因、基因链、信号传导网络等,对细胞进行系统生物工程(System Bio-engineering)改造与重编程序,可以做复杂的计算与信息处理。1994年,中科院曾邦哲发表系统遗传学、系统生物工程、输卵管生物反应器等概念与原理。1999年,又建立系统生物科学与工程网,提出将遗传信息系统视为基因组智能(Genomic Intelligence)进行人工编程,并公布了人工设计细胞内分子电路系统的概念图,使细胞成为人工生命系统(Artificial Bio-system)。2002年,又提出细胞
16、计算机模型。8.5.2 细胞自动机的结构细胞自动机细胞自动机(Cellular Automata,CA),也译为元胞自元胞自动机动机、点格自动机点格自动机、分子自动机分子自动机或单元自动机单元自动机,是一种时间和空间都离散的动力系统。冯诺依曼也是细胞计算机研究的先驱者,并在20世纪50年代发明细胞自动机。(1)初等细胞自动机 初等细胞自动机是状态集S只有两个元素s1,s2,即状态个数k=2,邻居半径r=1的一维细胞自动机。图8.10 冯诺依曼的初等细胞自动机(2)细胞自动机的基本组成 细胞自动机最基本的组成:细胞、细胞空间、邻居及规则四部分。另外,还应包含状态和时间。可以视为由一个细胞空间和定
17、义于该空间的变换函数所组成。细胞又可称为单元、细胞或基元,是细胞自动机的最基本的组成部分。细胞分布在离散的一维、二维或多维欧几里德空间的晶格点上。细胞的状态可以是二进制形式,如:(0,1),(生,死),(黑、白)等 ;也可以在一个有限整数集内S内取值:如交通领域在-(Vmax+1)Vmax+1)之间取值。严格意义上的CA只能有一个状态参量;但是,在实际应用中,可以有多个状态参量。细胞在空间中分布的空间格点的集合就是细胞空间。 细胞空间的几何划分:理论上,它可以是任意维数的欧几里德空间规则划分。常用的细胞自动机一般是一维和二维的。邻居:冯诺依曼型邻居定义如下: (8.23)分别表示邻居元胞的行坐
18、标和列坐标:,oxoyvv分表表示中心元胞的行坐标和列坐标:摩尔(Moore)型邻居定义如下: (8.24)8.6.1 纳米机器人概述 “纳米机器人”的研制属于分子仿生学的范畴,它根据分子水平的生物学原理为设计原型,设计制造可对纳米空间进行操作的“功能分子器件”。它的微粒尺寸大于原子簇,小于通常的微粒,一般为100102nm。8.6.2 纳米机器人结构 全自动化或自主化的纳米操作机器人,需要解决以下几方面的设计问题。(1)导航系统(2)动力系统(3)自复制和 自装配机制 分子马达(驱动器),是纳米生物机器人的核心部件,按照组成物质和运动机理,可以分为几个不同种类驱动蛋白(Kinesins)、肌球蛋白(Myosins)、动力蛋白(Dyneins)、DNA、ATP和鞭毛马达等。8.18.1,8.28.2Thank you!Thank you!