什么是Penna模型?

如题所述

Penna模型是基于近半个世纪以来盛行的基因积聚假说上的,用字节串来表示生物个体的基因,能够体现个体的年龄变化,并且用MonieCarol方法来模拟种群的繁衍、死亡、基因突变等过程,从而可以模拟种群的发展演化情况,并可以从微观的角度来体现种的一些性质。到目前为止,关于具有年龄结构的种群演变的最成功的计算机模型就Penna模型。其中一个原因是它成功的通过一系列的字节来表示计算机意义上个体的基因,用一个计算机中的整形变量来表示基因串,可以通过逻辑运算很快地进行计算。从概念上来说,该模型非常简单,但是它所表示出来的结果绝不是微不足道的。Penna模型这样一个手段必然有它生物学上的意义,那就是关于衰老现象的基因积累理论。从本质上来说,这个理论通过突变和自然选择的压力,将衰老的变化过程与依赖于年龄的恶性基因突变的行为以及恶性基因的效果联系在一起,所以它可以证明种群演变过程中许多的难以解释的问题。( ]9 m# n$ l: d! U( y9 c3 O% m! U
标准的Penna模型) b! }! m+ N2 Z o( N: b& \6 Q& o
首先让我们从Penna模型的原始模型开始。1995年T.J.Penna的论文《ABit一Srting Model for Bioolgcial Aging(一个具有生物老化性质的字节串模型)》中提出了一个用, M- M! J: O V: F5 Q' u) @
字节串来表示种群中的个体基因的模型,考虑了基因积累给种群带来的影响,并结合了环境、食物与空间对种群的限制。这个模型就是后来大家称之为Penna模型的原始模型。: r5 ~3 q J* P) E3 ~
在这个模型之后的许多文章都是在其之上进行修改与扩充,研究自己想要做的各种生物学或者生态学方面的问题。下面对Penna模型的定义进行阐述。
* b! c! w. j5 U7 D' g+ {5 ?9 z考虑一个单物种生物种群,种群中每一个个体用一个长为B的字节串来表示它的基因串。基因串中的每一字节代表一个基因,从个体出生时就固定,并且终生保持不变。
0 n. a% E- Z! T. v4 H) O2 J) _基因串中每个位置都对应给定的年龄:第1个位置的代表第1岁,第2个位置代表第2岁,依此类推。时间以离散的方式计算,t=1,2,3,…,时间每前进一步,个体长大一岁。(在文章中,我们把每一时间步称为一年,事实上这个时间阶段根据生物种类的不同,可以是一个小时,可以是一天,也可以是一年,在这里,我们都称之为一年。)由于字节串的长度为B,所以个体最多可以从活到B岁。基因串中每一个位置的基因只能是0或1,随着时间的变化,相应的读取个体中的基因,这是一个打开基因的过程。若在基# A8 G* u' G0 c4 H4 O
因的第i个位置设置的是1,则表示个体在第i岁时,会患上一种遗传疾病,并且此疾病将在该个体的一生之中持续下去,直到它死亡;而如果这个位置上的数据是0,则表示( p7 M. U9 k$ ^" ?: p
个体在该年龄健康,没有患上疾病。判断个体是否得病的过程可以通过逻辑运算来进行,所以运算效率非常高的。
5 q( H M; E/ d随着时间的变化,种群中的每个个体都要经受死亡的考验,通过了的个体可以繁殖后代。在每一时刻t,导致个体死亡的因素有三个:" q9 v8 R, M0 N/ d8 ?
(1)个体达到该物种的最大生存年龄B,则无论个体的其它状况如何,都要死亡。: \' E7 S+ @5 Q: }( ?, c
(2)个体所能承受的遗传疾病有上限T,一旦年龄为a的个体活到当前岁数时所患遗传疾病数目等于T,也就是说,个体基因串上从第1位到第a位的基因中1的数目等于T+ C0 B' m% t3 w8 x& V* N! D
时,个体就会因为患过多的疾病而死亡。 w" v2 T E# J# a9 Q. c
(3)食物与生存环境对生物群体的影响也是非常大的,用Vehurstl因子来表示这些外在环境对生物存活的影响。当前时刻,每个个体都会以V=N(t)/Nmax的概率死亡,这里
4 s; V! _$ s1 n4 WN(t)表示t时刻种群中活着的个体数目,(N0就表示初始时刻种群个体数目),Nmax、表示环境可容纳个体的最大数目,简称为环境最大容量。具体实现方式是在当前时刻,t对
7 ~& q( B; X, { e" S1 Y, \- V$ l6 @每个个体都产生一个0到1之间的随机数;与V进行比较,若;比V小,则不考虑个体的年龄与基因状况,无条件死亡,否则个体存活。加入Verhulst因子的目的是为了避免& N, B: D2 k6 s$ v9 x5 R, R+ K
种群过大的膨胀下去。
8 {2 s Q: N. R5 D" n: k+ M' r对于存活下来的个体,若它们的年龄到达最小繁殖年龄R时,则称个体成熟,成熟的个体每年可以生育一个子代。子代的基因除了随机选取M个位置发生突变以外,全是
2 [7 `, D5 A+ m! B, K: u6 H9 H父代基因串的复制。基因突变分为良险突变(若突变发生的位置的基因是1,则突变将之改为0;若本来就是0,则保持不变)和恶性突变(若突变发生的位置的基因是0,则
: e; {( n4 U$ b4 z突变将之改为1;若本来就是1,则保持不变)。
& P" H( F' b. |通过这样的生存、死亡以及繁殖机制,就可以模拟出一个种群的变化,并且可对种群的某些特性进行研究,譬如:种群的最大年龄,年龄分布等。
- k! Q5 g$ V; u. p$ J' U0 A对这个模型进行模拟,发现经过一段长时间的演化之后种群能够达到平衡。
9 m, c9 `1 |7 Z这就是标准Penna模型,主要针对的是无性繁殖的生物群体。在许多模型中,字节串的长度B通常定为32,这是因为在用计算机进行模拟的时候,一般是用整型变量来存! c5 \! U7 @. t9 ?3 d# A3 y& D" x
储个体的基因串。在这个原始的Penna模型中考虑到了良险与恶性两种基因突变,但在以后的许多模型中,将良性突变给忽略了,仅考虑恶性突变发生的情况,亦即子代基因* `; g% ?6 J" Z( b) B- X; m# \
是在父代基因的拷贝下,随机选取M个位置,若选定位置基因数据原为0,则改变到1,若选定位置基因数据原为1,则保持1不变。这样的改进也是有意义的,因为在现实种
0 [" c0 ~0 u3 i# S5 o' l$ q群中,良性突变发生的概率非常小,而恶性的基因突变相对良胜突变而言出现频率是非常高的。另外考虑到生殖过程中一些实际情况,对于生物繁殖时能够生育子代个体的数
% x( l( @( e3 R. v. s; ]- l目也由1改为了b,用以与生物界中繁殖量较高的物种相适应。* v2 T/ R$ ?0 w2 d/ z* p( c
温馨提示:答案为网友推荐,仅供参考
相似回答