【健康探理】与两性遗传机制相矛盾的哈迪一温伯格法则
2018/11/26 9:37:14 健康探理

     点击上方“健康探理”可以订阅哦

    

     导读:本篇文章《与两性遗传机制相矛盾的哈迪一温伯格法则》约21,000字。

     科学在不断发展,百年来西方的有些观点在当下可能并不正确,欢迎共同讨论。

     与两性遗传机制相矛盾的哈迪一温伯格法则

    

     1908年,英国数学家G.H. Hardy和德国医生w. Weinberg同时提出了哈迪温伯格法则(Hard Weinberg law):在一个不发生突变、迁移和自然选择的无限大的随机交配的群体中,常染色体上的基因,无论群体起始时基因频率如何,只要经过一代的随机交配,群体的基因频率和基因型频率即达到平衡并将逐代保持不变。

     一百多年来,直到今天,哈迪温伯格法则一直是群体遗传学最重要的原理,人们用它来解释繁殖是如何影响群体的基因频率和基因型的频率。哈迪温伯格法则实质上提出了在没有进化因素(即基因突变)的影响下,当基因一代一代传递的时候,群体里的基因频率和基因型频率将会保持不变。

     1

     基因频率和基因型频率的差别

     哈迪温伯格法则的数学模型建立在基因频率和基因型频率的基础之上,因此,我们有必要对基因的频率和基因型的频率进行一次仔仔细细的甄别。

     基因和基因型,是两个完全不同的概念。每一个基因型都是由两个独立的基因组成的,而一个基因型对应的是一种生物性状。能够直观反映出来的、被人们观察到的只能是某一个生物的性状,而不是生物的某一个基因型,更不是某一个具体的基因。而一个生物性状则是由一个基因型决定的,在孟德尔的显、隐性性状体系里面,每一个等位基因座上的基因型主要有三种类型,可以简单表达为AA、Aa和aa。其中AA代表纯种的显性性状基因型,Aa代表杂种显性性状基因型,aa则是纯种隐性性状基因型。纯种的意思是基因型的两个基因的性状表达属性是一致的,要么都是显性,要么都是隐性;杂种的基因型里的两个基因一个是表达显性性状的,另一个是表达隐性性状的。但是,与基因型相对应的生物性状却只有两种彼此相对立的性状,即显性和隐性两种性状,医学上常说的致病或非致病基因、囊性纤维瘤或正常个体等等都是一对一对的显性和隐性的相对性状。

     从生物的表观性状上,是不可能够直观的反映出构成一种性状、一个基因型的非常具体的两个等位基因的,特别是显性性状有纯种和杂种两种基因型,例如AA、Aa,我们根本没有办法通过生物的表观性状而对纯种基因型AA与杂种基因型Aa加以区分,除非基因型是典型的隐性性状如aa基因型,我们才能看到隐性性状和显性性状之间的区别,比如豌豆的显性的红花和隐性的白花,或者显性表型的正常人与隐性表型的囊性纤维瘤。我们一定要清楚,只要没有通过基因检测技术去直接测定每一个具体的基因,要判断组成一个基因型的两个基因属性,就只能通过对表观性状的显隐性的性状的观察而间接的加以推定。

     正是由于生物性状的数量少于基因型的数量,显、隐性这二种性状是由AA、Aa和aa这三种性状表达属性的基因型决定的,基因型的数量多于性状的数量,群体中基因型的分类计数就必然只能依靠这三种基因型之间的内在比例关系间接的进行推测。现在的问题是,群体中各种基因型彼此的数目之间是不是真的存在着某种具有内在逻辑关系的比例?

     例如,数量遗传学常常例举的一个例子里,在2000个北欧和中欧人中,就会有一个人罹患囊性纤维瘤。这个囊性纤维瘤就可以被看着是一个隐性的致病基因型,余下的1999个人都是正常的、非致病的、显性的基因型。1例囊性纤维瘤加上1999例非囊性纤维瘤的正常表型个体,就组成了这个2000人的群体。由于囊性纤维瘤在本质上是属于一种隐性的表观性状,所谓的患病人群和正常人群就是按照有没有罹患囊性纤维瘤作为生物性状的标志而进行分类的,而不是直接按照每一个人真实而具体的基因类型的类别而进行分类的。那仅有的一例患囊性纤维瘤的基因型毫无疑问是aa型隐性纯合子,那么其余的1999例正常人的基因型不是AA型纯合子就是Aa型杂合子。

     既然致病的基因型只有aa这一种,而正常的基因型却有AA和Aa两种,我们又怎么可能知道正常性状的AA和Aa两种基因型各自的数量、频率和比例呢?如果不能知道这三种基因型各自准确的数量、比例,那又怎么可能知道存在于这两千个人中的全部A、a两种基因的数量和比例呢?也就是A、a基因的基因频率如何才能确定呢?

     哈迪温伯格法则正是要试图来解答各种基因型、基因之间的数量与比例问题!

     在遗传学领域里,确实常常需要用一个基因型来代表一个具体的生物性状或者个体,例如一个血友病的病人,或者某一种酶。我们知道,每一个基因型都是由一个父本和一个母本的两个基因共同构成的。在那2000个北欧和中欧人中发现的那唯一的一例囊性纤维瘤患者,他的基因型就是由其一个父本a基因和一个母本a基因共同构成的,为aa基因型。在哈迪和温伯格那个时代,人们根本没有办法去具体测定每一个基因,于是就只能通过观察每一个个体的某一个具体的生物性状,利用每一个生物性状是由两个基因共同表达的这一遗传学最基本的原理,然后借助对生物性状的研究、借助经典遗传学的孟德尔分离律来间接的推测构成性状的是哪两个同源等位基因。借助一个性状来研究一对父母本同源等位基因,是早期遗传学的最基本的研究方法,孟德尔正是借助了豌豆的性状观察而推论出父母本遗传因子是等比例、同性质的,摩尔根也是借助果蝇的白眼性状而推测出基因的变化,遗传学家们都是利用了各种性状之间的数量比例关系、利用了基因型彼此之间的数量比例关系来推论基因的数量比例关系的典范。现在我们已经知道了1/2000的囊性纤维瘤的基因型是aa基因型,根据哈迪温伯格法则定义的三种基因型之间的具有某种数量比例关系(即AA:Aa:aa=1:2:1),就可以据此推断出余下的1999个正常人中AA和Aa基因型各自的比例和数量,最后还可以推导出A和a基因的准确数量。所以,哈迪温伯格法则的核心,就是AA、Aa和aa三种基因型彼此之间存在着的数量、频率之间的比例关系。

     哈迪温伯格法则因此必须首先假设在AA、Aa和aa三种基因型之间存在着1:2:1这样的固定的数量比例关系。哈迪温伯格法则通过观察生物表型性状的方法,确定了aa这一种隐性性状的基因型的数量之后,就利用他们建立起来的这个1:2:1的数学模型进行分析,对其他两种显性性状的基因型AA和Aa各自的比例与数量根据法则作出判断。

     其实,哈迪温伯格法则是一种非常武断的数学判断,因为变量AA、Aa和aa彼此之间是不是存在着1:2:1的比例关系,是必须要进行证明的,才能推广应用。而哈迪和温伯格却恰恰没有去证明这三个变量之间是不是存在着的1:2:1的数学比例关系,以及说明这个比例究竟是怎么产生出来的,他们直接就使用了1:2:1这个固定比例对AA、Aa和aa三种基因型进行了推测判断。而事实是,我们仅仅只是知道在2000个人中有一例aa基因型,并不知道有多少例AA和和多少例是Aa,当然也不可能知道AA和Aa之间的比例。

     亲本基因的频率和后代群体中的基因频率真的如哈迪温伯格法则规定的那样是一致的吗?后裔群体中基因型AA:Aa:aa三者之间真的存在1:2:1这样一个非常固定的比例吗?这真的需要我们认真分析一下,因为这也是哈迪温伯格法则最核心的这两个数学假设能不能够成立的最关键的问题。

     2

     哈迪温伯格法则成立的前提条件

     从1908年开始,遗传学者、生物学者们就一直都把哈迪温伯格法则用作群体遗传学的基础。生物群体是由很多的生物个体组成的,而每一个个体的性状、基因型都是由其父、母本两个基因决定的,所以哈迪温伯格平衡,归根结底其实就是想通过观察存在于群体中的某一种生物性状的频率,用这个性状的频率来代表其基因型的频率,然后再根据AA、Aa、aa三种基因型的频率之间的关系(哈廸温伯格平衡的数学等式)间接的推测出另外两种基因型的频率,进而获知群体中A和a两种基因的频率。为此,哈迪-温伯格法则首先假设了生物群体是一个“理想群体”。这个理想群体必须具备群体的个体数量无穷大、随机交配、无突变、无迁徙、无自然选择这样几个理想的条件。

     假如AA、Aa、aa三种基因型和A、a二种基因都是变量,总共就存在五个变量,哈迪温伯格法则就是要通过其中唯一已知的一个变量去运算出其余四个变量的值,这真的是在挑战数学逻辑的极限。为了实现这一数学目标,哈迪温伯格首先声明,亲本A基因的频率p加上亲本a基因的频率q将会等于1,即p+q=1。哈迪和温伯格没有解释为什么p+q一定会等于1,对此,最合理的解释就是在一个封闭的“理想群体”中,由于这个群体因为具备了无穷大、无变异、无迁徒、无进化等特点,因此可以认为是一个完全封闭的、很有代表性的群体。群体里的A基因和a基因不会因为进化、突变而变成非A、非a基因,基因的性质也不会发生质的改变;群体里的A基因和a基因各自的数量、出现的频率也不会因为个体的迁徏等原因而变多或变少,所以,整个封闭的“理想群体”中基因的质和量都不会发生任何改变,基因的总数量因此可以被视为100%,即A基因的百分比p加上a基因的百分比q等于100%,哈迪和温伯格将100%表述成1,所以,p+q=1

     需要注意的是,哈迪温伯格法则非常重视一个群体的亲本基因的频率p+q=1=100%,言下之意,亲本群体中只能有A和a两种基因,再无B、b、C、c等其他多余的基因了。

     哈迪温伯格法则的另一个必要条件是要求群体中的个体数量要足够多,最好数量能够多到无穷多。当年孟德尔进行的豌豆试验也是釆用了无穷大的群体,他在修道院花园中那一小块空场地上,花了好几年的时间,总共种植了 2. 8万株豌豆植株、 观察并进行了自花授粉的鲜花接近4万朵,仔细辨认分类过近 40万粒豌豆种子,这么大的工作量,确实是非常人所能做得到的。为什么需要观察这么多的数据呢?因为影响后代个体数量的因素实在是太多了,包括生殖的数量和存活的数量,都会影响到后代群体中各种基因型的数量与比例,只有当后代的个体总数量达到无穷大的时候,才能排除那些个别的、特殊的生殖率、存活率对结果的影响,也就是排除某些个体差异的影响,以期比较真实的反映出整个群体内各种类型的基因型的平均比例,使最终的统计数据能够反映出真实的情况、反映出真实的遗传规律,将统计误差减少到最低。孟德尔的试验,如同他所例举的两组试验(试验1和试验2)的头10个个体所展现的一样,每一株豌豆个体的显性:隐性的绝对数量都是不等于3:1的,只是无限接近3:1这个比例而已。每一株豌豆个体也都因为种种原因而没有展现出后代个体的数量应该严格遵循着3:1的表型比例,意味着豌豆个体并没有在后代机械地按照1:2:1的比例去产生出AA、Aa和aa三种基因型。但是从成千上万的子二代豌豆中,孟德尔总结出了F2代豌豆显性:隐性为3:1这个性状的平均数量的比例规律,再由这个比例进一步推断出了F2代豌豆基因型AA:Aa:aa为1:2:1的基因型平均的比例关系,因为上万株豌豆个体大致都遵从、接近于这个比例。这是孟德尔率先在生物学领域应用统计学原理、大数法则的成功范例。不同时期的各种遗传学试验也反复证明了群体的总数量越是接近于无穷大,其后裔的性状比例、基因型比例值就越是真实可信。

     随机交配原则,更是要求在群体中进行交配的个体完全偶然地与无关基因型的配偶进行自由的交配,而不受任何遗传学上或行为学、社会学方面的限制。这意味着交配和繁殖都必须是足够充分的,达到自由交配能够产生所有基因型类型的目的,而繁殖的后代数量也足够多到能够完全表达出应有尽有的所有的基因型组合类型、以及这些基因型理论上应该达到的数量比例。简单的说,就是每一个生殖细胞通过减数分裂形成的四个配子,每一个都能够有机会产生相应的后代个体,即四种基因型的后代个体。由于交配与繁殖的数量都足够充分,这样的后裔群体也就必然是无穷大的。

     我们知道,每一次卵细胞的形成都只能成熟一个,而不会同时因为减数分裂而形成四个卵细胞;每一次减数分裂形成的四个配子,因此将很难同时形成四个受精卵。因此,个体可以形成的四种配子虽然都有能力配对成四种基因型的后裔个体,但是一般至少需要进行四次交配才能分别形成四种基因型的受精卵。所以自由的随机交配、繁殖出足够多的涵盖所有基因型类型的后代,在生物界绝对属于一种非常理想的状态,关键在于我们还根本无法去证明后裔群体中的每一种基因、每一种基因型种类都已经足够丰富、数量已经可以满足"无穷大"的要求了。所以哈迪温伯格法则能够运用的这些前提条件,即仅凭观察生物的一种性状就可以确定三种基因型的各自比例的基本判断,就显得相当可疑了。

     哈迪-温伯格法则的另一个条件是生物群体并不存在进化的压力,没有发生因为自然选择而导致某一些基因型频率(数量)发生变化。由于哈迪温伯格法则探讨的话题是基因和基因型,所以没有进化的压力就是指群体里不存在个别的基因突变,基因型的异同仅仅是两种基因各种组合的结果,而不是基因突变的结果。在哈迪-温伯格法则中实际上只关注传递遗传是否会改变基因出现的频率以及繁殖是否会影响到基因型的频率,因此所有的基因突变、进化的压力都是必须加以排除的,这个群体因此也是一个理想的、封闭的群体,群体中的每一个个体都不会与群体外的基因发生交换。因此,在群体中,始终都只有A、a两种基因,每一种基因的数量、比例都不会因为进化(突变)而改变,不会因为基因突变而多出了B、b、C、c……等新的基因,群体的数量无论有多大,始终都只能有A、a两种基因,群体中基因频率p+q因此就可以恒等于1,即100%。

     3

     哈迪温伯格平衡与卡方检验之间的关系

     我们知道,基因和基因型是完全不同的两个概念,因此,群体中有多少个基因的频率并不能决定每一种基因型的频率。例如,当p=q时,基因A的数量就应该等于基因a的数量,在孟德尔的碗豆试验中,亲代AA与aa杂交、子代Aa自花授粉(Aa与Aa交配),就完全属于这种p=q的情况,我们只需要根据基因A和基因a的频率,就能知道AA、Aa、aa各有多少个了,这是完全可能的,因为p=q,A和a两种基因的数量、频率是相同的,只要AA和aa两个个体充分杂交、自交,后代(必须是F2代)个体的数量达到了“无穷大”的“理想”状态,那整个无穷大的理想的F2代豌豆群体的AA、Aa、aa三种基因型的数量,根据孟德尔分离律原理,确实将会等于1:2:1这个基因型的分离比例,与此同时,表型性状的显:隐性比例为3:1。但是在哈迪温伯格平衡中,只要求了p+q=1,而不是要求的p=q,也就是说,当孟德尔随手抓起一把豌豆,数清楚了里面有几粒隐性性状(aa)青色的豌豆,就要据此判断出在剩下的那些黄色的显性性状的豌豆中有多少粒的基因型是AA纯合子、又要多少是Aa杂合子,这可能吗?只有哈迪-温伯格平衡认为这是完全可能的。

     那么在什么情况下等位基因的频率可以完全决定基因型的频率呢?哈迪和温伯格告诉我们,只要生物群体满足了哈代-温伯格平衡,等位基因的频率(A、a频率)就完全可以用来决定基因型(AA、Aa、aa)的频率。这样一来,哈代-温伯格平衡能不能够成立,就成了一个新的、前提性的问题了。

     假如哈迪温伯格法则成立的条件在实践中无法被满足,那么根据该法则运算出来的那些数据(期望值)就会和实际测定的数据(观察值)不一致,就会被说成实验的观察值不能够满足哈代-温伯格平衡,也就不能够用这个哈迪温伯格平衡公式去推算我们想知道的那些基因的数量与频率、基因型的数量和频率。所以,我们在应用哈迪温伯格平衡公式进行基因、基因型的频率计算之前,就有必要对哈迪温伯格法则计算出的期望值与实际观察值之间进行卡方(X2)检验,根据检验的期望值和观察值的一致性程度,就可以进一步追查影响群体中基因型频率、基因频率数量变化的各种原因,这些原因必须就是能够满足哈迪温伯格法则的那些理想条件,如群体的大小、进化的压力、繁殖率、存活率等等等。

     哈迪温伯格法则可以说是目前判断和研究生物群体基因频率和基因型频率应用得最为广泛的数学标准和数学模型,被专门用来判定生物群体中后裔的基因频率是否与其亲本的基因频率相同。由于哈迪温伯格法则认为后裔的基因频率是由他们的亲本的基因频率决定的,因此,后裔中观察到的那些基因频率(观察值),就和亲本的基因频率是相等的(等于观察值),因此是能够用来计算依据哈迪温伯格法则期望的那些后裔群体的基因型频率(期望值)的。在《数量遗传学导论》一书中,D.S.Falconer和T.F.C.Mackay举了一个例子来说明观察值(基因频率)与期望值(基因型频率)的观察与计算:

    

     表1、冰岛人血型测定的X 2检验

     在这个例子中,样本的M、N两个基因频率被首先通过哈迪温伯格平衡的相关公式计算出来,然后再从观察的基因频率中用哈迪一溫伯格平衡计算出基因型MM、MN和NN三者的频率,分别是P2、2pq和q2。MM、MN和NN每一个基因型的频率与基因型总数相乘得就得到了上表中的期望值。例如,根据哈迪温伯格平衡的规定,MM、MN和NN三种基因型的理想比例是1:2:1,所以MM的期望值就是(0.56096)2×747=242.36,MN的期望值是2x0.5696x0.4304x747=366.26,NN的期望值是(0.4304)2 x747=138.38。哈迪温伯格平衡把基因型里两个基因之间的关系定义为两个基因之间的乘积。

     用X2检验测验了实际观察数和理论期望值一致程度的好与坏,显示观察数和期望值之间的并没有显著的不一致,显然,X2测验结果显示了观察的样本是基本满足哈迪温伯格平衡的理想条件的。至于观察值与期望值之间存在着的那一些差距,原书著者认为这在抽样过程中是很容易偶然产生的。

     卡方检验在统计学原理中是用来比较理论频数和实际频数的吻合程度或拟合优度问题的。当观察值(实际频数)与理论值(理论频数)相吻合、无差别、或者差别很小时,我们就可以认为基本或者完全满足了理论成立的那些条件。就上述这个例子而言,X2检验结果证明观察值(冰岛人群中实际观察到的血型基因型频率)与理论值(用哈迪温伯格法则相关公式计算出来的血型基因型频率)是比较吻合的,说明冰岛人群的血型基因型频率的分布能够满足哈迪温伯格平衡所要求的那些条件,即群体具备无穷大、随机交配、充分的繁殖和存活、无突变、无迁徙、无自然选择这几个理想的条件。

     通过X2检验,如果显示出实际观察值与哈迪温伯格法则计算的理论值差别很大,就说明不能够满足哈迪温伯格平衡要求的那些条件,群体中的基因频率和基因型频率就发生了变化,这就要在群体大小、亲本基因分离是否正常、亲本是否有正常的生殖力、配子是否有相等的受精力、是否是随机交配、雄亲和雌亲是否有相等的基因频率、后裔个体存活力是否相同这些前提条件方面查找原因了。

     《数量遗传学导论》一书认为:"符合平衡群体的测验就是对哈迪—温伯格基因型频率产生的条件是否满足的测验。?当发现良好符合时,测验没有理由怀疑所有条件的满足。对血型基因作出的测验几乎总是显示相当良好的符合,?如果测验显示出观察的频率和期望频率之间不一致,那么我们就能得出一个或更多的理想条件没有被满足的结论。但是不一致性并不允许我们鉴别出其确切原因,或确定哪一个具体的条件没有被满足。其理由是同样的不一致性可以由不同的原因所引起。例如,杂合体(即MN型)过多可由纯合体(即MM、NN)的选择淘汰引起,也可由亲本世代中雄性和雌性的基因频率不同(M、=N)引起。这种测验并不像它表现的那么简单,我们必须更仔细地观察这种测验能够做什么。"

     到了现在,我们已经完全清楚哈迪温伯格法则的应用价值了,哈迪温伯格法则就是以公式自身作为衡量群体是否符合"理想状态"的标准,去检测实际观测中的群体是否满足哈迪温伯格法则公式的那些规定。如果观察的、试验的生物群体能够满足哈迪温伯格平衡,该群体将被认为是符合"理想条件"的生物群体,就可以用哈迪温伯格法则去推算基因型频率和基因的频率;如果观测的生物群体经卡方检验不满足、不符合哈迪温伯格法则的规定,则该生物群体就不满足哈迪温伯格法则规定的哪些"理想条件",就不能用哈迪温伯格法则去推演群体中的基因型频率和基因频率。哈迪温伯格法则不言而喻、当仁不让的把自己当成了衡量生物群体是否处于"理想条件"的唯一标准。但是,我们同时也注意到,需要满足的哈迪温伯格平衡的那些理想条件,无一例外,都只与亲本或者后裔群体有关,而与哈迪温伯格法则本身是无关的,正如作者所说:"杂合体(观察值)过多可由纯合体的选择淘汰引起,也可由亲本世代中雄性和雌性的基因频率不同引起"。这句话暗示了只有哈迪温伯格法则代表着正确而理想的遗传,群体中有着过多的杂合体Aa,意味着纯合体AA或者aa的数量会减少,原因是选择淘汰在发挥作用,后面我们还会分析这个"选择淘汰"问题,但是在这里,我们只想问一个问题,哈迪温伯格法则能够代表"理想"的遗传条件吗?

     实际上,在运用哈迪温伯格法则之前,我们还应该认真思考一下哈迪温伯格法则本身是不是真的能够满足他们所提出的那些"理想"的遗传条件呢?哈迪温伯格法则的合理性是建立在什么样的遗传机制之上呢?哈迪温伯格法则真的可以用来判断群体的遗传条件是否理想吗?让我们进一步来分析分析。

     4

     哈迪温伯格法则的遗传学基础

     要判断哈迪温伯格法则本身是否符合"理想"的遗传状态,最好是由哈迪和温伯格他们自己出面来解释一下这个法则的求证过程和相关理论依据,可是很遗憾,哈迪只是在被问及时简直的回答了"证明是非常简单的",他们闭口不提这个法则是如何推导出来的,当然就更没有说出该法则所依据的遗传原理是什么了。其次,作为一个广泛应用的、非常重要的群体遗传学的理论基础,人们早就应该用充分的遗传学试验对这个数学公式加以实证,这方面也非常遗憾,在没有基因检测技术的那些年代里,人们确实没有条件去进行基因的频率、基因型频率的试验验证。但是现在,人类基因组测序都已经完成了,已经有了足够的条件对基因的分子结构进行研判了,群体里某种基因的具体频率也是可以测定的,但迄今为止还是没有人站出来对哈迪温伯格法则进行基于基因分子序列测定方面的实验验证。哈迪温伯格法则就是这么一个不知其原理、也未加以实证的数学法则,继续被广泛地应用于群体遗传学的研究之中,欺骗着人们对群体遗传的认识。。

     那么,哈迪温伯格法则究竟是依据什么样的遗传学原理而建立的呢?

     仍然以英国D.S.Falconer和美国T.F.C.Mackay合著的《数量遗传学导论》一书为依据,我们来看一看哈迪温伯格法则的内容和他们可能的推导过程。

     哈迪温伯格法则首先认定在生物群体中两个基因型之间交配的概率是等于两个基因型频率的乘积的,这个基于频率乘积的数学等式构成了哈迪温伯格法则的基本核心。哈迪温伯格法则首先表达了随机交配过程是两个等位基因A和a之间的交配,A和a的等位基因频率分别为p和q。据此,后代中的基因型频率就是P2,2pq,q2。因此,哈迪温伯格法则就被表达为:

    

     表2、哈迪温伯格法则

     哈迪和温伯格开门见山就亮出了他们的遗传学观点,即必须在亲本充分自由的交配、充分繁殖、后代充分存活的前提下,后代的基因型就会完美的表达出亲本杂交后的所有基因型的类型与数量。哈迪温伯格法则强调亲本充分交配、充分繁殖的目的,实际上就是强调大数法则,当后代群体数量足够大时,就能够比较真实的反映各种基因型的理想的数量与频率。哈迪和温伯格在把大家的思路引向了与他们的数学公式并无直接关系的那么一些限制条件方面了。

     但是,我们却首先注意到,在哈迪温伯格法则中,仅仅只有两种基因,即表2中表示的A、a两种基因,分别代表显性基因和隐性基因,也可以理解为正常基因和致病基因,还可以理解为正常基因和突变基因。如果群体中出现了三种以上的等位基因,例如ABO血型,哈迪温伯格法则就不那么好用了,而三种以上的等位基因也是很常见的,这已经被基因的多态性研究所证实。只是多种等位基因、基因多态性并不是我们在这里要讨论的话题。所以,哈迪温伯格法则原则上不允许两个亲代个体之外的另外的基因进入该生物群体,也就是说,适用哈迪温伯格法则的生物群体,只能是两个亲本自交、或者近亲婚配的后代群体。

     在《数量遗传学导论》一书中,有这样一个表格,详细描述了AA、2Aa、aa为1:2:1的来历:

    

     表3、由两性配子得到的合子基因型频率

     这个表,实际上就是一个非常经典的庞纳特方格,一般是用来表示孟德尔的分离律的,只不过加入了与每一个基因相对应的频率p、q和基因型的频率,基因型的频率在表中被清清楚楚的表示成了两个基因频率p、q之间的乘积。

     在这个表格中,有三个地方是非常重要的、值得我们注意的,一是雌、雄二个亲本都是同一种基因型,即Aa基因型,交配方式为AaxAa;二是后裔群体中出现了两倍的Aa基因型,这应该就是哈迪温伯格法则中2Aa的出处;三是哈迪和温伯格就是从这里开始,直接混淆了加法和乘法的概念,把一个基因型中两个基因之间的加法(A+A、A+a、a+a)的关系在不经意之间就偷换成了数量频率的乘积关系(pxp、pxq、qxq),两性交配,是父本加母本,而不是父本乘母本。

     要搞清楚哈迪温伯格法则的遗传学基础,上述三个问题是无法回避、必须面对的。

     5

     孟德尔经典遗传学的基因型及其比例

     孟德尔当年为了获得F2代显性:隐性为3:1这个经典的性状比例,对F1代Aa基因型豌豆进行了自花授粉(自交)。孟德尔分离律告诉我们,两个亲本AA基因型与aa基因型之间进行杂交,只能产生F1代Aa这一种基因型,F1代Aa也只有通过自花授粉后才会在F2代分离出AA、Aa和aa这三种基因型,我们可以把孟德尔遗传分离律表示为下面的等式。

     AA x aa = Aa=AA + 2Aa + aa

     从亲代到F2代 产生AA +2Aa +aa、基因型分离比为1:2:1这个结果,孟德尔采用了AAXaa和AaXAa两种豌豆交配方式。

     在孟德尔的这个经典遗传等式中,任何一个基因型都是由两个基因组成的。个体基因型的两个基因实际上是相加的关系,是和的关系,意味着一个父本基因与一个母本基因之和,AA代表着一个父本A基因与一个母本A基因之和,aa是一个父本a基因与一个母本a基因之和,Aa则是一个母本a基因与一个父本A基因之和。亲本和后代都是用两个基因来代表一个个体的基因型,这是遗传表达方式的基本原则。

     F1的雌配子A、a和雄配子A、a之间的交配,其父母本两个基因型都是同一种类型,即杂合子Aa。父本Aa与母本Aa交配(杂交或者自交),必然会产生表中描述的AA:2Aa:aa为1:2:1这样一种比例的F2代群体。由于在基因型Aa中,父本和母本基因是相同数量的,所以在AaXAa这种交配方式中,父本和母本两者的基因型既然都是Aa这一种杂合子类型,亲代和后代的基因A和基因a的数量、频率也就必然是相等的,即A:a为1:1,也就是说p恒等于q。

     由此可见,孟德尔先是釆用AA基因型与aa基因型进行杂交,获得了唯一一种杂合子Aa基因型,这是F1代。通过F1代个体Aa与Aa之间交配(自花授粉),孟德尔又观察到了F2代无穷大数量的群体中具有显性(AA、Aa)与隐性(aa)两种性状,但是他并没有直接观察到同为显性性状的AA基因型与Aa基因型两者之间的比例。他是根据观察到的F2代显性:隐性为3:1的比例,结合亲代个体纯种显性AA:纯种隐性aa基因型比例为1:1,才最终推测出F2代基因型AA:Aa:aa为1:2:1的分布比例。这就是上述庞纳特方格表示的孟德尔分离律原理的来历。但是在这个方格中只显示了一种交配方式,即F1代Aa与Aa交配,连亲代AA与aa杂交的交配方式都没有在方格中表现出来。无论是亲代AAxaa的交配方式,还是F1代杂合子Aa自花授粉的自交方式,在孟德尔试验的豌豆群体中,A基因与a基因两者的的数量和频率自始至终都是相等的,A:a为1:1,即p=q。

     由于后代群体的基因都来自于亲代的基因,后代基因型与亲代基因型及其交配形式就是密切相关的了,我们例举出亲代群体拥有的所有显、隐性基因、基因型,以及这些基因型通过不同的交配方式交配后能够产生的后代基因型:

    

     表4、各种类型的亲代基因型及交配方式产生的后裔基因型

     从表4看到,在孟德尔豌豆试验和哈迪温伯格法则中,都提到了AaxAa这一种亲代基因型及其交配方式,即AaxAa=AA :2Aa :aa。孟德尔的豌豆试验还提到过另一种基因型杂交方式,即AAxaa=4Aa,但是哈迪温伯格法则却对此没有提及过。孟德尔和哈迪温伯格法则都没有提及的还有AAxAA=4AA 、AAxAa=2AA 、 2Aa、aaxAa=Aa 、aa、aaxaa=4aa、AAxaa=4Aa这几种基因型之间的交配方式。

     6

     被忽略了的基因型和交配模式是p≠q的原因

     孟德尔的目的仅仅在于找出父母本两个遗传基因会在传递遗传过程中分离、组合的遗传规律,他采用了Aa型豌豆进行自花授粉。理论上讲,单独一株Aa型豌豆自花授粉的F2代后裔,也必然遵循显性:隐性为3:1的性状分离比例,这就已经足以证明遗传基因分离律了。孟德尔尽管进行了成千上万次自花授粉,但是每一次授粉都意味着一次Aa与Aa基因型之间的交配,这是F1代豌豆唯一的一种交配方式。因此Aa基因型中基因A的频率(数量)p与基因a的频率(数量)q是恒等的,即p=q,所以在AaXAa这种交配模式中,p是恒等于q的,不管后代基因型是什么、也不管后代各种基因型的数量与比例是多少,亲代基因A的数量与亲代基因a的数量相等、比例相同,p=q,是Aa与Aa交配的必然前提条件,孟德尔正是在A与a数量比例都相等的基础上才推论出F2代基因型为AA:Aa:aa为1:2:1的孟德尔分离比例。与此同时,孟德尔还推论出亲代的基因型是AA和aa,F1代基因型是Aa。孟德尔之所以小心翼翼的区分着豌豆群体中的各种基因型,就是因为他清楚的知道在豌豆群体中并不是只有Aa这一种基因型,也不止Aa与Aa交配这一种交配模式,亲本AA与亲本aa杂交,就是孟德尔亲自开展过的另外一种杂交试验,他完全知道AA与aa两种基因型杂交和Aa自交的后代基因型会是什么样的。

     现在我们已经非常清楚了,在哈迪温伯格法则中,实际上只认可了Aa与Aa基因型交配这一种交配模式,而忽略了其他五种可能存在的基因型交配模式。在亲本Aa与Aa进行交配的前提下,哈迪温伯格法则又允许p可以不等于q,亲本A基因的数量、频率与a基因的数量、频率可以不相等,这就直接违背了Aa与Aa交配必须要求父母本基因数目相等的遗传规定。换句话说,在哈迪温伯格法则中,假如亲代基因A和基因a的数量、频率不相等的时候,AaxAa产生子代AA:2Aa:aa的这个遗传比例就是不可能成立的。p ≠q,意味着亲代群体中必然存在着Aa以外的其他基因型,才打破了Aa基因型中父母本A、a两种基因数目相同、频率相等的固定比例关系。例如群体中既有Aa基因型,也有一定比例的AA基因型,必然A基因的数量会多于a基因,A基因的频率因此会大于a基因的频率,所以p>q,当然,亲本基因型之间的交配形式也就决不会仅仅局限于AaxAa这一种交配方式了。

     由于亲本交配方式被界定为AaXAa,所以亲本基因频率p=q,实际上就构成了哈迪温伯格法则得以成立的必要的前提条件。

     7

     2Aa的遗传学限制

     但是哈迪温伯格法则并不是用来求证孟德尔的遗传分离律的,反而是希望能够充分利用孟德尔分离律的基本原理,通过在后代群体中观察到的那些基因型的数量比例来推测存在于群体中的两种基因各自的数量比例,以衡量群体中基因和基因型的分布比例是否达到了理想状态(理论值)。这就要求我们搞清楚后代群体中各种基因型的比例和数量,这是哈迪温伯格法则的核心价值所在。

     通过表4,我们可以看到,由于亲代的基因型不同,就会导致后代的基因型比例也随之而不同。在六种可能的亲本基因型之间交配方式所产生的各种基因型比例的后代中,只有当两个亲本都是Aa型杂合子的时候,后代才能够产生基因型AA:Aa:aa为1:2:1的比例。2Aa恰恰是哈迪温伯格法则规定的后代比例的关键比例。Aa:AA为2:1,Aa:aa同样也是2:1,哈迪温伯格法则中最重要的一个关键之处就在于界定了后裔群体中基因型Aa必须比AA或者aa多一倍,为2Aa。

     我们可以看到,哈迪温伯格法则实际上忽略了表4中其它五种可能存在的亲代基因型之间的交配方式及其后代基因型的比例,包括孟德尔试验中进行过的亲代AA与aa杂交这个经典杂交类型。从亲代基因型之间的交配方式这个角度来看,哈迪温伯格法则只适用于交配双方的两个亲本同时都是Aa型杂合子这一种特殊的交配形式。根据孟德尔的分离原理,我们知道,一旦要产生AA:2Aa:aa为1:2:1比例的后代个体群,其亲代、后代的基因A和a,就必须是等量的,即A:a为1:1;数量上(AA+2Aa):aa为3:1,这样一来,后裔基因型AA:aa之间在理论上也就必须是1:1的比例关系了;如果一定要用频率来表达基因之间的数量关系,则p=q,p:q=1:1,表示父本基因的数量恒等于母本基因的数量。

     假如后代群体能够满足AA:Aa:aa为1:2:1的基因型之间的数量比例,必然意味着基因A的数量频率恒等于基因a的数量频率,p=q。但是哈迪温伯格法则允许p≠q,从遗传学的角度来看,这是与AaXAa=AA:2Aa:aa的遗传学规定自相矛盾的,我们也可以说,只要p≠q,就意味着基因A的数量和基因a的数量是不相等的,哈迪温伯格法则就失去了相对应的遗传学基础,也就是说,当p≠q时,群体中A基因的数量不等于a基因的数量时, 哈迪温伯格法则就彻底失去了生物遗传学的意义。

     8

     如何解释亲本基因频率p和q的不相等

     根据一个基因型等于一个父本基因加上一个母本基因的遗传原则,群体中的任何一种基因型也必然是由等比例的父母本基因相加的、和的关系,即AA=A+A,Aa=A+a,aa=a+a。

     在《数量遗传学导论》一书中,作者假设了一个理想的例子,他们假定有100个个体,含有A和a两种基因,按照下表,对这100个个体进行了基因型的分类和计数。书中写道,"每一个体包含两个基因,这样我们计数了这个位点上的200个基因的代表。每一个AA个体包含两个A基因,每一个Aa个体包含一个A基因。因此,样本中就有120个A基因和80个a基因。进而A的频率是60%或0.6,a的频率是40%或0.4"。

     我们把这个例子进一步整理成符合哈迪温伯格法则常用的那种表格:

    

     表5、假设的基因型数量与频率

     尽管在表中,后裔群体中的Aa基因型没有被表达成2Aa,但是其数量为60个,就已经比30个AA型多了一倍了,对于AA而言,这就是2Aa的数量比例,Aa:AA=2:1。但是,这60个Aa却是10个aa的六倍,因此,对于aa而言,是6Aa:aa的数量比例,Aa:aa=60:10=6:1。根据前面的分析,在这100个基因型的群体中,30个AA和60个Aa都是显性性状,只有10个aa是隐性性状,显性:隐性为之比9:1(90:10),这个显性:隐性=9:1的比例根本就没有满足AaXAa后代群体中显性:隐性为3:1的性状比例要求,所以也必然不可能满足后代群体AA:2Aa:aa的1:2:1基因型比例要求,AA:Aa:aa成了3:6:1。

     对于观察值AA:Aa:aa不满足1:2:1这个比例,我们至少可以有两种以上的解释。第一种解释就是书上所言,"杂合体(观察值)过多可由纯合体的选择淘汰引起,也可由亲本世代中雄性和雌性的基因频率不同引起"。 前面已经提到,这个解释中"纯合体的选择淘汰"实际上承认了群体中存在着进化压力、存在着不够充足的繁殖率、也许后代的存活率也不够充分,这与哈迪温伯格法则有关理想的遗传条件的规定显然是自相矛盾的,并不满足哈迪温伯格法则的理想的前提条件。现在我们已经清楚了,哈迪温伯格法则规定的所谓的遗传理想条件,就是不允许生物群体出现AA:Aa:aa的比例不等于1:2:1。或者可以说,一旦群体的AA:Aa:aa的比例不等于1:2:1,就没有满足理想的遗传条件。第二种解释"亲本世代中雄性和雌性的基因频率不同",明确指出了亲代群体中基因A的数量、比例可以不等于基因a的数量、比例,这就意味着亲本世代中可能已经存在着AA、Aa甚至aa几种基因型,只要多种基因型都存在的情况下,A和a两种基因的数量和比例才有可能不相等,如果只是Aa一种基因型,无论亲代的数量有多少,基因A和a都是恒等的,p:q比例永远是1:1。如果p≠q,AaxAa、AAxAa、AAxAA等各种交配形式就可以按照各自一定的比例同时存在,如果是这样, AA、aa基因型的出现必然就突破了哈迪温伯格法则对亲代基因型交配形式的规定,观察值就是包括AaxAa在内的表4所列几种基因型之间交配后的综合的结果了。这样解释也许可以更好的理解观察值的来历,但是哈迪温伯格法则却因此完全失去意义了,因为哈迪温伯格法则只能解决AaxAa这一种交配方式。分析至此,哈迪温伯格法则成立的遗传基础已经完全不存在了。

     如果当年孟德尔的豌豆试验同时采用了AaxAa、AAxAa、AAxAA这几种显性个体之间的杂交,在足够充分、数量巨大的F2代群体中观察到的显性与隐性比例也就一定不会是3:1的性状比例了,他也肯定无法推测出AA:aa是1:1,AA:Aa:aa是1:2:1这样一些结论。如果哈迪温伯格法则确实以AaxAa为唯一的交配方式,其后裔就必须要满足AA:Aa:aa为1:2:1这个众所周知的比例,否则,哈迪温伯格法则本身代表遗传的"理想条件"就无从说起了。

     理论上讲,亲本AaxAa交配,亲本基因A的频率p与亲本基因a的频率q必须相等,p=q,后裔基因型AA:Aa:aa的比例必须满足1:2:1这样的比例,显隐性之比必须是3:1。只有当群体中A基因与a基因的数量频率完全相同时,哈迪温伯格法则本身才能满足孟德尔遗传分离律中AaXAa=AA+2Aa+aa的基本原则,才能作为判断群体遗传条件是否理想的标准。

     9

     哈迪温伯格法则没有看到的理想条件

     继续分析上述AA:Aa:aa为30:60:10的例子。假如这就是一种总体上符合了实际亲本基因型交配方式的群体,是客观存在的、观察到的群体,那么,我们可以假设,在这个100个个体的群体中,其亲本群体中本来就可能同时存在着AA、Aa和aa三种基因型。由于基因型AA和Aa的表现型都是显性性状,在实践中我们不可能凭借肉眼观察就从90个显性性状中区分出哪30个是AA、哪60个是Aa,他们都是同一种显性性状。我们能够观察到的只有那10个隐性的性状,它们和90个显性性状有着可以观察到的明显的表观差别。

     根据表4,我们知道,隐性性状后代能够产生aa基因型的亲代交配方式有三种,分别是1,AaxAa=AA :2Aa :aa,后代群体中有1/4的aa型基因;2,aaxAa=Aa :aa,后代群体中有1/2的aa型基因;3,aaxaa=4aa、后代群体全部都是aa基因型。

     aaxAa和aaxaa这两种亲代基型交配中,必然存在着亲代中有aa基因型,但上述例子并未指出亲代群体中究竟有哪些基因型,而且哈迪温伯格法则是以AaxAa=AA :2Aa :aa=1:2:1为遗传基础的,所以,我们首先假定亲本中全部是显性基因型(AA和Aa),没有一个亲代基因型是aa型,因此,就排除了aaxAa和aaxaa这两种亲代基因型交配方式。那10个aa型因此全部都是Aa与Aa交配的结果,根据1:2:1的分离比例规定,我们知道,Aa与Aa交配后,在理想的充分遗传并充分存活的状态下,后裔中如果出现10个aa基因型,那也就最多可能产生10个AA、20个Aa基因型,因为减数分裂、孟德尔分离律和哈迪温伯格法则都规定了AA:Aa:aa的比例是1:2:1。AaxAa的交配方式已经决定了当群体中aa基因型的数量为10个时,最多也就只能有10个AA基因型和20个Aa基因型,这已经是充分交配、充分繁殖、全部存活的理想的遗传分离比例了。一旦确定了aa基因型的数量,实际上AA和Aa两种基因型的数量也就按1:2:1的比例自动的规定好了。当群体的数量无穷大时,所有基因型的数量与频率也必须是符合理想的遗传条件的,否则哈迪温伯格法则设置的那些理想条件就纯属多余的。

     但是在数量为AA:Aa:aa为30:60:10的这个群体中,比10:20:10还多出来了20个AA、40个Aa基因型,占了群体总数量的60%,而且还都是显性的性状,显然这60个基因型就不能够再用AaxAa这种亲本基因型交配方式来解释了,因为10个aa的理想数量已经限制了AaxAa的全部后代的总数量只能达到40个。剩余的这20个AA、40个Aa也不好用统计误差来解释,因为它们的数量实在是太大了。

     我们也可以从另外一个角度来分析这个问题。亲代AaxAa后代中,假如有些后裔基因型并未获得遗传、或者某些基因型也未存活到我们对群体进行观察之时,比如有一部分aa基因型未存活下来,导致群体中总的aa基因型数量比例下降了。由于AaXAa的交配方式始终会产生AA:Aa:aa为1:2:1的后裔群,现在这一百个个体中,AA:Aa=30:60=1:2,完全符合理想的AaXAa交配方式的遗传规律,10个aa显然就是aa基因型的遗传率、存活率方面出了问题,群体整体遗传似乎是满足了AaXAa交配方式下的理想条件了。这样思考问题表面上没有什么大的问题,基因型比例问题勉强解释过去了。但是请注意,这样一来,基因A的频率就必然等于基因a的频率,p=q,才能够满足AaXAa方式的理想条件,而上述例子中的给定的p=0.6,q=0.4,既然亲本p≠q,从根本上就不能套用AaXAa=Aa+2Aa+aa这个哈迪温伯格法则规定的理想的遗传公式了。由此不难看出,哈迪温伯格法则在遗传原理上本身就是一个自相矛盾的定义,是一个理论上无论如何也无法达到平衡的公式,除非,平衡首先满足p=q。而一旦满足了p=q,基因A的数量与基因a的数量完全等同了,也就不需要哈迪温伯格法则了。

     除了能够满足亲本以AaXAa交配产生的那40个基因型后裔之外,还有60%这么大数量的遗传比例为什么都没有达到哈迪温伯格平衡呢,原因是什么呢?其实是哈迪温伯格法则本身就没有反映出理想的、充分的繁殖状况!就是因为在哈迪温伯格法则中,基因A的数量是可以不等于基因a的数量的,即A:a≠1:1,p≠q。由于Aa与Aa交配产生AA:Aa:aa为1:2:1这种理想的遗传数量比例在理论上只能建立在p=q的基础上,亲代基因A和a数量必然是一样多的,当亲代p≠q时,意味着父本A基因的数量不等于母本a基因的数量,而个体Aa是要求父母本基因A:a为1:1的,绝不可能出现只要父本而缺乏母本的基因型,反之亦然,所以,Aa基因型必须父母本基因型1:1,这是两性生物成对同源等位基因二倍体基因型合子的根本要求。一旦P≠q,哈迪温伯格法则就违背了二倍体基因型的根本定义。

     多出来的20个AA和40个Aa,是完全可以用AAxAA=4AA和AAxAa=2AA : 2Aa以这些类型的亲代基因型交配方式加以解释的,因为在群体中基因A与基因a的比例不相等的情况下,各种基因型之间的交配就都有可能存在。也只能在亲代群体中就存在着Aa之外的其他两种基因型AA和aa,才可能导致基因A的数量与基因a的数量与比例不同,也才可能因为有几种基因型之间的交配、繁殖而导致后代群体中几种基因型频率的不同比例。本例中尚有60%的后裔全部都是显性性状,我们只是无法确切知道AA后代基因型的不同数量比例而已,但是可以肯定,假如那10个aa基因型已经代表了它们的理想遗传状态时,这多出来的60%显性性状的后裔就不再可能是AaxAa亲本交配的结果、而只能是与AA基因型有关的遗传结果了。

     现在我们再回过头来看一看表1例举的冰岛人血型测定的结果。总共测定了747例基因型,其中MM型233例,MN型385例,NN型129例;基因频率p= 0.5696,q= 0.4304。在这个例子中, MN的数量与NN的数量相差很大,MM:NN不是1:1,已经提示偏离了哈迪温伯格法则的理想条件,即需要MM:NN=1:1,MM:2MN:NN,才能算得上满足了哈迪温伯格法则的理想条件。而p≠q,说明其亲本群体的基因型肯定不止MN这一种类型,很可能在亲本群体中已经同时存MM、MN和NN三种类型的基因型。每一种基因型必然是由某些种类亲本基因型交配而来的,假如129例NN基因型全部是亲本MN基因型之间充分交配繁殖而来,属于MNXMN,那么MM基因型的数量也会是129例左右,2MN基因型的数量会在258例左右,这样才能满足MN基因型充分交配繁殖这些条件,也才能够完全满足哈迪温伯格平衡要求的MM:2MN:NN=1:2:1的理想遗传模式。由于哈迪温伯格平衡只反映了MN与MN交配这一种情况,所以按照哈迪温伯格法则来判读实际测量的基因型频率与理论值之间的差别,是存在严重偏差的,MM型的实际值为233例,比129例的最大值多出了104例;MN型实际值为385例,比最大允许值多出了127例,原因是群体里的N基因太少了,能够和M基因按比例配对的N基因受到了129这个最小数量的限制。哈迪温伯格平衡本身在父母本两个基因的数量比例上是矛盾的、不平衡的。

     我们的结论是,当父母本两种基因A和a的数量不相等、频率不相等,即A:a≠1:1,p≠q时,就不再适用AaxAa=AA: 2Aa :aa这种两性交配方式了,而AaxAa=AA: 2Aa :aa是哈迪温伯格法则唯一规定的理想遗传模式。所以,在遗传原理上,哈迪温伯格法则本身是不平衡的、是不能够满足哈迪温伯格法则自己定义的"理想条件"的。

     10

     哈迪温伯格法则涉及到的数学问题

     哈迪温伯格法则认为在一个不发生突变、迁移和自然选择的无限大的随机分配的群体中,常染色体上的基因,无论群体起始时基因频率如何,只要经过一代的随机交配,群体的基因频率和基因型频率即达到平衡并将逐代保持不变。哈迪温伯格法则是用数学公式来表达这种遗传学观点的,见表1。

     哈迪温伯格法则使用基因频率的乘积来代表基因型的频率,AA基因型的频率=pxp,2Aa的频率=2pq,aa频率=qxq。那么,为什么要用乘法呢?乘法的遗传学意义何在呢?

     一个父本基因加上一个母本基因,就组成了一个基因型,这是遗传的基本原则。群体中有多少个个体(群体的总数量),就有多少个基因型。群体中基因的总数因此是群体数量的两倍。群体中每一种基因占基因总数的百分比,就是基因的频率;群体中每一种基因型占群体总数量的百分比,就是基因型的频率。

     数学常识告诉我们,频率、百分比都是表达比例的方式,属于倍比关系,频率首先是分数,而且没有计数、计量单位。而群体中的基因型数量、基因的数量,属于以"个"、“种”为单位的计数单位,而且只能是整数。

     我们先看看以数量计数基因的情况。例如在同一群体里,100个基因中,有60个A基因,还有40个a基因,根据两个基因组成一个基因型的原则,该群体中Aa基因型的数量永远不可能超过40个,因为a基因只有40个,不可能用40个a基因去组成60个Aa基因型,这是一个漏桶原理,60个Aa基因型是需要60个a基因的。所以,当p>q时,Aa基因型的频率只能≦q,反之亦然。

     我们再来看看用频率取代整数计数的情况。这100个基因中,有60个A基因,为60%;还有40个a基因,为40%。A基因与a基因组成Aa基因型时,60%A基因与40%的a基因组成了Aa基因型,这种提法是有违遗传学基本原理的,因为60%与40%这两个比例都还没有还原成具体多少个可以计数的基因单位,即多少个父本和多少个母本。60%、40%仅仅只是比较群体中两种不同种类的基因的相对数量的比较尺度,不是具体基因的计数单位,不可能60%的父本和40%的母本能够完全配对成100%的基因型,100%的基因型只能是50%的父本基因加上50%的母本基因。

     假如用60%的A基因乘以40%的a基因,意味着一个A基因的60%部分被另一个a基因放大了0.4倍,这在数学推理上是没有问题的,乘法就是将相同的数快速相加的方法,就是0.4个60%的A基因相加的意思。但百分比相乘这种方法在遗传学逻辑上却是讲不通的,因为基因永远是一个父本加一个母本才能构成一对同源等位基因的,所以基因是整数,不可能出现按百分比拆分、又按百分比倍增的基因、基因型这样的数学逻辑。

     我们再看一下这个例子,完全用哈迪温伯格法则乘法的方式计算的后代基因型的频率。

    

     表6、用基因频率的乘积计算基因型的频率

     由于父母本两个基因组成一个基因型的遗传原理决定了基因型永远是两个基因相加,而不是父母本两个基因相乘。

     而哈迪温伯格法则的乘法运算结果,使观察的基因型数量(AA和aa各50个、Aa100个)与计算出的基因型数量(AA和aa各25个、Aa为50个)完全不一致,计算值比实际值在上述例子中缩小了一倍,正好是缩小了50%。这不是巧合,而是乘法原则的数学作用,哈迪温伯格法则让每一个基因都以特定的比例与另一个基因的数量比例相乘,由于这两个比例都小于1,所以基因的比例会被进一步缩小。哈迪温伯格法则丝毫没有反映出两个基因决定一个基因型这个遗传学的整数原理,哈迪温伯格法则让一个完整的、独立的基因可以按照任何比例被分割。最令人感到讽刺的是,与哈迪温伯格法则所主张的一代以后群体里的基因频率、基因型频率会保持不变这个理论正好相反,按照各种比例之间的乘法运算的结果恰恰提示,当基因一代一代传递的时候,群体里的基因频率和基因型频率都将不可能保持不变,而是会以指数级别不断的变化。

     没有任何一种生物个体(一个个体)可以由父本基因的一部分(百分比)和母本基因的一部分(百分比)共同构成一个完整的基因型,而只能是全部父本基因和全部母本基因。所以哈迪温伯格法则是绝对不能用来讨论单个的个体基因型的,因为哈迪温伯格法则不但允许父母本基因可以数量不相同,而且还允许父母本基因各自只用一部分进行交配。而在一个群体中,这当然是哈迪温伯格法则最关注的,数量众多的基因型中,比如例举的那100个基因型,当然是一部分A基因和一部分a基因按照各自的比例共同组成的,例如上述例子中,就是50%的A基因(50个)与另外50%的A基因(50个)共同组成了50个AA基因型,100%的A基因数目是100个。但是在哈迪温伯格法则中,原本50%的A基因加入另外50%的A基因这层遗传学意义,被乘法运算改变成了50%的A基因乘以另外50%的A基因,这两个基因的相对比例的乘积代表了什么样的生物遗传机制呢?我们不得而知。历史上,哈迪和温伯格从来就没有解释过哈迪温伯格法则为什么要选择基因的比例进行乘积运算这种数学模式来对应什么样的遗传学原理。

     在哈迪温伯格法则中规定了AA=P2,2Aa=2pq,aa=q2,如果这三个等式可以成立,首先就把基因、基因型和他们的频率彻底混为一谈了,本来应该进行绝对数量计数的基因就变成了基因的相对频率,变成了基因的数量百分比,即A=p,a=q,两个基因组合在一起的基因型更被表达成了两个基因频率之间的乘积,即AA=P2,2Aa=2pq,aa=q2,这就有悖于父本基因加母本基因组成一个基因型的遗传学基本常识了。这些频率的乘积又都是百分比之间的乘积,是基因之间按照一定的比例相乘,基因的一定比例,就是基因的一部分,一个完整的基因被这样被比例被分割了。

     我们知道,基因、基因型(性状)都是具体的物质形态,具有定性的、物质的属性,当然也就具有物质的完整性;而所有的频率都是这些物质之间的数量比例,频率因此只具有数量比较关系的属性。频率也没有单独计算基因、基因型绝对数量的属性,必须要结合群体总数量才能计算某种基因、某种基因型的绝对数量。哈迪温伯格法则简单粗暴又直接的把基因和基因型的生物本质特征等同于群体中的相对数量比例关系了,这是令人根本无法理解的。

     此外,不管AA、aa两种基因型的频率是否可以按照pxp、qxq的方法进行计算,哈迪温伯格平衡中涉及到的2Aa和相关频率2pq,在p≠q时,则无论如何都是不能成立的,原因就在于漏桶原理的限制。当A的数量不等于a的数量时,Aa数目的最大值就等于或小于数量少的那个基因数,即所有的a基因都组成了Aa基因型,在Aa基因型中,a基因和A基因的比例是恒等于1:1的。当p≠q,Aa基因型的数量因此是不可能满足哈迪温伯格平衡中的2pq的,因为哈迪和温伯格并没有给出组成Aa之外基因型的任何前提条件。例如群体里有90个A基因,p=0.9;有10个a基因,q=0.1,充分组合后,最多也只能够产生20个Aa基因型,在这里Aa基因型的最大数量就是受限于数量少的那个a基因的数量,因为每一个Aa基因型中都有一个a,尽管A有90个,但a只有10个,因此2Aa也最多只能有20个。我们不可能获得(90A+10a)/2=50个Aa基因型,因为这种理解突破了最少基因数目的漏桶原理的限制,无形中还把40个A基因错误的当成了a基因了;当然,我们更不能够理解2pq=2x0.9x0.1x100=18个Aa基因型,而这种不知所云的计算恰恰却是哈迪温伯格平衡公式的核心。哈迪温伯格法则中2pq这个频率值,缺乏任何的限制性条件,也完全脱离了遗传的基本面,当然更没有考虑到最少基因数目的限制,是完全没有任何道理可言的。

     也许正是由于缺乏遗传原理的支撑,哈迪温伯格法则永远都是达不到平衡的,用这个法则计算出来的群体中的基因型、基因频率,根本无法用遗传学观点去理解。更加诡异的是,哈迪温伯格平衡计算出的结果总是不能还原到初始的数据,也就是被他们解释成"理论值"的那个结果。在表5中,实际的AA基因型有30个,Aa基因型有60个,aa基因型有10个。经过哈迪温伯格平衡用P2+2pq+q2数学模型的一番复杂的计算后,认为理论值的AA应该是36个,而Aa只能有48个, aa应该有24个。哈迪温伯格平衡计算出来的这些"理论值",既不能满足AA:Aa:aa为1:2:1的最理想基因型比例,又与观察到的群体中AA:Aa:aa为30:60:10的实际数据相差甚远,我们怎么可能去相信没有作出任何合理的遗传学解释的哈迪温伯格法则呢?

     由于基因、基因型(合子)与基因频率、基因型频率各自代表着不同的意义,所以应该小心的把这四个概念的适用范围搞清楚。我们可以很肯定的讲,群体基因型的频率既不能简单的等同于基因频率之和,更不能毫无理由的等同于基因频率之乘积。基因频率就是基因频率,因为基因只有显性、隐性两种;而显隐性的基因型却有三种,三种基因型共有六种交配方式,这六种交配方式又能够产生各种比例的三种基因型后裔,在这么多不可知变量同时存在的情况下,根本就不可能用显、隐性两种基因中的一种频率来计算出基因型的频率,反之亦然。

    

     长按二维码关注我们

    源网页  http://weixin.100md.com
返回 健康探理 返回首页 返回百拇医药