《生物统计学教案(2).pdf》由会员分享,可在线阅读,更多相关《生物统计学教案(2).pdf(10页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、生物统计学教案第三章几种常见的概率分布律教学时间:3 学时教学方法:课堂板书讲授教学目的:重点掌握正态分布,掌握二项分布,了解泊松分布,中心极限定律。讲授难点:正态分布、二项分布3.1二项分布(重点)3.1.1二项分布的概率函数满足二项分布的条件:1、在一随机试验中,每次试验都有两种不同的结果。2、两种结果是互不相容的。3、每一种结果在每次试验中都有恒定的概率。4、试验间应是独立的。独立地将此试验重复n次,求在n此试验中,一种结果出现x次的概率是多少?例:从雌雄各半的 100 只动物中抽样,抽样共进行 10 次,问其中包括 3 只雄性动物的概率是多少?包括 3 只及 3 只以下的概率是多少?即
2、求P(X3)和P(X3)该例符合二项分布的条件。规定以下一组符号:n 试验次数 x 在n次试验中事件A出现的次数 事件A发生的概率(每次试验都是恒定的)1 事件A发生的概率 p(x)=x的概率函数P(Xx)(累积分布函数)F(x)=P(Xx)上例中:n=10 x=3=0.5求p(3)和F(3)。在一次抽样中抽到的结果为:mmmfffffff,它的概率为 P(mmmfffffff)=3(1-)7抽到 3 雄 7 雌的数目相当于从 10 个元素中抽出 3 个元素的组合数3 3p p 3 3 C C1010 3 3 1 1 7 7对于任意n和x有以下通式:px Cxnx1nx,x 0,1,2,n上式
3、称为二项分布的概率函数。该式正是二项展开式的第x+1 项,因而产生“二项分布”这一名称。因为(1)1,所以 p p x x x x 0 0n n 1 1 n n 1 1将x0,1,2,3,代入二项分布概率函数,可以得出出现 0,1,2,3 只雄性动物的概率。P(0)0.0009766P(1)0.0097656P(2)0.0439453P(3)0.1171876抽到 3 只和 3 只以下雄性动物的概率为:F(3)P(0)P(1)P(2)P(3)0.17187513.1.2服从二项分布的随机变量的特征数平均数:n或方差:2n(1-)或 2 2 3.1.3二项分布应用实例 1 1 n n例1以杂合基
4、因型Wvwv的小鼠为父本,隐性纯合子小鼠wvwv为母本杂交(wv波浪毛,Wv 直毛),后代两种基因型的数目应各占一半。实验只选每窝8 只的,多于8 只和少于 8 只的都淘汰。结果列在下表中。直毛后代数观测频数(x)(f)fx fx2p(x)Np(x)0 0 0 0 0.003906 0.1249921 1 1 1 0.031250 1.0000002 2 4 8 0.109375 3.5000003 4 12 36 0.218750 7.0000004 12 48 192 0.273437 8.7499845 6 30 150 0.218750 7.0000006 5 30 180 0.109
5、375 3.5000007 2 14 98 0.031250 1.0000008 0 0 0 0.003906 0.124992总数 N32 139 665 0.999999 31.99968样本平均数、总体平均数;样本方差、总体方差如下:3232 1 1 n n 8 8 4 4.000000000000 2 2 fxfx 2 2fxfx139139 x x 4 4.343750343750N Ns s2 2 fxfx N N2 2N N 1 11391392 2665665 3232 1 1.974798974798 3131 2 2 n n 1 1 2 2例 2遗传学中单因子杂交RRrr,
6、F1代为Rr,F1自交,F2基因型比符合二项分布。在F2中P(R)1/2,P(r)11/2,n2。展开二项式:1 1 2 2 2 2 2 2 1 1 1 1 2 2 1 1 2 2 2 2 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 21 1 RRRR 1 1 RrRr 1 1 rr rr 4 42 24 4对于两对因子,n4在为人类或动物遗传学研究中,为了保证实验顺利完成,在制定试验计划时,首先要以指定概率求出所需样本含量 n。例 3用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔杂交,F1代为黑色正常毛1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
7、 1 4 4 4 4 6 6 4 4 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 14 46 64 41 1 161616161616161616161/16bbrr。问最少需要多少F2代家兔,才能以 99的概率得到一个棕色短毛兔?答:n(15/16)n 0.014 43 32 22 23 34 4长的家兔(BbRr),F1代自交,F2代表型比为:9/16B_R_:3/16B_rr:3/16bbR_:n(lg15lg16)lg0.01 -0.02803n2.00000n71.43.2泊松分布3.2.1泊松分布的概率函数在二项分布中,当某事件出现的概率特别小(0),而样本
8、含量又很大(n)时,二项分布就变成泊松分布了。泊松分布是描述在一定空间、长度、面积、体积或一定时间间隔内,点子散布状况的理想化模型。泊松分布的概率函数为:p p x x x xx x!e e,x x 0 0,1 1,2 2,3.2.2服从泊松分布的随机变量的特征数泊松分布的平均数:可见,泊松分布的平均数就是泊松分布概率函数中的。泊松分布的方差:2 概率函数中的不但是它的平均数,而且是它的方差。3.2.3泊松分布应用实例例 1在麦田中,平均每10m2有一株杂草,问每100m2麦田中,有0 株、1 株、2株、杂草的概率是多少?解:先求出每 100m2麦田中,平均杂草数 100/10 10 株将代入
9、泊松分布的概率分布函数中,p(x)=10 x/x!e10,即可求出x 0,1,2,时所相应的概率。结果如下:x5 6 7 8 9 10p(x)0.0671 0.0631 0.0901 0.1126 0.1251 0.1251 11 12 13 1415 0.1137 0.0948 0.0729 0.0521 0.0835例 2绘制遗传连锁图时,制图函数是通过泊松分布推演出的。在一对同源染色体之间交换的出现是服从泊松分布的,将x0 代入泊松分布的概率函数中,p p 0 0 0 00 0!e e e e 得出两基因座之间无交换出现的概率。两基因座之间至少出现一次交换的概率P(x1)=1e-。从遗传
10、学理论可知,在两基因座之间大于等于 1 的任何有限次交换其重组频率恒等于 50。因此重组率RFRF 解出两基因座之间的平均交换次数=ln(12RF)1 11 1 e e 2 2 两基因座之间平均交换一次,其图距为 50m.u.,从而可以得出图距 MD50ln(12RF)3.4正态分布(重点)3.4.1正态分布的密度函数和分布函数对于平均数是,标准差是的正态分布,其密度函数为:f f x x 1 1 x x 2 22 2 2 2 2 2 e e,x x ,0 0正态分布密度函数的图象称为正态曲线正态分布曲线以符号N(,2)表示平均数为,标准差为2的正态分布。随机变量 X 的值落在任意区间(a,b
11、)内的概率Pa X b累积分布函数ba1fxdx 2bae2x 22dxF F x x P P X X x x x x f f z z dzdz 1 1 2 2 x x e e z z 2 2 2 2 2 2dzdz3.4.2标准正态分布当0,1 时的正态分布称为标准正态分布,标准正态分布记为N(0,1)。u u 标准正态分布的密度函数为:1 12 2 e eu u2 22 2,u u 标准正态分布的分布曲线如下图 u u P P U U u u 1 12 2 v v2 2 e e2 2 u udvdv标准正态分布曲线累积分布函数分布图如下:标准正态分布的累积分布曲线标准正态分布有以下特性:1
12、、在u0 时(u)达到最大值。2、当u不论向哪个方向远离 0 时,(u)的值都减小。3、曲线两侧对称。4、曲线在u1 和u1 处有两个拐点。5、曲线与横轴所夹面积等于 1。6、累积分布曲线围绕点(0,0.5)对称。3.4.3正态分布表的查法为了简化计算,随机变量(U)的值(u)落在区间(a,b)内的概率,根据标准正态累积分布函数,已经把不同u值的(u)值列成表(附表 2),称为正态分布表。根据以下关系式可以扩展正态分布表的使用范围。P P 0 0 U U u u u u 0 0.5 5P P U U u u u u P P U UP PU U u u 2 2 u u u u 1 1 2 2 u
13、 u P P u u1 1 U U u u2 2 u u2 2 u u1 1 例 1查u0.82 及u1.15 时的(u)值。解:(-0.82)0.20611(1.15)0.87493例 2随机变量U服从正态分布N(0,1),问随机变量的值落在 0,1.21 间的概率是多少?落在1.96,1.96 间的概率是多少?解:1)P(0Uu)=(1.21)-0.5=0.88686-0.5000=0.386862)P(|U|u)=1-2(-u)=1-(-1.96)=1-0.05000=0.95000对于服从N(,2)的随机变量X,首先要进行标准化变换,使之变为标准u u x x 正态分布,再按上述方法查
14、表。变换的方法是:对于随机变量X在对x进行标准化变换后,即可从正态分布表中查出相应的概率值。x x x x P P X X x x P P U U 例 3已知高粱品种“三尺三”的株高X服从正态分布 N(156.2,4.822),求:1)X164 厘米的概率;3)X在 156162 厘米间的概率。解:1 1)2 2)161161 156156.2 2 P P X X 161161 1 1 0 0.84314843144 4.8282 164164 156156.2 2 P P X X 164164 1 1 1 1 1 1.6262 4 4.8282 1 1 0 0.9473894738 0 0.
15、0526205262 162162 156156.2 2 P P 152152 X X 162162 4 4.8282 1 1.2 2 0 0.8787 0 0.8849388493 0 0.1925119251 152152 156156.2 2 4 4.8282 0 0.69278692783 3)3.4.4正态分布的单侧临界值附表 3 给出了满足P(Uu)=时的u值。即曲线右侧尾区一定面积()下,所对应的u值u,u称为的上侧临界值。对于左侧尾区,满足P(Uu/2)=时的u/2称为的双侧临界值。正态分布的单侧(上侧)和双侧临界值3.6中心极限定理假设所研究的随机变量X可以被表示为许多相互独立的随机变量Xi的和,如果Xi的数量很大,而且每一个别的Xi对于X所起的作用很小,则可以认为X服从或近似地服从正态分布。推理:若已知总体平均数为,标准差为,那么,不论该总体是否正态分布,对于从该总体所抽取的含量为n的样本,当n充分大,其平均数渐近服从正态分布 N(,2/n)。
限制150内