概率分布-正态分布.ppt
《概率分布-正态分布.ppt》由会员分享,可在线阅读,更多相关《概率分布-正态分布.ppt(59页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第五讲 概率分布正态分布【典型案例分析典型案例分析】举例:举例:随机调查某医院随机调查某医院14021402例待分娩孕例待分娩孕妇,测得她们的体重,试述其体重频数分妇,测得她们的体重,试述其体重频数分布的特征。布的特征。引子:引子:表表5-1 某医院某医院1402例分娩孕妇体重频数分布例分娩孕妇体重频数分布 若将各直条顶端的中点顺次连接起来若将各直条顶端的中点顺次连接起来,得一条折线。当样得一条折线。当样本量本量n越来越大时,折线就越来越接近一条光滑的曲线越来越大时,折线就越来越接近一条光滑的曲线。图5-1 体重频率密度图 图5-2 概率密度曲线示意图 推推 断:断:测得一个孕妇体重在测得一个
2、孕妇体重在54-68kg54-68kg的概率有多大?的概率有多大?孕妇体重在哪个范围内算是正常的呢?孕妇体重在哪个范围内算是正常的呢?故对连续性随机变量而言:故对连续性随机变量而言:变量某区间取值的概率变量某区间取值的概率 =正态曲线该变量区间的面积正态曲线该变量区间的面积一、正态分布的概念和密度函数 正态分布正态分布(normal distribution):是:是描述连续型描述连续型随机变量最重要的分布。其分布曲线叫正态分布随机变量最重要的分布。其分布曲线叫正态分布曲线,呈中间高,两边低,左右基本对称的曲线,呈中间高,两边低,左右基本对称的“钟钟型型”曲线,曲线,近似于数学上的正态分布,近
3、似于数学上的正态分布,又称高斯又称高斯分布(分布(Gauss distribution)。正态分布正态分布(normal distribution)德莫佛最早发现了二项概率德莫佛最早发现了二项概率的一个近似公式,这一公式被的一个近似公式,这一公式被认为是正态分布的首次露面。认为是正态分布的首次露面。正态分布在十九世纪前叶由正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯加以推广,所以通常称为高斯分布高斯分布(Gauss distribution)。德莫佛德莫佛高高 斯斯10马克的钱币马克的钱币 医学研究中许多正常人的生理,生化指标、测医学研究中许多正常人的生理,生化指标、测量误差等多呈正
4、态分布或近似正态分布。量误差等多呈正态分布或近似正态分布。许多非正态分布资料,当样本含量足够大时,许多非正态分布资料,当样本含量足够大时,也可以用正态分布作为它的极限分布形式。也可以用正态分布作为它的极限分布形式。有时也可将非正态分布资料转化为正态分布来有时也可将非正态分布资料转化为正态分布来处理。处理。正态分布在医学研究中的重要作用:正态分布在医学研究中的重要作用:医学研究中:医学研究中:正态分布的密度函数正态分布的密度函数,即正态曲线的函数表达式:即正态曲线的函数表达式:式中,式中,为总体均数,为总体均数,为总体标准差,为总体标准差,为圆周率,为圆周率,e为为自然对数的底,仅自然对数的底,
5、仅x为变量。为变量。当当x确定后,确定后,f(x)为为X相应的纵坐标高度,则相应的纵坐标高度,则X服从参数服从参数为为和和2的正态分布(的正态分布(normal distribution),记作,记作XN(,2)。)。当给定不同的当给定不同的 x 值后,就可以根据此方程求得相应的值后,就可以根据此方程求得相应的纵坐标高度(频数),并可绘制出正态曲线的图形,纵坐标高度(频数),并可绘制出正态曲线的图形,记记作作XN(,2):正态分布曲线正态分布曲线:高峰位于中间,两侧逐渐下降并完全对:高峰位于中间,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的称,曲线两端永远不与横轴相交的“钟型钟型”曲线。
6、曲线。当当固定不变时,固定不变时,越大,曲线沿横轴越大,曲线沿横轴越向右移动;反之,越向右移动;反之,越小,则曲线沿横轴越向左移越小,则曲线沿横轴越向左移动,所以动,所以叫正态曲线叫正态曲线N(,2)的)的位置参数位置参数,。1.位置参数:位置参数:图图5-4 正态分布位置随参数正态分布位置随参数变换示意图变换示意图=1=1.5=22.形状参数形状参数:图图5-6 正态分布形态随参数正态分布形态随参数变换示意图变换示意图 当当固定不变时,固定不变时,越大,曲线越平阔;越大,曲线越平阔;越小,曲线越尖峭,越小,曲线越尖峭,叫叫正态曲线正态曲线N(,2)的)的形形状参数状参数。(二)(二)正态分布
7、图形的特征正态分布图形的特征:1.对称性:关于对称性:关于x=对称对称2.集中性:集中性:正态曲线在横轴上方,正态曲线在横轴上方,当当x=时时,f(x)取最大值,即均数位于曲线的最高处。取最大值,即均数位于曲线的最高处。3.对对频率密度正态分布图,横轴上频率密度正态分布图,横轴上曲线下的面积为曲线下的面积为1。4.是正态曲线的位置参数,决定曲线在横轴上的位置;是正态曲线的位置参数,决定曲线在横轴上的位置;增大曲线沿横轴向右移,增大曲线沿横轴向右移,减小曲线沿横轴向左移。减小曲线沿横轴向左移。5.是正态曲线的形状参数,是正态曲线的形状参数,越大数据越分散,曲线越越大数据越分散,曲线越“矮胖矮胖”
8、,越小数据越集中,曲线越越小数据越集中,曲线越“瘦高瘦高”。三、正态曲线的标准化 为了应用方便,常将正态概率函数中的为了应用方便,常将正态概率函数中的 x 作如作如下变量代换,令:下变量代换,令:Z称为标准正态变量。把称为标准正态变量。把u代入概率密度函数代入概率密度函数,得标准正态分布的概率密度函数:,得标准正态分布的概率密度函数:相对于正态变量相对于正态变量 x,Z 没有度量单位。根据没有度量单位。根据 u 的不同取值,可绘出标准正态分布的图形。的不同取值,可绘出标准正态分布的图形。sm-=xZ+-=ueZu,21)2/pj-(2任意正态分布曲线任意正态分布曲线 XN(,2)标准正态分布曲
9、线标准正态分布曲线XN(0,1)将一般正态分布曲线的将一般正态分布曲线的 的位置平移到原点,再的位置平移到原点,再以标准差以标准差为横轴单位,这样就把原来个别的正态分布为横轴单位,这样就把原来个别的正态分布转换为一般的标准正态分布转换为一般的标准正态分布 N(0,1),亦称为),亦称为Z分布分布(或(或 分布分布)。)。四、正态曲线下面积的分布规律正态曲线下的面积分布有一定的规律性:正态曲线下的面积分布有一定的规律性:因正态曲线下累计频数的总和等于因正态曲线下累计频数的总和等于 100%或或 1,则:,则:横轴上曲线下的面积(概率)就等于横轴上曲线下的面积(概率)就等于 100%或或 1;均数
10、两侧的面积(概率)各占均数两侧的面积(概率)各占 50%。实实际际工工作作中中常常需需了了解解横横轴轴上上某某一一区区间间曲曲线线下下面面积积占占总总面面积积的的百百分分比比,以以便便估估计计该该区区间间的的频频数数占占总总频频数数的的百百分分比比(即即频频数数分分布布情情况况)。这这就就需需要要采采用用定定积积分分的的办办法法,对对函函数数式式(1)或或(2)定定积积分分,算算得得从从-到到 x,或或从从-到到 Z 的的累累计计面面积积(概概率率)。.图 6 正态分布(左)及标准正态曲线下(右)的累计面积ZdZZ-=2221)(pjeZZ-/由于引入了标准正态变量由于引入了标准正态变量 Z
11、值,只需对标准正值,只需对标准正态公式求定积分,求其曲线下从态公式求定积分,求其曲线下从-到任意到任意Z 值的累值的累计面积,并制成专用的计面积,并制成专用的 Z 值表(见附表);这样值表(见附表);这样对对于其它任意的正态分布于其它任意的正态分布N(,2),都可以通过变量,都可以通过变量代换转化为标准正态分布代换转化为标准正态分布,通过查表就完成其概率,通过查表就完成其概率计算问题。计算问题。1.左半侧左半侧 Z 值对应面积的查法:值对应面积的查法:1.标准正态分布区间(标准正态分布区间(-1,1)的面积占总面积的)的面积占总面积的68.26%2.标准正态分布区间(,)的面积占总面积的标准正
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 分布 正态分布
限制150内