分布拟合检验详解.ppt
《分布拟合检验详解.ppt》由会员分享,可在线阅读,更多相关《分布拟合检验详解.ppt(69页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1 1页页4 分布拟合检验4.1 总体分布只取有限个值的情况 设总体X 可以分成k 类,记为 ,现对该总体作了n 次观测,k 个类出现的频数分别为:检验如下假设:n1,nk,且其中诸且假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2 2页页一、诸 pi 均已知如果H0 成立,则对每一类Ai,其频率ni/n与概率pi 应较接近。即观测频数ni 与理论频数npi 应相差不大。据此,英国统计学家K.Pearson提出如下检验统计量:(4.2)并证明在H0 成立时对充分大的n,(7.4
2、.2)给出的检验统计量近似服从自由度为k-1的 分布。拒绝域为:假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第3 3页页例4.1 为募集社会福利基金,某地方政府发 行福利彩票,中彩者用摇大转盘的方法确定 最后中奖金额。大转盘均分为20份,其中金 额为5万、10万、20万、30万、50万、100万 的分别占2份、4份、6份、4份、2份、2份。假定大转盘是均匀的,则每一点朝下是等可 能的,于是摇出各个奖项的概率如下:假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第4 4页页概率0.10.20.30.20.10.1额度5万10万2
3、0万 30万 50万 100万现20人参加摇奖,摇得5万、10万、20万、30万、50万和100万的人数分别为2、6、6、3、3、0,由于没有一个人摇到100万,于是有人怀疑大转盘是不均匀的,那么该怀疑是否成立呢?这就需要对转盘的均匀性作检验。假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第5 5页页解:这是一个典型的分布拟合优度检验,总体 共有6类,其发生概率分别为0.1、0.2、0.3、0.2、0.1和0.1,这里k=6,检验拒绝域为:由本例数据可以算出若取 =0.05,则查附表3知=假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2
4、023第第6 6页页由于 未落入拒绝域,故接受原假设,没有理由认为转盘不均匀。在分布拟合检验中使用p 值也是方便的。本例中,以T 记服从 (5)的随机变量,则使用统计软件可以算出 这个p 值就反映了数据与假设的分布拟合程度的高低,p 值越大,拟合越好。假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第7 7页页二、诸 pi 不完全已知 若诸 由r(rk)个未知参数 确定,即 首先给出 的极大似然估计然后给出诸 的极大似然估计 Fisher证明了 在H0成立时近似服从自由度为k-r-1的 分布,于是检验拒绝域为假设检验假设检验 安徽财经大学安徽财经大学5/23/2
5、0235/23/2023第第8 8页页例4.2 卢瑟福在2608个等时间间隔内观测一 枚放射性物质放射的粒子数X,表7.4.1是观测 结果的汇总,其中ni表示2608次观测中放射粒 子数为i的次数。ni 57 203 383 525 532 408 273 139 45 27 10 6i 0 1 2 3 4 5 6 7 8 9 10 11试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第9 9页页解:本例中,要检验总体是否服从泊松分布。观测到 0,1,11 共 12 个不同取值,这相当于把总
6、体分成12类。这里有一个未知参数,采用极大似然估计,=将 代入可以估计出诸 。于是可计算出假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1010页页列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.5
7、3431.45250.01207.66730.16580.12580.0158合计26081.00002068 =12.8967i假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1111页页本例中 =12.896718.307,故接受原假设。使用统计软件可以计算出此处检验的p 值是0.2295。若取 =0.05,则假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1212页页列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表。例如,对随机抽取的1000人按性别(男或女)及色觉(正常或色盲)两个属性分类,得到如下二
8、维列联表,又称22表或四格表。4.2 列联表的独立性检验假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1313页页男53565女38218性别视觉正常色盲假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1414页页一般,若总体中的个体可按两个属性A与B分类,A 有r 个类 ,B 有c个类从总体中抽取大小为n的样本,设其中有 个个体既属于 类又属于 类,称为频数,将rc个 排列为一个r行c列的二维列联表,简称rc表(表7.4.3)。假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1515页页表
9、4.3 rc列联表假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1616页页列联表分析的基本问题是:考察各属性之间有无关联,即判别两属性是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在rc表中,若以 和 分别表示总体中的个体仅属于 ,仅属于 和同时属于 与 的概率,可得一个二维离散分布表(表7.4.4),则“A、B两属性独立”的假设可以表述为假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1717页页表4.4 二维离散分布表假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第18
10、18页页这就变为上一小节中诸 不完全已知时的分布拟合检验。这里诸 共有rc个参数,在原假设H0成立时,这rc个参数 由r+c个参数 和 决定。在这r+c后个参数中存在两个约束条件:所以,此时 实际上由r+c-2个独立参数所确定。据此,检验统计量为 假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第1919页页在H0成立时,上式服从自由度为rc-(r+c-2)-1的 分布。其中诸 是在H0成立下得到的 的极大似然估计,其表达式为 对给定的显著性水平 ,检验的拒绝域为:假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2020页页例4
11、.3 为研究儿童智力发展与营养的关系,某 研究机构调查了1436名儿童,得到如表7.4.5的 数据,试在显著性水平0.05下判断智力发展与 营养有无关系。表7.4.5 儿童智力与营养的调查数据营养良好营养不良合计 智 商合计342367266329130456402013216423382286345143680 8090 9099 100假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2121页页解:用A表示营养状况,它有两个水平:表示 营养良好,表示营养不良;B表示儿童智商,它有四个水平,分别表示表中四种 情况。沿用前面的记号,首先建立假设 H0:营养状况
12、与智商无关联,即A与B独立的。统计表示如下:在原假设H0成立下,我们可以计算诸参数的极大似然估计值:假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2222页页 进而可给出诸 ,如其它结果见表7.4.6 假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2323页页表4.6 诸 的计算结果 营养良好 384.1677 346.8724 259.7631 313.3588 0.90810.29460.26600.19920.2403营养不良 38.877935.103626.288131.71200.09197.815,故拒绝原假
13、设,认为营养状况对智商有影响。本例中检验的p 值为0.0002。假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2525页页The Applications In Social Sciences法律心理学(测慌)经济学社会学人口学管理科学文学考古假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2626页页The Applications In Social Sciences(法律之一)被告死刑合计是否白人19141160黑人17149166合计36290326数据:美国佛罗里达,1976-1977年凶杀案结论:白人被判死刑的比
14、例为:19/160=11.9%黑人被判死刑的比例为:17/166=10.2%假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2727页页The Applications In Social Sciences(法律之二)被告被害死刑死刑比例是否白人白人191320.126黑人090.000黑人白人11520.175黑人6970.058Contingency Table(列联表)假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2828页页The Applications In Social Sciences(法律之二)B1B2Bs
15、TotalA1n11n12n1sn1.A2n21n22n2sn2.Arnr1nr2nrsnr.Totaln.1n.2n.sn假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第2929页页The Applications In Social Sciences(文学红楼梦)多元统计分析:聚类分析假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第3030页页在IT业中的应用分类、搜索图像或模式识别网络完全(数字签名)假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第3131页页统计在医药卫生中的应用Bio
16、statistics 制药业(比对试验)疾病的诊断(Bayes方法,图模型等)病理分析 疾病的控制假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第3232页页The Applications In Bioinformation假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第3333页页假设检验假设检验 安徽财经大学安徽财经大学5/23/20235/23/2023第第3434页页4.3 正态性检验正态分布是最常用的分布,用来判断总体分布是否为正态分布的检验方法称为正态性检验,它在实际问题中大量使用。一、正态概率纸正态概率纸可用来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布 拟合 检验 详解
限制150内