2022年2022年卡方分布概念及表和查表方法 2.pdf
《2022年2022年卡方分布概念及表和查表方法 2.pdf》由会员分享,可在线阅读,更多相关《2022年2022年卡方分布概念及表和查表方法 2.pdf(4页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、卡方分布概念及表和查表方法若 n 个相互独立的随机变量 ? , ? ,.,n,均服从标准正态分布(也称独立同分布于标准正态分布),则这n 个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。中文名卡方分布外文名chi-square distribution别称西格玛分布提出者Friedrich Robert Helmert提出时间1863应用学科统计学目录1 简介2 定义3 性质4 概率表简介分布在数理统计中具有重要意义。分布是由阿贝 (Abbe) 于 1863 年首先提出的,后来由海尔墨特(Hermert) 和现代
2、统计学的奠基人之一的卡 皮尔逊 (C K Pearson) 分别于1875 年和 1900 年推导出来,是统计学中的一个非常有用的著名分布。定义若 n 个相互独立的随机变量 ? 、 ? 、 、n ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n 个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为分布( chi-square distribution),卡方分布名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - -
3、 - - 其中参数称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。记为或者(其中,为限制条件数)。卡方分布是由正态分布构造而成的一个新的分布,当自由度很大时,分布近似为正态分布。对于任意正整数x, 自由度为的卡方分布 是一个随机变量X 的机率分布。性质1) 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1。2) 分布的均值与方差可以看出,随着自由度的增大,分布向正无穷方向延伸(因为均值越来越大),分布曲线也越来越低阔(因为方差越来越大)。3)不同的自由度决定不同的卡方分布,自由度越
4、小,分布越偏斜。4) 若互相独立,则:服从分布,自由度为。5) 分布的均数为自由度,记为E( ) = 。6) 分布的方差为2 倍的自由度 ( ),记为D( ) = 。概率表分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布 去查,在分布中得对每个分布编制相应的概率值,这通过分布表中列出不同的自由度来表示,卡方分布临界值表在分布表中还需要如标准正态分布表中给出不同P 值一样,列出概率值,只不过这里的概率值是值以上分布曲线以下的概率。由于分布概率表中要列出很多分布的概率值, 所以分布中所给出的P 值就不象标准正态分布中那样给出了400 个不同的 P 值,而只给出了有代表性的13 个值,因
5、此分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 4 页 - - - - - - - - - 查分布概率表时,按自由度及相应的概率去找到对应的值。如上图所示的单侧概率0.05(7)=14.1的查表方法就是,在第一列找到自由度7 这一行,在第一行中找到概率 0.05 这一列,行列的交叉处即是14.1 。表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为 7 的卡方分布中,得到双侧
6、概率为0.05 所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是0.05 ,因此实际上上端点以上的概率为0.05/2=0.025 ,用概率0.025 查表得上端点的值为16,记为 0.05/2(7)=16 。下端点以下的概率也为0.025 ,因此可以用0.975 查得下端点为1.69 ,记为 1-0.05/2(7)=1.69。当然也可以按自由度及值去查对应的概率值,不过这往往只能得到一个大概的结果,因为分布概率表的精度有限,只给了13 个不同的概率值进行查表。例如,要在自由度为 18 的分布查找 =30 对应的概率, 则先在第一
7、列找到自由度18,然后看这一行可以发现与30 接近的有 28.9 与 31.5 ,它们所在的列是0.05 与 0.025 ,所以要查的概率值应于介于0.05 与 0.025 之间,当然这是单侧概率值,它们的双侧概率值界于0.1 与 0.05之间。如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍。为什么从正态总体中抽取出的样本的方差服从分布?在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的n 个正态随机变量1 ,2 ,n 的一次取值,将n 个随机变量针对总体均值与方差进行标准化得(i=1, ,n),显然每个都是服从标准正态分布的,因此按照分布的定义, 应该服
8、从参数为的分布。如果将总体中的方差2用样本方差 s2代替,它是否也服从分布呢?理论上可以证明,它是服从分布的,但是参数不是 n 而是 n-1 了,究其原因在于它是n-1 个独立同分布于标准正态分布的随机变量的平方和。我们常常把一个式子中独立变量的个数称为这个式子的“ 自由度 ” ,确定一个式子自由度的方法是:若式子包含有n 个变量,其中k 个被限制的样本统计量,则这个表达式的自由度为n-k 。比如中包含1 ,2 ,n 这 n 个变量,其中1 -n -1 相互独立, n 为其余变量的平均值,因此自由度为n-1。附卡方表n/P0.9950.990.9750.950.900.750.500.250.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年2022年卡方分布概念及表和查表方法 2022 年卡方 分布 概念 方法
限制150内