《假设检验白.ppt》由会员分享,可在线阅读,更多相关《假设检验白.ppt(90页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、假设检验白现在学习的是第1页,共90页假设检验在统计方法中的地位假设检验假设检验描述统计描述统计推断统计推断统计参数估计参数估计统计方法统计方法现在学习的是第2页,共90页7.1 假设检验的一般问题假设检验的一般问题7.1.1 假设检验的基本思想假设检验的基本思想7.1.2 两类错误与显著性水平两类错误与显著性水平7.1.3 统计量与拒绝域统计量与拒绝域7.1.4 利用利用P值进行决策值进行决策现在学习的是第3页,共90页导入:药物筛选o 药物筛选过程有两种可能性:(1)“拒绝开发新药”。意味着所检药物无效或者疗效甚微;(2)暂时“接受”开发的新药,但仍需对该药物疗效进一步验证。根据上述两种可
2、能出现研究结果,提出如下假设: H0 :开发研制的新药对治疗某种疾病无效或者疗效甚微H1 :开发研制的新药对治疗某种疾病有效对此类问题进行分析处理的过程即为统计假设检验,尽管H0 、H1的内容均属描述性质,但对具体某药物试验可通过合适的量化指标来测度该药物对治疗特定疾病是否有效。现在学习的是第4页,共90页o 以以 某公司开发研制治疗恶性肿瘤的药物筛选为例某公司开发研制治疗恶性肿瘤的药物筛选为例研究者把80只试验用的小白鼠分成两组。一组40只白鼠接受药物处理,另一组40只白鼠不接受药物处理。一段时间后,称量两组白鼠体内肿瘤的平均重量。现在学习的是第5页,共90页o 1 :接受药物处理白鼠体内肿
3、瘤的平均重量o2 :没有接受药物处理白鼠体内肿瘤的平均重量o 此时可建立数量关系的假设形式:H0 : 1 2 药物无效药物无效H1 : 1 2 药物有效H1表示接受药物处理白鼠体内肿瘤的平均重量小于没有接受药物处理白鼠体内肿瘤的平均重量。如果试验得到样本数据能够提供证据证明H1的正确性,那治药公司就可对该药物作进步试验,否则,就放弃。这样做可能有一定风险,也可犯 一定错误,但可把这种错误控制在一定范围内。现在学习的是第6页,共90页 参数估计和假设检验区别o 参数估计和假设检验都是统计推断的重要内容,但两者推断角度不同。参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一
4、个假设值,然后用样本信息判断这一假设是否成立。现在学习的是第7页,共90页7.1.1 假设检验的基本思想假设检验的基本思想 对总体参数的具体数值所作的陈述n 总体参数包括总体均值总体均值、比例比例、方差方差等n 分析之前之前必需陈述如 产品合格率在80%以上等。一、什么是假设一、什么是假设?现在学习的是第8页,共90页二、什么是假设检验?o 一个假设的提出总是以一定的理由为基础,但这些理由是不完全充分的,要进行检验,即进行判断。如在某种新药的研发中,研究者要判断新药是否比原有药物更有效;海关人员对进口货物进行检验,判断该批货物的属性是否与申报的相一致。o 假设检验就是先对总体的参数提出某种假设
5、(原假设和备择假设),然后利用样本信息判断假设是否成立的过程o 逻辑上运用反证法,统计上依据小概率原理现在学习的是第9页,共90页逻辑上反证法思想 为了检验一个原假设(零假设、即虚拟假设)是否成立, 先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。如果结果是合理的,就接受它;如不合理,则否定原假设。 所谓导致不合理结果,就是看是否在一次观察中, 出现小概率事件。现在学习的是第10页,共90页小概率原理 什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率大小由研究者事先确定,通常把出现小概率事
6、件的概率记为a a ,即显著性水平。现在学习的是第11页,共90页 对总体的分布函数形式或分布的某些参数做出假设,然后再根据对总体的分布函数形式或分布的某些参数做出假设,然后再根据样样本数据本数据和和“小概率原理小概率原理”,对假设的正确性做出判断。,对假设的正确性做出判断。假设检验的原理假设检验的原理:在原假设为真的前提下计算某统计量的一次:在原假设为真的前提下计算某统计量的一次数值,若该值的出现是一个小概率事件,则表明原假设成立的前提数值,若该值的出现是一个小概率事件,则表明原假设成立的前提是不正确的是不正确的 ,从而拒绝原假设。,从而拒绝原假设。原假设为真原假设为真做一次试验做一次试验,
7、 小概率事件发生小概率事件发生拒绝原假设拒绝原假设小概率原理:小概率事件在一次试验中几乎不会发生小概率原理:小概率事件在一次试验中几乎不会发生小概率的标准:与一个显著性水平小概率的标准:与一个显著性水平有关,有关, 0三、假设检验的原理三、假设检验的原理现在学习的是第12页,共90页四、假设检验的过程我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择! 现在学习的是第13页,共90页 = 50现在学习的是第14页,共90页五、五、 原假设和备则假设原假设和备则假设现在学习的是第15页,共90页(一)原假设(null hypothesis)o 又称零假设
8、,是正待检验的假设。也是研究者想收集证据予以反对的假设。o 总是有符号 , 或 3. 表示为 H0nH0 : = 某一数值 n指定为符号 =, 或 1.例如, H0 : 10cm现在学习的是第16页,共90页o 也称研究假设,是拒绝原假设后可供选择的假设。也是研究者想收集证据予以支持的假设o 总是有符号 , 或 o 表示为 H1nH1 : 某一数值,或 某一数值1.例如, H1 : 10cm, 10cm,或 10cm(二)备择假设(alternative hypothesis)现在学习的是第17页,共90页【例例1】一种零件的生产标准其直径应为10cm,为对生产过程进行控制,质量监测人员定期对
9、一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设备择假设现在学习的是第18页,共90页【例例2】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设现在学习的是第19页,共90页【例例3】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设解:解:
10、研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为 H0 : 30% H1 : 30%现在学习的是第20页,共90页o原假设和备择假设是一对对立假设。在一项假设检验中,原假设和备择假设只有一个成立。o建立假设检验时,一般先确定备择假设,再确定原假设。因为备则假设是研究者所关心、予以支持或证实的,较明确,易确定。o原假设和备择假设带有一定的主观倾向。因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),这不违背原假设和备择假设的最初定义。无论怎样确定假设的形式,只要他们符合研究者最终目的便是合理的。(三)原假设和备择假设几点说明(三
11、)原假设和备择假设几点说明现在学习的是第21页,共90页4.建立假设检验时,等号“=”总是放在原假设上o 将将“=”总是放在原假设上是因为可涵盖备则假设总是放在原假设上是因为可涵盖备则假设H1不出现不出现时的所有情况时的所有情况。o 假设检验的惯例是在原假设H0只写“=”号。如H0 : 10cm,H1 : 10cm因为我们感兴趣的是备则假设H1 : 10cm的决策,如果我们做出拒绝H0 : 10cm的决策而倾向于H1 : 10cm,同样也就拒绝了H0 : 10cm。反之,如果事实证明备则假设不正确,则意味着H0 : 10cm代表了不包括H1 : 10cm的所有情况(包括 ”或“”的假设检验。
12、(1)备择假设的方向为“ 500 H1 : ”,称为右侧检验右侧检验如例3 建立假设: H0 : 30% H1 : 30%研究者关心的该城市中家庭拥有汽车的比例是否超过30%。 现在学习的是第26页,共90页双侧检验与单侧检验 (假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0 0H0 : : = 0 0H0 : : = 0 0备择假设备择假设H1 : : 0 0H1 : : 0 0现在学习的是第27页,共90页7.1.2 两类错误与显著性水平两类错误与显著性水平假设检验的目的是要根据样本信息做出是否拒绝原假设而倾向于备则假设
13、的决策。但由于决策是建立在样本信息的基础上做出的,因而就有可能犯错误。现在学习的是第28页,共90页一一 .第第类错误类错误(弃真错误弃真错误)o原假设为真时拒绝原假设所犯的错误。第类错误的概率记为a。o 假设检验是根据小概率事件在一次抽样检验中几乎不可能发生而作出的。这个小概率事件尽管很小,但并不等于不可能发生。如果原假设为真,但由于样本的随机性使样本统计量落入了拒绝域,因而导致拒绝原假设,就犯了弃真错误。这个小概率事件就是显著性水平a。OOHP= H拒 绝表 示 为 :(),为 显 著 水 平为 真现在学习的是第29页,共90页o 如例1 在检验零件的生产标准直径是否为10cm中, Ho
14、: 10cm,H1 : 10cm, a0.05如果零件直径确实为10cm,抽样平均数落入拒绝域的概率只有5%,是小概率事件,一次抽样不可能发生。但毕竟存在这种可能性,而一旦抽到了这样的样本,其抽样平均数落在拒绝域中,根据规则就要拒绝Ho,而拒绝的却是一个真实的假设,采取的是错误行为。一一 .第第类错误类错误(续续)现在学习的是第30页,共90页二、显著性水平a (significant level)o 显著性水平a是一个概率值,当原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域。oa由研究者事先确定,a越小犯第类错误的概率就越小。通常人们认为犯第类错误的后果更严重,故取较小a 值。o 常
15、用的 a 值有0.01, 0.05, 0.10。o 增大样本容量,减少抽样分布的离散性,可以使a变小。现在学习的是第31页,共90页三三.第第类错误类错误(取伪错误取伪错误)o 原假设为假时未拒绝原假设所犯的错误。第类错误的概率记为 。OOoH10cmHH ,P未拒绝表示为:()= ,如零件的直径确实不是,为假但抽样平均数不在拒绝域,因而不能拒绝这样就犯了一个本应拒绝而未拒绝的取伪错误,大小为 。现在学习的是第32页,共90页假设检验假设检验H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 a a) )第第类错误类错误( ( ) )拒绝拒绝H0
16、第第类错误类错误( (a a ) )正确决策正确决策(1-(1- ) )现在学习的是第33页,共90页四、a 错误和 错误的关系在其他条件不变的情况下,你不在其他条件不变的情况下,你不能同时减少两类错误能同时减少两类错误!使使和和同时减少的唯一办法就是增加样本同时减少的唯一办法就是增加样本容量。容量。现在学习的是第34页,共90页两类错误关系的图示01a现在学习的是第35页,共90页五、检验功效 o检验效果好坏与两类错误概率都有关。一个有效的检验首先是犯第一类错误的概率a 不能太大,否则就经常产生弃真错误。错误是取伪错误,在犯第一类错误的概率a一定条下,不犯取伪错误1- 应尽可能增大。 1-
17、越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1- 越小,意味着当原假设不真实时,检验判断出原假设不真实的概率越小,检验的判别能力就越差;o1- 是反映统计检验判断能力大小的重要标志,称之为检验功效或检验力。现在学习的是第36页,共90页o 鉴于第一类错误风险一般比第二类错误 o 风险重要,所以首先考虑控制第一类错误风险a 概率的大小。现在学习的是第37页,共90页注意:在假设检验中,在假设检验中, 只有两种可能的结论只有两种可能的结论:拒拒绝绝H0或不能拒绝不能拒绝H0o在发生第一类错误概率较小时,如果拒绝原假设在发生第一类错误概率较小时,如果拒绝原假
18、设H H0 0,则我们,则我们可以很大的程度(可以很大的程度(1-1-a a)相信关于拒绝原假设的结论是正确的。在相信关于拒绝原假设的结论是正确的。在这种情况下,统计上支持我们作出这种情况下,统计上支持我们作出 H H0 0 为假为假 ,而,而 H H1 1 为真的结论。为真的结论。简言之,拒绝原假设总有较大的把握。简言之,拒绝原假设总有较大的把握。o在假设检验的大多数应用中,一般会对在假设检验的大多数应用中,一般会对a a 进行控制,但通常并不对进行控制,但通常并不对 加以控制。因此,如果我们决定接受加以控制。因此,如果我们决定接受 H H0 0 ,我们并不能确定,我们并不能确定这种决策有多
19、大置信度。只要未对发生第二类错误的概率加以这种决策有多大置信度。只要未对发生第二类错误的概率加以确定或控制,我们就不要做出接受确定或控制,我们就不要做出接受H H0 0的结论,以免发生第二类的结论,以免发生第二类错误的风险。错误的风险。现在学习的是第38页,共90页7.1.3 检验统计量与拒绝域检验统计量与拒绝域现在学习的是第39页,共90页4. 点估计量标准化依据:-x - z = N (0 ,1 )np -PPz = N (0 ,1 )p (1 -p )n =对的 检 验 :对的 检 验 :标 准 化 检 验 统 计 量 公 式 :点 估 计 量假 设 值标 准 化 检 验 统 计 量点
20、估 计 量 的 抽 样 标 准 差(1) 原假设H0为真(2)点估计量的抽样分布现在学习的是第40页,共90页二、拒绝域二、拒绝域1.检验统计量是个随机变量,但只要样本一定,样本观察结果取值一定,检验统计量的值也就唯一确定。2.假设检验的基本原理就是根据检验统计量建立一个准则,依据这个准则和计算得到的检验统计量决定是否拒绝原假设。3.拒绝域就是由显著性水平a 所围成的区域。现在学习的是第41页,共90页4.如果样本观测结果计算出来的检验统计量的集体数值落在拒绝域内,就拒绝原假设,支持备择假设;如果样本观测结果计算出来的检验统计量的集体数值没有落在拒绝域内,则不能拒绝原假设。5.临界值。根据给定
21、的显著性水平a 确定的拒绝域的边界值。确定临界值后,将检验统计量的值与临界值进行比较,就可做出拒绝或不拒绝H0的决策。6.拒绝域随a 的减小而减小。现在学习的是第42页,共90页决策规则o 给定显著性水平a,查表得出相应的临界值za或za/2, ta或ta/2o 将检验统计量的值与a 水平的临界值进行比较o 作出决策n双侧检验:/统计量/ /临界值/,拒绝H0n左侧检验:统计量 临界值,拒绝H0现在学习的是第43页,共90页双侧检验的拒绝域(H0 : : = 0 0, H1 : : 0 0 )a a/2 现在学习的是第44页,共90页双侧检验的拒绝域 (H0 : : = 0 0, H1 : :
22、 0 0 ) 无法拒绝原假设现在学习的是第45页,共90页双侧检验的拒绝域 (H0 : : = 0 0, H1 : : 0 0 ) 拒绝原假设,接受备择假设拒绝原假设,接受备择假设现在学习的是第46页,共90页显著性水平和拒绝域 (双侧检验H0 : : = 0 0, H1 : : 0 0 ) 拒绝原假设,接受备择假设拒绝原假设,接受备择假设现在学习的是第47页,共90页单侧检验的拒绝域现在学习的是第48页,共90页左侧检验的拒绝域(H0 : : 0 0 ,H1 : : 0 0 )无法拒绝原假设现在学习的是第49页,共90页左侧检验的拒绝域 (H0 : : 0 0 ,H1 : : 0 0 )无法
23、拒绝原假设现在学习的是第51页,共90页右侧检验的拒绝域 (H0 : : 0 0 ,H1 : : 0 0 )拒绝原假设,接受备择假设拒绝原假设,接受备择假设现在学习的是第52页,共90页7.1.4 利用利用P值进行决策值进行决策传统检验显著性水平a是在检验之前就确定的,也就是说事先确定了拒绝域。这种固定的显著性水平a对检验结果的可靠性起到一种度量的作用。传统检验缺点是显著性水平a只能提供检验结论可靠性的一个大致范围,而对于一个特定假设检验问题,却无法指出观察数据与原假设之间不一致的精确度量。即,仅从显著性水平a比较,如果选择的a值相同,则所有检验结论的可靠性都一样。现在学习的是第53页,共90
24、页 一、什么是一、什么是P值值 (P-value)oP值是在原假设为真的条件下,样本统计量以其观察值为端点的某极端区域内取值的概率。也称为观察到的显著性水平。o 双侧检验为分布两侧面积的总和oP值是关于统计数据的概率,即反映实际观测到的数据与原假设H0之间不一致程度的概率。如果H0是正确的, P值表明得到这样的数据多么不可能,如果不可能得到的统计数据得到了,说明原假设不合理。oP值越小,说明实际观测到的数据与H0之间不一致的程度就越大,检验结果就越显著。现在学习的是第54页,共90页 二、二、P值可用于确定是否拒绝原假设值可用于确定是否拒绝原假设c01c01c01czP1z2z3z2zo o
25、oo o oo o o假设 表示检验统计量,表示根据样本数据计算得到的检验统计量值。三种检验形式的 值表达式:( )左侧检验 H :H :zP值 =P()( )右侧检验 H :H : zP值 =P()( )双侧检验 H :H :zP值 = P()现在学习的是第55页,共90页三、P值与a关系o显著性水平a是事先所要求的用于拒绝原假设的概率。如果事先给出一个显著性水平a,实际上也就是说所要求的P值要小到何种程度(即给定的a )才能拒绝H0o如果选择a0.05,说明当H0成立时,样本结果发生的概率不超过5%。 P值小于等于a0.05,说明样本数据出现在小概率事件范围内,据此可拒绝原假设。o利用显著
26、性水平做决策,如果拒绝原假设,只知道所犯错误为a那么大,多少不知道,而P值是我们所犯错误的实际概率。现在学习的是第56页,共90页四、 p值决策规则 单侧检验, p值位于抽样分布的一侧,而双侧检验p值位于分布的两侧,两侧各为1/2。 不论单侧检验或双侧检验, p值决策规则: 若p值a ,拒绝 H0 若p值a ,不拒绝 H0现在学习的是第57页,共90页双侧检验的P 值现在学习的是第58页,共90页左侧检验的P 值现在学习的是第59页,共90页右侧检验的P 值现在学习的是第60页,共90页假设检验步骤的总结o陈述原假设和备择假设o从所研究的总体中抽出一个随机样本o确定一个适当的检验统计量,并利用
27、样本数据算出其具体数值o确定一个适当的显著性水平,并计算出其临界值,指定拒绝域o将统计量的值与临界值进行比较,作出决策n统计量的值落在拒绝域,拒绝H0,否则不拒绝H01.也可以直接利用P值值作出决策现在学习的是第61页,共90页7.2 一个总体参数的检验一个总体参数的检验7.2.1 总体均值的检验总体均值的检验7.2.2 总体比例的检验总体比例的检验现在学习的是第62页,共90页一个总体参数的检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾)均值均值一个总体一个总体比例比例现在学习的是第63页,共90页7.2.1 总体均值的检验总
28、体均值的检验 是否已是否已知知样本容量样本容量n 是否已是否已知知 t 检验检验nsxt0-z 检验检验nsxz0-z 检验检验 0 xzn-z 检验检验nxz0-现在学习的是第64页,共90页总体均值的检验 (大样本)1. 假定条件n正态总体或非正态总体大样本(n30)o 使用z检验统计量n 2 已知:2. 2 未知:) 1 , 0(0Nnxz-) 1 , 0(0Nnsxz-现在学习的是第65页,共90页总体均值的检验( 2 已知)(例题分析)【例例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐
29、进行检验,测得每罐平均容量为255.8ml。取显著性水平a=0.05 ,检验该天生产的饮料容量是否符合标准要求?现在学习的是第66页,共90页总体均值的检验( 2 已知)(例题分析)H0 : = 255H1 : 255a a = 0.05n = 40临界值临界值(z=1.96):0255.8,5255.82551.01 1.96540 xxzn-现在学习的是第67页,共90页总体均值的检验(z检验) (P 值的计算与应用) 将 z 的绝对值1.01查表,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于a,故不拒绝H0现在学习的是第6
30、8页,共90页总体均值的检验( 2 未知)(例题分析)【例例】一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工为检验新机床加工的零件平均误差与旧机床相比是否有显的零件平均误差与旧机床相比是否有显著降低著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (a=0.01) 50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.1
31、61.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.06现在学习的是第69页,共90页总体均值的检验( 2 未知)(例题分析)H0 : 1.35H1 : 1.35a a = 0.01n = 50临界值临界值(z):-2.332()102152,0.36574911.31521.352.60612.330.36574950 xxxsnz- - -现在学习的是第70页,共90页总体均值的检验(z检验) (P 值的计算与应用)查表得到P值,用1减去得到的函数值0.995421023 即为P值 P
32、值=1-0.995421023=0.004579 P值 5200a a = 0.05n = 36临界值临界值(z):1.6455275,120527552003.751.64512036xz-现在学习的是第74页,共90页总体均值的检验(z检验) (P 值的图示)现在学习的是第75页,共90页总体均值的检验 (大样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : =0H1 : 0H0 : 0H1 : 0统计量统计量 已知: 未知:拒绝域拒绝域P值决策值决策拒绝H00 xzn-0 x-z=sn/ 2zzazza -zzaPa现在学习的是第76页,
33、共90页总体均值的检验 (小样本)1. 假定条件n总体服从正态分布n小样本(n 30)o 检验统计量n 2 已知:2. 2 未知:) 1 , 0(0Nnxz-) 1(0-ntnsxt现在学习的是第77页,共90页总体均值的检验 (例题分析)【例例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 10个零件尺寸的长度个零件尺
34、寸的长度 (cm)12.210.812.011.811.912.411.312.212.012.3现在学习的是第78页,共90页总体均值的检验 (例题分析)H0 : = 12H1 : 12a a = 0.05df = 10 - 1 = 9临界值临界值(t0.025=20262):P值=0.4984 a=0.05 2()11.89,0.4932111.89120.70352.2620.493210 xxxsnt- - -现在学习的是第79页,共90页总体均值的检验 (小样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : =0H1 : 0H0 :
35、0H1 : 0统计量统计量 已知: 未知:拒绝域拒绝域P值决策值决策拒绝H0nxz0-nsxt0-) 1(2/-ntta) 1( -ntta) 1( -nttaaP现在学习的是第80页,共90页7.2.2 总体比例的检验总体比例的检验o 假定条件n总体服从二项分布n可用正态分布来近似(大样本)2. 检验的 z 统计量000(0,1)(1)pPzNPPn-现在学习的是第81页,共90页总体比例的检验 (检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0: = P0H1: P0H0 : P0H1 : P0统计量统计量拒绝域拒绝域P值决策值决策拒绝H0aP2
36、/azz 000(1)pPzPPn-azz-azz 现在学习的是第82页,共90页总体比例的检验 (例题分析)【例例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 a a=0.05和a a=0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?现在学习的是第83页,共90页总体比例的检验 (例题分析)H0 : P = 80%H1 : P 80%a a = 0.05n = 200临界值临界值(z=1.96):1460.732000.730.80
37、2.4751.960.80(10.80)200pz- - -现在学习的是第84页,共90页本讲小结本讲小结1. 假设检验的一般问题假设检验的一般问题 o 一个总体参数的检验一个总体参数的检验作业:作业:P207 1,2,3P207 4,5P208 6,7,8,9现在学习的是第85页,共90页计算第二类错误的概率例:( =12小时),取显著性水平a = 0.05H0: 120, Ha : 120假设:统计量:nxnxz/120/0-645. 1z,左侧检验的拒绝规则: 若z -1.645, 则拒绝 H0,645. 136/12120-xz由有71.1163612645. 1120-x120112
38、116.71现在学习的是第86页,共90页 当 时,将作出接收这批货物的决策。如果电池寿命均值如果电池寿命均值的真的真值小于值小于120小时,作出这个决策就犯了第二类错误小时,作出这个决策就犯了第二类错误。为了计算犯第二类错误的概率,我们假定真实的 =112小时, 则0091.04909.05 .0)36.2( )36/1211271.116()71.116(-zPzPxP71.116x现在学习的是第87页,共90页对于其他小于120的值,我们可以重复该计算过程,给出相应的第二类错误概率。例如,假定电池平均使用寿命是115小时,则我们有116.71115(116.71)()12 /36 (0.
39、86)0.50.30510.1949P xP zP z-当真实的 向120逐渐增加时,向其上限 0.95 增加;当真实的 小于120而逐渐减少时,也随之减少。现在学习的是第88页,共90页0.05000.9500 - 1.645 119. 999o0.25780.7422 - 0.651180.44040.5596 - 0.151170.50000.50000.00 116. 710.80510.19490.861150.91310.08691.361140.99090.00912.36112功 效 1 - 发生第二类错误的概率真 实 的 值36/1271.116z-120112116.71120116.71我们将1- 称为与真 对应的检验的功效。功效。它是当H0为假时作出拒绝H0的正确结论的概率。显然, 1- 是 的减函数,其图形称为功效曲线功效曲线 。也就是说,假设值和真实值越接近,犯第二类错误的概率越大现在学习的是第89页,共90页o 1- 意味着当原假设不真实时,检验判断原假设不真实的概率, 1- 越大,则检验判断原假设不真实的概率越大,是反映统计检验判别能力大小的重要标志,称之为检验功效或检验力o鉴于a 风险一般比 风险重要,所以首先考虑控制 a 风险。现在学习的是第90页,共90页
限制150内