第二章常用统计技术.ppt
《第二章常用统计技术.ppt》由会员分享,可在线阅读,更多相关《第二章常用统计技术.ppt(109页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第二章常用统计技术第二章常用统计技术第一节方差分析第一节方差分析第二节回归分析第二节回归分析第三节试验设计第三节试验设计第一节方差分析第一节方差分析在科学实验或生产实践中在科学实验或生产实践中,任何事物总任何事物总是受很多因素影响的。是受很多因素影响的。例如例如,工业产品工业产品的质量受原料、机器、人工等因素的影的质量受原料、机器、人工等因素的影响。农作物的产量受种子、肥料、土壤、响。农作物的产量受种子、肥料、土壤、水分、天气等因素的影响水分、天气等因素的影响。利用试验数利用试验数据据,分析各个因素对该事物的影响是否分析各个因素对该事物的影响是否显著显著,数理统计中所采用的一种有效方数理统计中
2、所采用的一种有效方法就是方差分析。法就是方差分析。实际问题现有甲、乙、丙三个工厂生产同一种零件,现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显差为了了解不同工厂的零件的强度有无明显差异?异?H0:1 1=2 2=3 3 H H1 1:1 12 23 3不全相等。不全相等。工厂工厂零件强度零件强度甲甲10310198110乙乙113107108116丙丙82928486一、基本概念及假设一、基本概念及假设因子:试验中会改进状态的因素。常用因子:试验中会改进状态的因素。常用A A、B B、C C等表示;等表示;单因子和多因子!单因子和多因子!水平:因子所处的不同状态就是
3、因子的不水平:因子所处的不同状态就是因子的不同水平,如同水平,如A A1 1、A A2 2、A A3 3等;等;指标:衡量试验效果好坏的变量,常用指标:衡量试验效果好坏的变量,常用Y Y表表示,是一个随机变量。示,是一个随机变量。方差分析思想方差分析思想假定因子假定因子A A有有r r个水平,在每个水平下指标个水平,在每个水平下指标的全体都构成一个总体,因此共有的全体都构成一个总体,因此共有r r个总体,个总体,假定第假定第i i个总体服从均值为个总体服从均值为i i,方差为方差为2 2的的正态分布,从该总体获得一个样本量为正态分布,从该总体获得一个样本量为m m的的样本为样本为y yi1i1
4、,y,yimim,最后假定各样本是相互,最后假定各样本是相互独立的。则进行假设检验:独立的。则进行假设检验:H H0 0:1 1=2 2=3 3 H H1 1:1 12 23 3不全相等不全相等如果接受原假设,表示不同水平下的均值无显如果接受原假设,表示不同水平下的均值无显著差异,此时因子著差异,此时因子A A不显著。不显著。如图!如图!方差分析的基本假定方差分析的基本假定方差分析是在相同方差假定下检验多个正方差分析是在相同方差假定下检验多个正态均值是否相等的一种统计分析方法。具态均值是否相等的一种统计分析方法。具体地说,该问题的基本假定是:体地说,该问题的基本假定是:在水平在水平Ai下,指标
5、服从正态分布;下,指标服从正态分布;在不同水平下,方差在不同水平下,方差2 2相等;相等;数据数据y yijij相互独立。相互独立。20072007多多3838及及20062006多多4343方差分析是检验多个正态均值是否相等的一种方差分析是检验多个正态均值是否相等的一种统计分析方法,基本假设包括(统计分析方法,基本假设包括()A、在水平、在水平Ai下,指标服从正态分布下,指标服从正态分布B、在不同的水平下,方差不相等、在不同的水平下,方差不相等C、在不同的水平下,方差相等、在不同的水平下,方差相等D、数据、数据yij相互不独立相互不独立E、数据、数据yij相互独立相互独立ACE二、单因素方差
6、分析二、单因素方差分析设在一个试验中只考察一个因子设在一个试验中只考察一个因子A,它有,它有r个水平,在每一水平下进行个水平,在每一水平下进行m次重复试次重复试验,试验结果见表验,试验结果见表1所示。所示。表表1 1 单因素试验数据表单因素试验数据表Y 重复A12m和1y11y12y1mT12y21y22y2mT2ryr1yr2yrmTr和T1.计算平均值计算平均值各水平下的均值各水平下的均值总均值总均值2.2.离差平方和分解离差平方和分解总离差平方和总离差平方和因子因子A的离差平方和的离差平方和(组间的离差平方和)(组间的离差平方和)误差的离差平方和(组内的离差平方和)误差的离差平方和(组内
7、的离差平方和)3.3.假设检验假设检验计算计算若若拒绝原假设拒绝原假设H0,也称因子,也称因子A显著显著方差分析表方差分析表来源偏差平方和S自由度f协方差VF值ASAfA=r-1VA=SA/fAF=VA/VeeSe=ST-SAfe=fT-fAVe=Se/feTSTfT=rm-1注:注:方差分析的步骤方差分析的步骤计算各因子的每一水平指标和及总和;计算各因子的每一水平指标和及总和;计算各类数据的平方和计算各类数据的平方和依次计算依次计算ST,SA,Se及其自由度。及其自由度。填写方差分析表;填写方差分析表;对于给定的显著性水平,作出判断。对于给定的显著性水平,作出判断。各水平均值估计各水平均值估
8、计如果因子如果因子A A显著,则可以给出每一个水平均显著,则可以给出每一个水平均值的估计:值的估计:方差和标准差估计方差和标准差估计方差方差 的估计是:的估计是:标准差标准差 的估计值是:的估计值是:2008单8在单因子方差分析中,因子在单因子方差分析中,因子A有有3个水平,个水平,每个水平下各做每个水平下各做4次试验,现已算得总平方次试验,现已算得总平方和和ST=42,则检验因子,则检验因子A是否显著的统计量是否显著的统计量F值为(值为()。)。A、1.56 B、14C、3 D、7?2007单6在单因子方差分析中,因子在单因子方差分析中,因子A有有3个水平,个水平,每个水平下各做每个水平下各
9、做4次试验,现已算得因子次试验,现已算得因子A的平方和的平方和SA=42,总平方和,总平方和ST=69,则误差,则误差平方和平方和Se=()。)。A、3 B、9C、27 D、18C2007多39在单因子方差分析中,有(在单因子方差分析中,有()A、组内平方和、组内平方和=因子平方和因子平方和B、组内平方和、组内平方和=误差平方和误差平方和C、组间平方和、组间平方和=因子平方和因子平方和D、组间平方和、组间平方和=误差平方和误差平方和E、总平方和、总平方和=因子平方和因子平方和+误差平方和误差平方和BCE2007多40在单因子方差分析中,因子在单因子方差分析中,因子A有有3个水平,每个个水平,每
10、个水平下各重复水平下各重复5次试验,现已求得每水平下试验次试验,现已求得每水平下试验结果和为结果和为7.5,10.5,6.0。则(。则()A、因子、因子A的平方和为的平方和为1.26B、因子、因子A的平方和为的平方和为2.10C、因子、因子A的自由度为的自由度为4D、因子、因子A的自由度为的自由度为2E、因子、因子A的均方为的均方为0.315BD2006单7在单因子方差分析中,已确认因子在单因子方差分析中,已确认因子A在显著性在显著性水平水平=0.05下是显著因子,在不查分位数表的下是显著因子,在不查分位数表的情况下,下列命题正确的是(情况下,下列命题正确的是()A、在、在=0.10下,下,A
11、是显著因子是显著因子B、在、在=0.10下,下,A不是显著因子不是显著因子C、在、在=0.10下,下,A是显著因子是显著因子D、在、在=0.10下,下,A不是显著因子不是显著因子A2008多37在单因子方差分析中,可获得的结论有(在单因子方差分析中,可获得的结论有()A、因子、因子A各水平下的均值是否有显著差异各水平下的均值是否有显著差异B、因子、因子A各水平下各水平下的是的是否有显著差异否有显著差异C、误差方差的估计量、误差方差的估计量D、误差方差的估计量、误差方差的估计量AD2008多41在单因子方差分析中,因子在单因子方差分析中,因子A有有2个水平,每个个水平,每个水平下各重复试验水平下
12、各重复试验3次,具体数据为:水平次,具体数据为:水平A1:9,7,8;水平;水平A2:3,1,2。有关平方和。有关平方和或均方的正确计算结果有(或均方的正确计算结果有()。)。A、因子、因子A的平方和的平方和SA=54B、因子、因子A的均方的均方MSA=27C、误差平方和、误差平方和Se=4D、误差的均方、误差的均方MSe=2E、总平方和、总平方和ST=54ABCD2006多36在单因子方差分析中,因子在单因子方差分析中,因子A有有4个水平,各水个水平,各水平下重复试验次数分别为平下重复试验次数分别为8,6,5,7,则(,则()A、因子、因子A的平方和自由度为的平方和自由度为4B、误差平方和的
13、自由度为、误差平方和的自由度为22C、因子、因子A的平方和自由度为的平方和自由度为3D、误差平方和的自由度为、误差平方和的自由度为26E、总平方和的自由度为、总平方和的自由度为22BC2006综一考察温度对某一化工产品得率的影响,特考察温度对某一化工产品得率的影响,特选选5 5种不同温度进行试验,并在同一温度下种不同温度进行试验,并在同一温度下进行进行3 3次重复试验,试验结果略,但可计算:次重复试验,试验结果略,但可计算:71、进行单因子方差分析时,涉及(、进行单因子方差分析时,涉及()个总体)个总体A、3 B、5 C、10 D、1577、因子、因子A的平方和为(的平方和为()A、b=2.2
14、8 B、b=-2.28 C、a=43.4 D、22.678、误差平方和的自由度为、误差平方和的自由度为()A、14 B、10 C、5 D、479、若取显著性水平、若取显著性水平0.05,查,查F的临界值为的临界值为3.48,则,则()。)。A、因子、因子A显著显著 B、因子、因子A不显著不显著 C、误差方差的估计为、误差方差的估计为5 D、误差方差的估计为、误差方差的估计为12.5BABAC没有原始数据情况没有原始数据情况如果没有给出各原始数据,仅给出了各如果没有给出各原始数据,仅给出了各水平下的试验次数、数据的均值与标准水平下的试验次数、数据的均值与标准差。需要进行一定的变换。差。需要进行一
15、定的变换。A1Ar平均值标准差S1Sr例题及例题及P106P106第第4 4题;题;三、重复数不等的情况三、重复数不等的情况若在每一水平下重复试验次数不同,若在每一水平下重复试验次数不同,假定在假定在A Ai i水平下进行了水平下进行了m mi i次试验,方次试验,方差分析仍可进行,只是在计算中有两差分析仍可进行,只是在计算中有两个主要改动:个主要改动:2008单7在单因子方差分析中,因子在单因子方差分析中,因子A有有4个水平,个水平,各水平下试验次数分别为各水平下试验次数分别为8,6,7,9,则,则误差平方和的自由度误差平方和的自由度fe=()。)。A、26 B、28C、24 D、27A20
16、06单9在单因子方差分析中,因子在单因子方差分析中,因子A有有4个水平,各水个水平,各水平下重复试验分别为平下重复试验分别为8,5,7,6。根据试验结。根据试验结果已算得因子果已算得因子A的平方和为的平方和为167.53,误差平方,误差平方和为和为337.17,由此得统计量,由此得统计量F为(为()A、2.73B、5.23C、3.64D、6.30C第二节回归分析第二节回归分析质量管理中经常需要研究两个变量间的相质量管理中经常需要研究两个变量间的相关关系,回归分析是处理变量相关关系的关关系,回归分析是处理变量相关关系的一种统计技术。一种统计技术。变量也是种因子,因子常被分为两类:定变量也是种因子
17、,因子常被分为两类:定性因子与定量因子。回归分析主要研究定性因子与定量因子。回归分析主要研究定量因子。量因子。一、散布图一、散布图为了研究两个变量之间存在什么关系,为了研究两个变量之间存在什么关系,可以画一张图,把每一对(可以画一张图,把每一对(x xi i,y,yi i)看)看成直角坐标系中的一个点,在图中标成直角坐标系中的一个点,在图中标出出n n个点,称这样的图为散布图,个点,称这样的图为散布图,如图。如图。六种典型的散布图XY0XY0XY0XY0XY0XY0强正相关强正相关强负相关强负相关弱正相关弱正相关弱负相关弱负相关不相关不相关非直线相关非直线相关 二、相关系数二、相关系数相关系数
18、是表示两个变量线性关系的密切程度。相关系数取值n个点完全在一条直线上个点完全在一条直线上两个变量线性正相关两个变量线性正相关两个变量线性负相关两个变量线性负相关两个变量线性不相关两个变量线性不相关相关系数检验建立假设:原假设的拒绝域:其中,为显著性水平,为相关系数临界值。教材举例计算:,计算平方和与乘积和:计算:计算相关系数:r查表2008单6剔除一个远离回归直线的散点,剔除一个远离回归直线的散点,r2将(将()A、不受影响、不受影响 B、减小、减小C、增大、增大 D、接近于、接近于0C2007单7某种零件的长度和重量的相关系数为某种零件的长度和重量的相关系数为0.97,更换材料后每个零件重量
19、均降低更换材料后每个零件重量均降低0.3克,而长克,而长度不变,那么此种零件的长度与重量的相关系度不变,那么此种零件的长度与重量的相关系数为(数为()A、0.5 B、0.67C、0.97 D、-0.97C2007单8如果在如果在y关于关于x的线性回归方程中的线性回归方程中b0,则相关则相关系数系数r()A、r=0 B、r=1C、r0C2006单8根据两个变量的根据两个变量的18对观测数据建立一元线性回对观测数据建立一元线性回归方程,在对回归方程作检验时,残差平方和归方程,在对回归方程作检验时,残差平方和的自由度为(的自由度为()A、18B、17C、16D、1C2006单10某零件的长度某零件的
20、长度X和质量和质量Y的相关系数为的相关系数为0.68,经,经技术改进后,每个零件的长度缩短技术改进后,每个零件的长度缩短0.2厘米,质厘米,质量降低量降低0.5克,新零件的长度和质量的相关系数克,新零件的长度和质量的相关系数为(为()A、0.86B、0.5C、0.68D、-0.68C2007多41相关系数相关系数r是表示两个变量线性关系密切程度的是表示两个变量线性关系密切程度的统计量。比如如下四个相关系数,统计量。比如如下四个相关系数,r1=0.65,r2=0.37,r3=-0.37,r4=-0.95,有(有()A、r1表示的两变量密切程度比表示的两变量密切程度比r2表示的强表示的强B、r3表
21、示的两变量密切程度比表示的两变量密切程度比r4表示的强表示的强C、r2表示的两变量密切程度比表示的两变量密切程度比r3表示的相同表示的相同D、r2表示的两变量密切程度比表示的两变量密切程度比r4表示的强表示的强E、r2表示的两变量密切程度比表示的两变量密切程度比r3表示的强表示的强AC2006多40记变量记变量x与与y的相关系数为的相关系数为r,则(,则()A、r的绝对值越接近的绝对值越接近1,x与与y间的线性相关越间的线性相关越强强B、若、若r=o,两变量无任何关系两变量无任何关系C、r无量纲无量纲D、r只度量两变量间的线性相关的强弱只度量两变量间的线性相关的强弱E、若、若r=1,则回归系数
22、,则回归系数b=1ACD一元线性回归当两个变量间存在线性相关关系时,常常希望在两者间建立定量关系,两个相关变量间的定量关系的表达即是一元线性回归方程。假定x是自变量,因变量 y是随机变量,则最小二乘法的中心思想,是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列要求:(1)原数列的观测值与模型估计值的离差平方和为最小;最小二乘法OLS OLS(Ordinary Least SquareOrdinary Least Square)估计估计核心内容回归方程的显著性检验相关系数检验;F检验:利用回归方程进行预测回归方程经检验后,可以利用回归方程进回归方程经检验后,可以利用回归方程进行预
23、测,即在给定自变量行预测,即在给定自变量x后对因变量后对因变量y的的值作出预测。值作出预测。估计值:估计值:1-置信区间:置信区间:其中其中 与与x x0 0有关,有关,的精确表达:的精确表达:利用回归方程进行预测当当n n较大时,较大时,t t分布近似正态分布,如分布近似正态分布,如果果x x0 0与与X X的平均值相差不大,的平均值相差不大,的近似的近似值为:值为:四、可化为一元线性回归的曲线回归四、可化为一元线性回归的曲线回归确定曲线回归方程形式:专业知识和散布确定曲线回归方程形式:专业知识和散布图与标准函数图像比较加以选择;图与标准函数图像比较加以选择;曲线回归方程中参数的估计:采用线
24、性化曲线回归方程中参数的估计:采用线性化的方式进行数据变换;的方式进行数据变换;只需要求出回归方程进行估计,不需要求只需要求出回归方程进行估计,不需要求置信区间。置信区间。曲线回归方程的比较曲线回归方程的比较相关指数:相关指数:标准残差:标准残差:P109P109第第2727题;题;2008多42设两个变量设两个变量X和和Y的观测值为(的观测值为(xi,yi),i=1,n,用用r表示相关系数,表示相关系数,y=a+bx表示回归方程,以下结表示回归方程,以下结论正确的有(论正确的有()。)。A、若、若r=1则则b=1B、若、若r0则则b0则则b0E、若、若r=1则则a=0BD20082008综二
25、综二在变量在变量Y表示对表示对X进行回归分析时,根据进行回归分析时,根据10对观测对观测值(值(xi,yi),算得如下结果:算得如下结果:75、X与与Y的样本相关系数的样本相关系数r为(为()。)。A、-0.8 B、0.8 C、0.64 D、0.5B76、Y对对X的回归系数的回归系数b为(为()。)。A、0.5 B、-0.5 C、0.582 D、-0.58277、回归方程中的常数项、回归方程中的常数项a为(为()。)。A、-19.6 B、-2.6 C、2.6 D、2678、当、当x0=20时,预测时,预测 为为()A、0.5 B、-0.5 C、0.582 D、-0.582ACA20072007
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 常用 统计 技术
限制150内