2024版高考数学一轮总复习第9章统计与统计案例第3节成对数据的统计分析.docx
《2024版高考数学一轮总复习第9章统计与统计案例第3节成对数据的统计分析.docx》由会员分享,可在线阅读,更多相关《2024版高考数学一轮总复习第9章统计与统计案例第3节成对数据的统计分析.docx(22页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第三节成对数据的统计分析考试要求:掌握散点图、最小二乘法思想、回归分析以及独立性检验一、教材概念结论性质重现1相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系2散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的统计图叫做散点图利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关3正相关和负相关(1)正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关. (2)负相关:如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相
2、关相关关系与函数关系的区别与联系(1)相同点:两者均是指两个变量的关系(2)不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系4线性相关和非线性相关(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关(2)一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关5样本相关系数r变量x和变量y的样本相关系数r的计算公式如下:r(1)当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关;当r0时,称成对样本数据间没有线性相关关
3、系(2)样本相关系数r的取值范围为1,1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.6一元线性回归模型我们称Y=bx+a+e, Ee=0,De=2为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是 Y与bxa之间的随机误差7线性回归方程与最小二乘法回归直线方程过样本点的中心(x,y),是回归直线方程最常用的一个特征我们将ybxa称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线这种求经验回归方程的方法叫做最小二
4、乘法,求得的b,a叫做b,a的最小二乘估计,8刻画回归效果的方式(1)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好(2)残差平方和法:残差平方和k=122(yi-yi)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差9独立性检验(1)临界值2统计量也可以用来作相关性的度量,2越小说明变量之间越独立,2越大说明变量之间越相关,2nadbc2a+bc+da+cb+d.忽略2的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数x
5、,使得P(2x)成立,我们称x为的临界值,这个临界值就可作为判断2大小的标准(2)基于概率值的检验规则:当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立,可以认为X和Y独立这种利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验二、基本技能思想活动经验1判断下列说法的正误,对的画“”,错的画“”(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(2)通过经验回归方程ybxa可以估计预报变量的取值和变化趋势()(3)经验回归方程ybxa中,若a3.841x0
6、.05,根据小概率值0.05的独立性检验,我们推断H0不成立,即认为对该综艺节目是否满意与性别有关,此推断犯错误的概率不大于0.05.课时质量评价(五十五)A组全考点巩固练1(多选题)在下列各图中,两个变量具有线性相关关系的图是()A BC DBC解析:A中各点都在一条直线上,所以这两个变量之间是函数关系,不是相关关系;B,C所示的散点图中,样本点成带状分布,这两组变量具有线性相关关系;D所示的散点图中,样本点成团状分别,不是带状分布,所以这两个变量不具线性相关关系综上,具有线性相关关系的是B和C2色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得如下数据:色差x212325272
7、931色度y151617212223已知该产品的色差和色度之间满足线性相关关系,且y0.25xb,现有一对测量数据为(32,21.25),则该组数据的残差(测量值与预测值的差)为()A0.65B0.75 C0.75D0.95B解析:样本中心点坐标为(26,19),代入经验回归方程得b12.5.所以y0.25x12.5,将x32代入,求解得到对应的预估值为20.5,因而其残差为21.2520.50.75.故选B3对两个变量x,y进行线性相关检验,得线性相关系数r10.785 9,对两个变量u,v进行线性相关检验,得线性相关系数r20.956 8,则下列判断正确的是()A变量x与y正相关,变量u与
8、v负相关,变量x与y的线性相关性较强B变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强C解析:由线性相关系数r10.785 90知x与y正相关;由线性相关系数r20.956 80知u,v负相关又|r1|r2|,所以变量u与v的线性相关性比x与y的线性相关性强4为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下22列联表:未治愈治愈合计服用药物104050未服用药物203050合计3070100则下列说法一定正确的是()附:2nadbc2a
9、+bc+da+cb+d(其中nabcd)临界值表:0.150.100.050.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828A在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”B在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”C在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有关”D在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无关”A解析:由列联表中数据,计算2100300800230705050100214.
10、762,且3.8414.7625.024,所以有95%的把握认为“小白鼠有无被感染与是否注射疫苗有关”5设两个相关变量x和y分别满足xii,yi2i-1,i1,2,6.若相关变量x和y可拟合为非线性经验回归方程y2bxa,则当x7时,y的估计值为()A32B63 C64D128C解析:令zilog2yii1,则zbxa,x16(123456)3.5,z16(012345)2.5,azbx2.513.51,所以zx1,即y2x-1,所以当x7时, y27-164.6在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(N100m,mN*),其中男女学生各半,男生中60%表示
11、喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢若在犯错误的概率不超过0.001的前提下,认为性别与是否喜欢该学科有关,则可以推测N的最小值为()附:2nadbc2a+bc+da+cb+d.0.0500.0100.001x3.8416.63510.828A400B300 C200D100B解析:设男、女学生的人数分别为50m,50m,建立22列联表如下:喜欢课程不喜欢课程合计男生 30m20m50m女生 20m30m50m合计 50m50m100m由表中的数据,2100m30m30m20m20m250m50m50m50m4m,由题意可得,4m10.828,解得m2.707
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 高考 数学 一轮 复习 统计 案例 成对 数据 统计分析
限制150内