书签分享收藏举报版权申诉 / 22

立即下载

当前位置：首页 > 教育专区 > 教案示例 > 概率统计学习补充案例.doc

概率统计学习补充案例.doc

上传人：一***

文档编号：815994

上传时间：2019-07-18

格式：DOC

页数：22

大小：1.60MB

( 4.5 )

《概率统计学习补充案例.doc》由会员分享，可在线阅读，更多相关《概率统计学习补充案例.doc（22页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、补充案例：补充案例：概率部分：概率部分：案例案例 1 1、“三人行必有我师焉三人行必有我师焉” 案例案例 2 2、抓阄问题、抓阄问题案例案例 3 3、贝叶斯方法运用案例介绍、贝叶斯方法运用案例介绍案例案例 4、化验呈阳性者是否患病化验呈阳性者是否患病案例案例 5 5、敏感性问题的调查、敏感性问题的调查案例案例 6 6、泊松分布在企业评先进中的应用、泊松分布在企业评先进中的应用案例案例 7 7、碰运气能否通过英语四级考试、碰运气能否通过英语四级考试案例案例 8 8、检验方案的确定问题、检验方案的确定问题案例案例 9 9、风险型决策模型、风险型决策模型案例案例 1010、一种很

2、迷惑游客的赌博游戏、一种很迷惑游客的赌博游戏案例案例 1111、标准分及其应用、标准分及其应用案例案例 1212、正态分布在人才招聘中的应用、正态分布在人才招聘中的应用案例案例 1313、预测录取分数线和考生考试名、预测录取分数线和考生考试名统计部分：统计部分：案例案例 1414、随机变量函数的均值和标准差的近似计算方法、随机变量函数的均值和标准差的近似计算方法案例案例 1515、如何表示考试成绩比较合理、如何表示考试成绩比较合理案例案例 1616、如何估计湖中黑、白鱼的比例如何估计湖中黑、白鱼的比例案例案例 1717、预测水稻总产量、预测水稻总产量案例案例 1818、工程师的

3、建议是否应采纳、工程师的建议是否应采纳案例案例 1919、母亲嗜酒是否影响下、母亲嗜酒是否影响下代的健康代的健康案例案例 2020、银行经理的方案是否有效、银行经理的方案是否有效案例案例 2121、一元线性回归分析的、一元线性回归分析的 ExcelExcel 实现实现案例案例 2222、方差分析的、方差分析的 ExcelExcel 实现实现案例案例 2323、预测高考分数预测高考分数案例案例 2424、两次地震间的间隔时间服从指数分布、两次地震间的间隔时间服从指数分布案例案例 1 1、“三人行必有我师焉三人行必有我师焉” 我们可以运用概率知识解释孔子的名言“三人行必有我师焉”.

4、首先我们要明确一个问题，即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行，行行出状元”，我们不妨把一个人的才能分成 360 个方面。孔子是个大圣人，我们假设他在一个方面超过某个人的概率为 99，那么孔子在这方面超过与他“同行”的两个人的概率为 99 99 =98.0l，在 360 个方面孔子总比这两人强的概率为(98.01) 360=0.07 ，即这两个人在某一方面可以做孔子老师的概率为 99.93.从数学角度分析，孔子的话是很有道理的. 案例案例 2 2、抓阄问题、抓阄问题一项耐力比赛胜出的 10 人中有 1 人可以获得一次旅游的机会，组织者决定以抓阄的

5、方式分配这一名额. 采取一组 10 人抓阄，10 张阄中只有一张写“有”. 每个人都想争取到这次机会，你希望自己是第几个抓阄者呢? 有人说要先抓，否则写有“有”的阄被别人抓到，自己就没有机会了；有人说不急于先抓，如果前面的人没有抓到写有“有”的阄，这时再抓抓到“有”的机会会大一些. 为了统一认识，用概率的方法构造一个摸球模型来说明问题. 摸球模型：袋中装有 1 个红球和 9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在 10 人依次摸球(不放回)，求红球被第个人摸到的概率( = 1, 2, , 10). kk解决问题：设 = “ 第个人摸到红球， = 1, 2, ,

6、10. 显然，红球kAkk被第一个人摸到的概率为 . 因为，于是红球被第二个人摸到的概率101)(1AP 12AA 为 . 101 91 109)()()()(121212AAPAPAAPAP同样，由知红球被第三个人摸到的概率为 213AAA . 101 81 98 109)()()()()(2131213213AAAPAAPAPAAAPAP如此继续，类似可得 = . )(4AP)(5AP101)(10AP由此可见，其结果与无关，表明 10 个人无论摸球顺序如何，每个人摸到红球的机k 会相等. 这也说明 10 个人抓阄，只要每个人在抓之前不知道他前边那些已经抓完的结果，无论先后, 抓到

7、的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等，人们常常乐于用抓阄的办法来解决，其合理性保证当然得归功于“概率”. 通过上面的摸球模型，我们总结出分配中的 “抓阄”问题，无论先抓后抓，结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后，我们要发扬风格让他人先抓. 案例案例 3 3、贝叶斯方法运用案例介绍、贝叶斯方法运用案例介绍什么是贝叶斯过滤器？什么是贝叶斯过滤器？垃圾邮件是一种令人头痛的顽症，困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法，主要有“关键词法“和“校验码法“等。前者的过滤依据是特定的词语；后者则是计算邮件文

8、本的校验码，再与已知的垃圾邮件进行对比。它们的识别效果都不理想，而且很容易规避。 2002 年，Paul Graham 提出使用“贝叶斯推断“过滤垃圾邮件。他说，这样做的效果，好得不可思议。1000 封垃圾邮件可以过滤掉 995 封，且没有一个误判。另外，这种过滤器还具有自我学习的功能，会根据新收到的邮件，不断调整。收到的垃圾邮件越多，它的准确率就越高。建立历史资料库建立历史资料库贝叶斯过滤器是一种统计学过滤器，建立在已有的统计结果之上。所以，我们必须预先提供两组已经识别好的邮件，一组是正常邮件，另一组是垃圾邮件。我们用这两组邮件，对过滤器进行“训练“。这两组邮件的规模越大，训

9、练效果就越好。 Paul Graham 使用的邮件规模，是正常邮件和垃圾邮件各 4000 封。 “训练“过程很简单。首先，解析所有邮件，提取每一个词。然后，计算每个词语在正常邮件和垃圾邮件中的出现频率。比如，我们假定“sex“这个词，在 4000 封垃圾邮件中，有 200 封包含这个词，那么它的出现频率就是 5%；而在 4000 封正常邮件中，只有 2 封包含这个词，那么出现频率就是 0.05%。（【注释】如果某个词只出现在垃圾邮件中，Paul Graham 就假定，它在正常邮件的出现频率是 1%，反之亦然。随着邮件数量的增加，计算结果会自动调整。）有了这个初步的统计结果，过滤器就可以

10、投入使用了。贝叶斯过滤器的使用过程贝叶斯过滤器的使用过程现在，我们收到了一封新邮件。在未经统计分析之前，我们假定它是垃圾邮件的概率为 50%。（【注释】有研究表明，用户收到的电子邮件中，80%是垃圾邮件。但是，这里仍然假定垃圾邮件的“先验概率“为 50%。）我们用 S 表示垃圾邮件（spam），H 表示正常邮件（healthy）。因此，P(S)和 P(H)的先验概率，都是 50%。然后，对这封邮件进行解析，发现其中包含了 sex 这个词，请问这封邮件属于垃圾邮件的概率有多高？我们用 W 表示“sex“这个词，那么问题就变成了如何计算 P(S|W)的值，即在某个词语（W）已经存

11、在的条件下，垃圾邮件（S）的概率有多大。根据条件概率公式，马上可以写出公式中，P(W|S)和 P(W|H)的含义是，这个词语在垃圾邮件和正常邮件中，分别出现的概率。这两个值可以从历史资料库中得到，对 sex 这个词来说，上文假定它们分别等于 5%和 0.05%。另外，P(S)和 P(H)的值，前面说过都等于 50%。所以，马上可以计算 P(S|W)的值：因此，这封新邮件是垃圾邮件的概率等于 99%。这说明，sex 这个词的推断能力很强，将 50%的“先验概率“一下子提高到了 99%的“后验概率“。联合概率的计算联合概率的计算做完上面一步，请问我们能否得出结论，这封新邮件就是垃圾邮

12、件？回答是不能。因为一封邮件包含很多词语，一些词语（比如 sex）说这是垃圾邮件，另一些说这不是。你怎么知道以哪个词为准？ Paul Graham 的做法是，选出这封信中 P(S|W)最高的 15 个词，计算它们的联合概率。（【注释】如果有的词是第一次出现，无法计算 P(S|W)，Paul Graham 就假定这个值等于 0.4。因为垃圾邮件用的往往都是某些固定的词语，所以如果你从来没见过某个词，它多半是一个正常的词。）所谓联合概率，就是指在多个事件发生的情况下，另一个事件发生概率有多大。比如，已知 W1 和 W2 是两个不同的词语，它们都出现在某封电子邮件之中，那么这封邮件是垃圾

13、邮件的概率，就是联合概率。在已知 W1 和 W2 的情况下，无非就是两种结果：垃圾邮件（事件 E1）或正常邮件（事件 E2）。其中，W1、W2 和垃圾邮件的概率分别如下：如果假定所有事件都是独立事件（【注释】严格地说，这个假定不成立，但是这里可以忽略），那么就可以计算 P(E1)和 P(E2)：又由于在 W1 和 W2 已经发生的情况下，垃圾邮件的概率等于下面的式子：即将 P(S)等于 0.5 代入，得到将 P(S|W1)记为 P1，P(S|W2)记为 P2，公式就变成这就是联合概率的计算公式。最终的计算公式最终的计算公式将上面的公式扩展到 15 个词的情况，就得到了最终

14、的概率计算公式：一封邮件是不是垃圾邮件，就用这个式子进行计算。这时我们还需要一个用于比较的门槛值。Paul Graham 的门槛值是 0.9，概率大于 0.9，表示 15 个词联合认定，这封邮件有 90% 以上的可能属于垃圾邮件；概率小于 0.9，就表示是正常邮件。有了这个公式以后，一封正常的信件即使出现 sex 这个词，也不会被认定为垃圾邮件了。案例案例 4、化验呈阳性者是否患病化验呈阳性者是否患病在医疗中经常通过化验来诊断。当某人做癌症检查结果呈阳性时，他就患癌症了？其实不然。假设某一地区患有癌症的人占 0.005，患者对一种试验反应是阳性的概率为 0.95，正常人对这种试验

15、反应是阳性的概率为 0.04，现抽查了一个人，试验反应是阳性，问此人是癌症患者的概率有多大？设 C=抽查的人患有癌症，A=试验结果是阳性，则表示“抽查的人不患癌症”。C已知, , 。( )0.005P C ( )0.995P C ()0.95P A C ()0.04P A C 由贝叶斯公式，可得)()()()()()()(CAPCPCAPCPCAPCPACP代入数据计算得: P(CA)= 0.1066 。在以上假设下，做癌症检查结果呈阳性的人确患癌症的概率为仅为 0.1066，平均来说，1000 个人中大约只有 107 人确患癌症。这是不是意味着这种试验对于诊断一个人是否患有癌症没有意义

16、呢？不是！如果不做试验，一人是患者的概率为0.005。若试验后得阳性反应，则此人是患者的概率为 0.1066, 从 0.005 增加到 0.1066，将近增加约 21 倍，说明这种试验对于诊断一个人是否患有癌症有意义。案例案例 5 5、敏感性问题的调查、敏感性问题的调查学生阅读不健康书刊或录像会严重影响学生的身心健康. 但这些都是避着家长和教师进行的，属个人隐私行为. 我们如何设计一种调查方案，能够估计出大学生中看过不健康书刊或录像的人数的比率呢？对这种敏感性问题的调查，被调查者会有一种顾虑，害怕调查者不能很好的保守秘密. 如果被调查者不愿意真实回答问题，将使调查数据失真，这样的

17、统计结果将没有意义. 因此巧妙设计调查方案是获得真实数据的关键.经过多年的研究和实践，一些统计学家和心理学家发明了一种能消除人们抵触情绪的 “随机化应答”方法. 被调查者只需回答两个问题之一，而且只需回答“是”或“否”，设计的问题如下：问题 A：你的生日是否在 7 月 1 日之前？问题 B：你是否看过不健康书刊？被调查者在没有外人的情况下，从一个装有黑球和白球的箱子中随机抽取一个球，看过颜色后又放回.若抽出白球则回答问题 A；若抽出黑球则回答问题 B. 箱中黑球所占比率是已知的，即， .P任意抽取一个是黑球1P 任意抽取一个是白球被调查者无论回答 A 或 B，都只需在一张只有“是”、

18、“否”两个选项的答案上做出选择，然后投入密封的投票箱内. 上述抽球和答卷都在无人的情况下进行，这样就可以消除被调查者的顾虑，从而可以保证答卷的真实可靠性.打开投票箱进行统计，设共有张有效答卷，其中张选择“是”，那么可用频率 nk估计回答“是”的概率为：nk ./Pk n答“ 是”回答“是”有两种情况：一种是摸到白球后对问题 A 回答“是”，也就是被调查者 “生日在 7 月 1 日之前”的概率，一般认为这个概率是 0.5，即；另一种是摸到黑球后对问题 B 回答“是”，这个条件概率就0.5P答“ 是” 抽白球是看不健康书刊的学生在参加调查的学生中的比率，即 .pPp答“ 是” 抽黑球

19、利用全概率公式得 PPPPP答“ 是”抽白球答“ 是” 抽白球抽黑球答“ 是” 抽黑球，即 .p）（ 15 . 0 由此可获得./0.5(1)k np 假设在一次实际调查中，箱子中共有 50 个球，其中 30 个是黑球，20 个白球，则 . 调查结束时共收到 1583 张有效答卷，其中有 389 张回答“是”，据此可估算出6 . 0.0762. 06 . 04 . 021 1583389 p这表明 1583 名学生中，约 %的学生看过不健康书刊.62. 7案例案例 6 6、泊松分布在企业评先进中的应用、泊松分布在企业评先进中的应用某工业系统在进行安全管理评选时，有两家企业在其它方面得分相等，

20、难分高下。只剩下千人事故率这个指标，甲企业有 2000 人，发生事故率为 0.005，即发生事故 10 起。乙企业有 1000 人，发生事故率也为 0.005，即发生事故 5 起。那么，应该评选谁为先进企业呢？显然，按事故数来评，则应评乙企业为先进。但甲企业不服。因为甲企业的事故数虽然是乙企业的 2 倍。但甲企业的人数正好是乙企业的 2 倍。按事故率来评，两企业应榜上有名。由于指标限制，只能评出一家企业，究竟评谁好呢？可用泊松（Poisson）分布来解决这个问题。统计资料表明：安全管理中的事故次数、负伤人数是服从泊松分布的。服从泊松分布的随机变量取值的概率为： Xk!k P

21、 Xkek其中（为人数，为平均事故概率） npnp事件发生了至少次的概率为 x!kk xP Xxek 若，上式成为必然事件。 0x 01P X 假设两厂均不发生事故得满分 10 分。两厂的均值分别为 10 与 5，则两厂发生事故的概率为 105105(),()!kk PXkePXkekk乙甲两厂的得分为查泊松分布表，得两厂的得分表事故次数 0 1 2 3 4 5 6 7 8 9 10 得分甲厂 10 10 10 9.97 9.9 9.71 9.33 8.7 7.80 6.67 5.42 得分乙厂 10 9.93 9.60 8.75 7.34 5.60 3.84 2.3

22、7 1.33 0.68 0.32 由表可得，甲企业发生 10 起事故时得 5.42 分，乙企业发生 5 起事故得 5.60 分。故应评选乙企业为先进。案例案例 7 7、碰运气能否通过英语四级考试、碰运气能否通过英语四级考试大学英语四级考试是全面检验大学生英语水平的一种综合考试,具有一定难度.这种考试包括听力、语法结构、阅读理解、写作等.除写作占 15 分外,其余 85 道为单项选择题,每道题附有 A、B、C、D 四个选项.这种考试方法使个别学生产生碰运气和侥幸心理. 那么,靠运气能通过英语四级考试吗? 答案是否定的. 下面我们计算靠运气通过英语四级考试的概率有多大. 假定不考虑写

23、作所占的 15 分,若按及格为 60 分计算,则 85 道选择题必须要答对 51 道题以上才行,这可以看成是 85 重伯努利试验.设随机变量表示答对的题数,则,其分布律为:X)25. 0,85( BX 85 85()(0.25)0.75,0,1,2,85kkkP XkCk若要及格,必须,其概率为51X858512 85 51(51)(0.25)0.758.74 10kkkkP XC此概率非常之小,故可认为靠运气通过英语四级考试几乎是不可能发生的事件,它相当于在 1000 亿个碰运气的考生中,只有 0.874 个人可以通过考试. 然而,我们地球上只有 60 多亿人口. 案例案例 8 8、检验

24、方案的确定问题、检验方案的确定问题在某地区为了进行某种疾病普查，需要检验 N 个人的血液，可用两种方法进行，方法（一）：对每个人的血液逐个检验，这时需要检验 N 次；方法（二）：将 N 个检验者分组，每组 k 个人，把一组的 k 个人抽出的血液混合在一起进行一次检验，如果检验结果为阴性，则说明这 k 个人的血液均为阴性，这时这 k 个人总共检验了一次；如果检验结果为阳性，为了明确这 k 个人中哪些人为阳性，就要对这 k 个人再逐个进行检验，这时这 k 个人总共进行了 1 + k 次检验. 假设每个人的检验结果是否为阳性是独立的，且每个人为阴性的概率为 q. 问哪种检验方法检验次数

25、少些？对方法（二），设每个人所需检验次数是一个随机变量 X ，则 X 的分布律为 kkqqkk 1111kqqkqkEXkkk11)1)(11 (1那么，N 个人平均需要检验的次数为 )11 (kqNk由此可知，适当选择 k，使得，即当时，则 N 个人的平均需要检验的次1EXkkq1数小于 N ，这时方法（二）比方法（一）检验次数少. 如果 q 已知，还可以根据选出使其最小的整数，从而使得检验次kqEXk11 0k数最少. 比如, 若需检验 1000 人，且，则，按方法（二）平均只需进行9 . 0q40k检验次，这样可以减少约 40%的工作量，为检验工作节约大594)419

26、. 01 (10004量的人力、物力、财力. 案例案例 9 9、风险型决策模型、风险型决策模型决策是人们在政治、经济、军事和日常生活等多方面普遍存在的一种选择方案的行为. 风险型决策是指在作出决策时，由于某些随机性的因素影响，决策因存在一定的风险，称为风险型决策. 某渔船要对下个月是否出海打鱼作出决策. 如果出海后是好天，可获收益 5000 元，若出海后天气变坏，将损失 2000 元；若不出海，无论天气好坏都要承担 1000 元损失费. 据预测下月好天的概率为 0.6，天气变坏的概率为 0.4，应如何选择最佳方案? 我们将出海的收益作为随机变量，其概率分布如下： X故的数学期望为 X

27、（元） 22004 . 0)2000(6 . 05000EX 显然出海的收益比不出海的收益好. 案例案例 1010、一种很迷惑游客的赌博游戏、一种很迷惑游客的赌博游戏在一个游客很多的旅游圣地，发现一类赌博游戏。形式是这样的：摊主（以下称赌主）拿着一个装有 20 个同样大小的玻璃球的小袋，玻璃球共有红、黄、蓝、白、黑 5 种颜色，每种颜色均为 4 个球。让游客（以下称赌客）从袋中任意摸出 10 个球。如摸到红球 4 个，黄球 4 个，白球 2 个，则数字排列为 442（数字大者排前，小者排后），以摸到各种球组成的数字定输赢，其规定如下数：不同球色数字排列 4 4 2 4 3 3 4

28、 4 1 1 4 2 2 2 4 3 1 1 1 3 3 3 1 2 2 2 2 2 4 3 2 1 4 2 2 1 1 3 3 2 2 3 3 2 1 1 3 2 2 2 1 输赢金额（元） +10 +5 +5 +2 +2 +2 +1 +1 +0.5 +0.5 -2 -2.5 其中“+”表示赌客赢， “-”表示赌客输。如摸到球色数字排列为 442，则赌客赢 10 元。表面上看 12 中可能只有 2 中可能赌客输钱，似乎赌客赢钱的可能性大。也正是如此，很能吸引过往的旅客参赌。最后结果如何？若每天有 100 人参赌，则赌主每天能赢 100 来元。下面具体计算。用表示摸到某球色数字排列

29、的概率。由古典概率公式可得如下概率分布表( )iP xix（可能取法总数） 10 20184756C球色数字排列种类组合种数概率 ( )p x输赢金额 1(442)x24412 54434180C C C C C 0.0010 +10 2(433)x14233 54444480C C C C C 0.0026 +5 3(4411)x244211 544344480C C C C C C 0.0026 +5 4(4222)x143222 5444444320C C C C C C 0.0234 +2 5(43111)x1413111 54444445120C C C C C C C 0.0

30、277 +2 6(331)x33311 544245120C C C C C 0.0277 +2 7(22222)x22222 444447776C C C C C 0.0421 +1 8(4321)x1413121 544434411520C C C C C C C 0.0642 +1 9(42211)x1422211 544444417280C C C C C C C 0.0935 +0.5 10(3322)x233222 54434417280C C C C C C 0.0935 +0.5 11(33211)x2331211 544344446080C C C C C C C 0.249

31、4 -2 12(32221)x1332221 544444461920C C C C C C C 0.3741 -2.5 由上表可得赌客赢钱概率 101( )0.3765i ip x赌客输钱概率 1112()()0.6235p xp x当摸的次数很多时，赌主赢钱几乎是必然的。设随机变量为赌客每赌一次输赢的金额，则其数学期望为： X()10 0.001 5 2 0.00262 (0.02342 0.0277)1 (0.0421 0.0624)0.5 2 0.09352 0.24942.5 0.37411.04E X 从整体上看赌客每赌一次平均输 1.04 元。如果每天有 100 人参赌，则

32、赌主每天平均进帐 104 元。案例案例 1111、标准分及其应用、标准分及其应用原始分数不利于各科水平的横向比较和考试的评价分析. 一是其位置含义不明确. 原始分数是 75 分，这个分数是高还是低？该考生在全体考生中的位置靠前还是靠后？单从这个分数看不出来，因为没有一个稳定的参照点. 二是不可比. 原始分数往往受试题难度和区分度大小的影响，具有不稳定性. 题目难，原始分数就偏低；试题容易，分数就偏高，从而导致了原始分数之间的不可比性. 三是不可加. 各科原始分数、位置标准不一致，不可直接累加后比较，就像我们不能将甲乙两人口袋里的美元与港币数直接相加来比较哪个钱多一样.所以，在

33、评价学生学业水平时，为了可比性，比较一学生几门课的情况、两个学生多科的总成绩等，可将卷面分转化为标准分来比较. 对一门课，比较标准分的大小；对多门课，比较标准分总和. 标准分就是分数这个随机变量的标准化： X. DXEXX 由于标准分数分值小，并带有小数和负值，在许多情形下直接使用不大合乎人们的习惯，故通常根据具体情况，把标准分数通过线性变换化为各种导出分数. 常见的有：教育与心理测验中的分数：T=50+10Z 韦氏智力量表中各分测验的量表分：T=10+3Z 韦氏智力量表智商（离差智商）：IQ=100+15Z 美国大学入学考试委员会使用的标准分数：CEEB=500+100Z 美国教育测

34、验中心举办“托福”考试：TOEFL=500+70Z 我国出国人员英语水平考试即 EPT 所使用的分数：EPT=90+20Z 五等级分数：由标准分的值按表 4 来分段确定等级。按此方式，40 人的班，每次考试，不管原始分数如何，大约有 3 人（占 7%）不及格。美国不少大学采用这种“竞争”的评分方式。表表 4 4 标准分与五等级划分标准分与五等级划分标准分 )5 . 1,()5 . 0, 5 . 1)5 . 0 , 5 . 0)5 . 1 , 5 . 0), 5 . 1 等级不及格及格中等良好优秀比例 7% 24% 38% 24% 7% 案例案例 1212、正态分布在人才招聘中

35、的应用、正态分布在人才招聘中的应用某公司准备通过考试招工 300 名。其中 280 名正式工，20 名临时工. 实际报考人数为 1657 名. 考试满分 400 分。考试不久后，通过当地新闻媒体得到如下消息：考试平均成绩是 166 分， 360 分以上的高分考生 31 名. 某考生 A 的成绩为 256 分. 问他能否被录取？若被录取，能否是正式工？我们用正态分布来解决这个问题. 先预测最低录取分数线，记最低录取分数为。设考生成绩为 X，对一次成功的考试0x来说，X 应服从正态分布，即，从而 ),166(2NX) 1 , 0 (166NXY由题设知 165731)166360()

36、360(YPXP于是。查正态分布表，得，981. 01657311)166360(08. 2166360 从而。因此 .93)93,166(2NX因为最低录取分数线的确定，应使高于此线的考生的频率等于，即0x16573001657300)93166()(0 0xYPxXP819. 016573001)93166(0x于是 .即最低录取分数线是 251 分.251,91. 093166 00xx下面预测考生 A 的名次，其考分 256 = . x831. 0)93166256()93166256()256(YPXP故 ,此表示成绩高于考生 A 的人数约占总人数的 16.9%. 169.

37、 0831. 01)256(XP 由知考生 A 大约排在 283 名.282169. 01657 因为该考生的成绩是 256 分，大于录取分数限 251 分，因此该考生 A 能被录取. 但他的排名是 283，排在 280 名之后，所以他不能被录取为正式工，只能是临时工。案例案例 1313、预测录取分数线和考生考试名次、预测录取分数线和考生考试名次当今社会，考试作为一种选拔人才的有效途径，正被广泛采用每次考试过后，考生最关心的两个问题是：自己能否达到最低录取分数线？自己的考试名次如何？其实，学了概率之后我们可以通过二项分布来解决这些问题招工问题：招工问题：某公司通过招聘考试，准备

38、招工 300 名（其中 280 名正式工，20 名临时工），而报考的人数是 1657 名，考试满分为 400 分考试后不久，通过当地新闻媒介得到如下信息：考试总评成绩是 166 分，360 分以上的高分考生 31 名某考生 A 的成绩是 256 分，问他能否被录取？如被录取能否是正式工？解决问题：先来预测一下最低录取分数线，记该最低分数线为 0x设考生考试成绩为，则是随机变量，对于一次成功的考试来说，应服从正态分布本题中，，则 ),166(2N) 1 , 0(166N因为考试成绩高于 360 分的频率是，所以165731165731)166360()360(PP于是，981

39、. 01657311)1663600()3600(PP查正态分布表知，，即 08. 2166360 93所以 )93,166(2N因为最低录取分数线有确定应使高于此线的考生的频率等于，即0x 1657300，1657300)93166()(0 0xPxP所以 819. 016573001)931660()0(0 0xPxP查正态分布表，得，求得 01660.911593x 0250.77x 即最低录取分数线是 251 下面预测考生 A 的考试名次他的考分 x=256，查正态分布表知，166. 0834. 01)968. 0(1)93166256()256(PP这说明，考试成绩高于 25

40、6 分的频率是 0.166，也就是说成绩高于考生 A 的人数大约占总人数的 16.6%所以，考试名次排在 A 之前的人大约有（名），1657 16.6%275.06 即考生 A 大约排在第 276 名从以上分析得出：最低录取分数线为 251 分，低于考生 A 的分数，所以，考生 A 能被录取但因其考试名次大约是 276 名，排在 280 名之前，所以，有可能被录取为正式工案例案例 1414、随机变量函数的均值和标准差的近似计算方法、随机变量函数的均值和标准差的近似计算方法在工程上，已知随机变量的均值和标准差，求随机变量函数的均值和标准差的近似方法主要有泰勒展开式、变异系数法、基本函

41、数法. 例例 1 1 设、的均值、标准差分别为 .找出函数均值、XYYYXX,;,2)(XXf 标准差的近似计算公式. 对在附近进行线性逼近： 2)(XXfZXX)(2)()()(2 XXXXXXXXffXf所以， XXXXXXXXXDXD2,4)(2)(22222而 . 222)(2XXXEXDX例例 2 2 设、的均值、标准差分别为。找出函数 XYYYXX,;,均值、标准差的近似计算公式. YXYXg),(对在附近进行线性逼近： YXYXg),( XX)(,()(,(),(),(YYXYXYXXYXYgXggYXg)()(12Y YX X YYXYX所以，，即 .

42、 YX YXE)(2 4222 )(Y YXYX YXD 21 2222 2)(1 XYYX YYX案例案例 1515、如何表示考试成绩比较合理、如何表示考试成绩比较合理 TOEFEL 成绩是如何计算出来的考试成绩是考生水平的反映，考试成绩的合理表示不但能反映考生的实际水平，而且还应该尽量减少因题目难易程度对考试成绩的影响。目前，我国普遍采用百分制记分法、即满分设计为 100 分，考生在这 100 分中所得分数即为他们的成绩。这种记分法的主要缺点是分数受题目难易程度的影响很大，若考题容易，很可能大部分考生成绩都在 80 分以上，这样 80 分未必是好成绩。从这个角度看，百分制不能完

43、全反映考生实际水平的高低采用排名次的方法，或者称为秩方法，对于评定考生间的相对成绩不失为一个好办法。该方法将考生的成绩由低到高排列，考生所排位置成为该考生的秩，成绩越好的考生秩越大 (注意这与我们通常的考生的排名正好相反)，而相同成绩的考生的秩规定为这几个考生在他们应排位置上的平均数例如，某 6 位考生的考试成绩的百分制和秩方法有如下关系：百分制 90 80 70 70 65 60 秩 6 5 3.5 3.5 2 1 其中两位考生的成绩相同，他们应排在 3，4 的位置上，从而他们的秩同为(3+4) 2=3.5。秩方法也有其不足之处，由于秩的大小与考生人数有关，1000 人中的第三

44、和 10 人中的第三是难以比较的为了克服百分制和秩方法的不足，可以将百分制分数或秩改换为百分位某考生的百分位是假定有 l 00 人参加考试时，成绩等于或小于该考生成绩的人数若有 4 人参考，考生成绩的百分制及百分位有如下关系：百分制 67 78 90 95 秩 l 2 3 4 百分位 25 50 75 100 又如，若有 50 人参考，某位考生的成绩是第 11 名，倒数是第 40 名，则他的百分位为 80，也就是说，有 80同学的成绩不如他或和他持平。百分制是将满分定位 100，而百分位是将考生中的最好成绩定位 100具体算法为：百分位也有其不足之处，就是不能根据百分位确定原来的

45、考试得分。一种比较合理因而也是国际上较通用的记分方法就是标准分方法；一个考生的标准分等于一个考生的考试得分见减去全体考生得分的平均值再除以所有考生的得分的标准查 (样本方差开方)，即 i iXXYS正的标准分表示该考生的成绩高于平均分，负的标准分表示该考生的成绩低于平均分，且在一般情况下，根据中心极限定理，标准分可认为服从正态分布，这样标准分(0,1)N 不仅与考试的原始得分相对应，而且可有标准正态分布表。确定出某标准分下的相应的百分位 (即标准分小于或等于所给定标准分的概率乘 100)，由标准正态分布表可得百分位与标准分的对应关系如下表：百分位 0 l 2 3 4 5 6 7

46、 8 9 00 -2.33 -2.05 -1.88 -1.75 -1.64 -1.56 -1.48 -1.41 -1.34 10 -1.28 -1.23 -1.17 -1.13 -1.08 -1.04 -0.99 -0.95 -0.92 -0.88 20 -0.84 -0.81 -0.77 -0.74 -0.71 -0.67 -0.64 -0.61 -0.58 -0.55 30 -0.52 -0.50 -0.47 -0.44 -0.41 -0.39 -0.36 -0.33 -0 31 -0.28 40 -0.25 -0.23 -0.20 -0.18 -0.15 -0.13 -0.10 -0.0

47、8 -0.05 -0.03 50 0.00 0.03 0.05 0.08 0.10 0.13 0.15 0 18 0.20 0.23 60 0.25 0.28 0.3l 0.33 0.36 0.39 0.4l 0.44 0.47 0.50 70 0.52 0.55 0.58 0.6l 0.64 0.67 0.71 0.74 0.77 0.8l 80 0.84 0,88 0.92 0.95 0.99 1.04 1.08 1.13 1.17 1.23 90 l 28 1.34 1.41 1.48 1.56 1.64 1.75 1.88 2,05 2.33 例如，百分位-50，则标准分一 0；百分位=95，则标准分164反之若标准分为 05，则百分位69，等等 TOEFEL 自考试成绩采用标准分记分法只是为了消除标准分中的两位小数，给标准分乘上 100，另外又为了消除负号，再加上 500，即 TOEFEL：-h=1 00标准分+500 由 TOEF

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

8 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 概率统计学习补充案例

得力文库 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：概率统计学习补充案例.doc
链接地址：https://www.deliwenku.com/p-815994.html