集中趋势和离中趋势.pptx
《集中趋势和离中趋势.pptx》由会员分享,可在线阅读,更多相关《集中趋势和离中趋势.pptx(58页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、 算术平均的统计含义:算术平均数是同质总算术平均的统计含义:算术平均数是同质总体各数据偶然性、随机性特征互相抵消后的稳定数体各数据偶然性、随机性特征互相抵消后的稳定数值。反映数据集中的特征。值。反映数据集中的特征。例例 某生产班组某生产班组1111个工人的日产零件数分别为:个工人的日产零件数分别为:1515,1717,1919,2020,2222,2626,3030。求该生产班组工人的平均。求该生产班组工人的平均日产零件数。日产零件数。2222解:解:第1页/共58页 算术平均值的性质一算术平均值的性质一:数据观察值与均值的离数据观察值与均值的离差值之和为零差值之和为零.此性质表明均值是各数值
2、的重心 算术平均值的性质二:观察值与均值的离差平方和最小。为任意数 故用算术平均值来预测作为估计值,误差平方和最小。第2页/共58页数列数列:1,2,2,3 :1,2,2,3 平均数为平均数为2 2数列数列:1,2,2,5 :1,2,2,5 平均数为平均数为2.52.5数列数列:1,2,2,7 :1,2,2,7 平均数为平均数为3 3均值的缺点:均值易受极端值的影响,某个极端大值或极端小值都会影响均值的代表性。同时还影响其对集中趋势测度的准确性。第3页/共58页500 1 2 3 4 5 6 7 数列数列:1,2,2,3 :1,2,2,3 平均数为平均数为2 2数列数列:1,2,2,5 :1,
3、2,2,5 平均数为平均数为2.52.5数列数列:1,2,2,7 :1,2,2,7 平均数为平均数为3 3第4页/共58页极端值比较500 1 2 3 4 5 6 7 500 1 2 3 4 5 6 7 500 1 2 3 4 5 6 7 数列:1,2,2,3数列:1,2,2,5数列:1,2,2,7 平均数 左图是三个直方图,平均数用箭头标出,当蓝色矩形移向右方时,它牵着平均数跟着走。在平均数处直方图保持平衡,面积以它们离开平衡点的距离而被加权。第5页/共58页2.加权算术平均数加权算术平均数 如果数据是分组资料,经过整理形成了次数分如果数据是分组资料,经过整理形成了次数分配,由于各组次数不同
4、,要用次数作权数计算加权配,由于各组次数不同,要用次数作权数计算加权算术平均数。算术平均数。则均值的计算公式为:则均值的计算公式为:其中Xi 表示第i 组的组中值,fi表示第i组的次数。第6页/共58页工人一周生产零件数工人一周生产零件数工人数工人数fi组中值组中值xixifi60以下以下75538560-702165136570-802575187580-901985161590以上以上895760合计合计80-6000例:某单位80工人一周生产零件数的分组统计资料如下表:第7页/共58页二、中位数 将数据观察值将数据观察值x x1 1,x,x2 2,x,xn n按其变量值由小到按其变量值由
5、小到大的顺序排列,大的顺序排列,处于数列中点位置的数值就是中位处于数列中点位置的数值就是中位数(数(M Me e)。中位数的确定方法:如果数据个数为奇数,则处于(n+1)/2位置的标志值是中位数。如果数据个数为偶数,则处于n/2、n/2+1的两个标志值的平均数为中位数。第8页/共58页如果是组距分组资料,公式为:中位数是n/2位置上的数值,设落在第i组,Li是中位数所在组的下限,Ui是中位数所在组的上限;fi是中位数所在组的次数。Fi-1是中位数所在组的前一组的累积次数 Ui-Li是中位数所在组的组距=上限-下限向上累积向上累积向下累积向下累积第9页/共58页某单位80工人一周生产零件数分组统
6、计资料如下:工人一周生工人一周生产零件数产零件数工人数工人数fi组中值组中值xixifi向上累计频向上累计频数数向下累计频向下累计频数数60以下75538578060-7021651365287370-8025751875535280-9019851615722790以上895760808合计80-6000-121328第10页/共58页 优点:优点:中位数是位置平均数,不受极端值的影响。中位数是位置平均数,不受极端值的影响。各个数值相对其中位数的绝对离差之和为最小。各个数值相对其中位数的绝对离差之和为最小。不足:不足:中位数确定时只与中间位置的相关数据有关,而中位数确定时只与中间位置的相关数
7、据有关,而不考虑其它数值的大小,缺乏敏感性;计算复杂。不考虑其它数值的大小,缺乏敏感性;计算复杂。第11页/共58页三、众 数众数是一组资料中出现次数最多的那个数值,也反映数据集中的程度(M M0 0 )。未分组资料,M M0 0就是出现次数最多的变量值。2020,1515,1818,2020,2020,2222,2020,2323 众数为20202020,2020,1515,1919,1919,2020,1919,2525 众数为1919,20201010,1111,1313,1616,1515,25 25,8 8,1212 不存在众数第12页/共58页分组资料:在等距分组的情况下,频数最多
8、的组是众数组,在该组内确定众数。设众数在第设众数在第i i组,则组,则 Li是众数所在组的下限,Ui是众数所在组的上限;fi是众数所在组的次数。di=Ui-Li是中位数所在组的组距=上限-下限第13页/共58页某单位80工人一周生产零件数分组统计资料如下:工人一周生工人一周生产零件数产零件数工人数工人数fi组中值组中值xixifi向上累计频向上累计频数数向下累计频向下累计频数数60以下75538578060-7021651365287370-8025751875535280-9019851615722790以上895760808合计80-6000-第14页/共58页60以下以下70809090
9、以上以上102030f(人数)人数)周生产零件数周生产零件数 1 2M0第15页/共58页第16页/共58页在Excel中AVERAGEAVERAGE()计算算术平均数如:AVERAGEAVERAGE(F1:F30F1:F30)利用SUMSUM()函数和SUMPRODUCTSUMPRODUCT()函数求加权算术平均。如:SUMPRODUCT SUMPRODUCT(A1:A10,B1:B10A1:A10,B1:B10)/SUM/SUM(B1:B10B1:B10)MEDIANMEDIAN()计算中位数MEDIAN MEDIAN(F1:F30F1:F30)MODEMODE()计算众数MODEMODE
10、(F1:F30 F1:F30)第17页/共58页四、均值、中位数、众数三者之间的关系XfXfXf(对称分布对称分布)正偏态分布(右)正偏态分布(右)负偏态分布负偏态分布(左)左)均值是数据分布的平衡点或重心,中位数把这个分布划分为两半,众数正好是分布的顶端。第18页/共58页在偏斜不大时,中位数大约位于均值与众数的在偏斜不大时,中位数大约位于均值与众数的1/3处。处。第19页/共58页 算术平均数适合用代数方法运算,故在实践中应用很广,主要适用于数值变量;中位数不受极端值的影响,各个数值相对其中位数的绝对离差之和为最小。故当一组观测值有极大值或极小值时,用中位数表示现象的一般水平更具有代表性。
11、众数适用于总体的单位数较多,各标志值的次数分配有明显的集中趋势的情况。如果总体单位数很少,尽管次数分配较集中,那么计算出来的众数意义不大;如果总体单位数很多,但次数分配不集中,即各单位的标志值在总体中出现的比重较均匀,那么也无所谓众数。第20页/共58页五、集中趋势的其它测度量1.1.分位数:四分位数、十分位数、百分位数。分位数的计算:(1 1)将资料按大小顺序排列;(2 2)求出分位数所在位置i i;(3 3)若i i为整数,则所求分位数为该位置上的数值;若i i为非整数,则取第i i与第i+1i+1位置的两个数值的平均数为所求分位数。(4 4)若资料为分组数据,则各分位数可按下式计算:K
12、Ki i表示第表示第i i个个K K分位数;分位数;L Li i表示第表示第i i个个K K分位数所在组的下限;分位数所在组的下限;N N表示数据总个数;表示数据总个数;F Fi-1i-1表示第表示第i i个个K K分位数所在组的前一组的累积分位数所在组的前一组的累积次数;次数;f fi i是第是第i i个个K K分位数所在组的次数。分位数所在组的次数。d di i=U=Ui i-L-Li i是第是第i i个个K K分位数分位数所在组的组距。所在组的组距。第21页/共58页其中 表示中位数的位置取整。这样计算出的四分位数的位置,要么是整数,要么在两个数之间0.5的位置上四分位数的位置确定方法:
13、四分位数的位置确定方法:方法方法1:定义算法:定义算法方法方法2:以中位数为中心,从两端再计算中位数,公式:以中位数为中心,从两端再计算中位数,公式:第22页/共58页方法3 Excel给出的四分位数位置的确定方法 无论哪种算法,如果位置是整数,四分位数就无论哪种算法,如果位置是整数,四分位数就是该位置对应的值;如果是在是该位置对应的值;如果是在0.50.5的位置上,则取该的位置上,则取该位置两侧值的平均数;如果在位置两侧值的平均数;如果在0.250.25或或0.750.75位置上,位置上,则四分位数等于该位置的下侧值加上按比例分摊位则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 集中 趋势
限制150内