变异系数与相关系数PPT讲稿.ppt
变异系数与相关系数变异系数与相关系数第1页,共29页,编辑于2022年,星期六變異係數與相關係數 變異係數(coefficient of variation)相關係數(correlation coefficient)第2页,共29页,编辑于2022年,星期六變異係數(coefficient of variation)變異係數定義為樣本標準差除以樣本平均數。有時也用百分比表示:第3页,共29页,编辑于2022年,星期六第4页,共29页,编辑于2022年,星期六相關係數(correlation coefficient)可以顯示兩連續變數x,y之間的關聯形式與強度:觀念自變項x依 變項y第5页,共29页,编辑于2022年,星期六XY(a)X與Y之間的關係為線性還是非線性?第6页,共29页,编辑于2022年,星期六XY(b)X與Y之間的關係為線性還是非線性?第7页,共29页,编辑于2022年,星期六XY(c)X與Y之間的關聯強度為何?第8页,共29页,编辑于2022年,星期六XY(d)X與Y之間的關係是正向還是反向?第9页,共29页,编辑于2022年,星期六Covariance,共變異數我們用簡單圖形可以來瞭解兩變數x與y之間的關係。另一種分析兩變數關係的統計技術為相關分析(correlation analysis)。兩個隨機變數之間的共變關係為何?觀念第10页,共29页,编辑于2022年,星期六Covariance,共變量假設兩隨機變數Y與X之間具有某種關聯,測量兩變數之間是否有關連的一個有效指標為共變異數(covariance)觀念樣本變異數第11页,共29页,编辑于2022年,星期六相關係數(correlation coefficient)設有兩組樣本X1、X2、X3、Xn及Y1、Y2、Y3、Yn,其樣本平均數分別為X、Y樣本標準差分別為Sx、Sy,且兩組樣本之樣本共變異數(covariance)定義為Sxy 第12页,共29页,编辑于2022年,星期六IIIIIIVI(14-10)(8-5)=(4)(3)(6-10)(3-5)=(-4)(-2)第13页,共29页,编辑于2022年,星期六IIIIIIVI(13-10)(8-5)=(-3)(3)(5-10)(8-5)=(-5)(3)第14页,共29页,编辑于2022年,星期六相關係數 r 定義為 兩組樣本之間的相關程度,其值介於-1與1之間。第15页,共29页,编辑于2022年,星期六XY(a)r=0.8第16页,共29页,编辑于2022年,星期六XY(b)r=.95第17页,共29页,编辑于2022年,星期六XY(c)r=0第18页,共29页,编辑于2022年,星期六XY(a)r=0第19页,共29页,编辑于2022年,星期六XY(d)r=-.90第20页,共29页,编辑于2022年,星期六XY(c)r=-0.5第21页,共29页,编辑于2022年,星期六相關係數的強弱r=1 為完全相關r=0 為無相關第22页,共29页,编辑于2022年,星期六最小平方法(least squares method)若有 n 筆資料(x1,y1)、(x2,y2)、(x3,y3)、(xn,yn)假設 y 對 x 的線性迴歸線為 Y=0+1 X最小平方法主要是求出迴歸係數0,1,使(Yi-(0+1 X)2最小。第23页,共29页,编辑于2022年,星期六可解出迴歸係數分別為 第24页,共29页,编辑于2022年,星期六設甲、乙兩班某次數學考試成績,甲班樣本平均數為60分,樣本標準差為18分,乙班樣本平均數為65分,樣本標準差為13分。甲班CV=18/60*100%=30%乙班CV=13/65*100%=20%第25页,共29页,编辑于2022年,星期六某機構曾研究溫度對翻車魚(sunfish)的存活之影響。在一定溫度下,經 x 單位時間,翻車魚存活 y 比例的數據如下:(0.10,1.00),(0.15,0.95),(0.20,0.95),(0.25,0.90),(0.30,0.85),(0.35,0.70),(0.40,0.65),(0.45,0.60),(0.50,0.55),(0.55,0.40),第26页,共29页,编辑于2022年,星期六第27页,共29页,编辑于2022年,星期六运用变异系数时应注意(1)有关的事物间才能作比较,不要将风马牛不相及的东西硬拉在一起作比较;(2)均数小于标准差时应考虑其实际运用价值。因为在这种情况下,可能誇大变异,故不宜使用;(3)比较两变异系数间是否真有差别,亦应作假设检验,不能只看表面值就下结论。第28页,共29页,编辑于2022年,星期六变异系数是以相对数形式表现的变异指标。它是通过变异指标中的全距、平均差或标准差与平均数的对比得到的。常用的是标准差系数。变异系数的应用条件应用条件是:当所对比的两个数列水平高低不同时,就不能用全距、平均差、标准差进行对比分析,因为它们都时绝对指标.其数值的大小不仅受各单位标志差异程度的影响,而且受到总体各单位标志值本身水平高低的影响;为了对比分析不同水平变量数列之间标志值的变异程度,就必须消除数列水平高低的影响,这时就要计算变异系数第29页,共29页,编辑于2022年,星期六