《统计软件与分析.ppt》由会员分享,可在线阅读,更多相关《统计软件与分析.ppt(31页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、统计软件与分析,上海师范大学教育学院管理学系副教授/博士 陈勇Email:微信/QQ:27351275,DID YOU KNOWN?,关系图,3,什么是统计?,1.统计工作 对数据资料搜集、整理和分析2.统计资料 统计工作的成果 3.统计学 研究客观事物数量方面和数量关系的方法论科学,为何学习统计,时代的呼唤教育研究的科学性、严密性、实证性;克服中国人拍脑子做事情的思维习惯;质性研究与量化研究的统一21世纪必备技能。,5,统计的思维方法,就象读和写的能力一样,有朝一日会成为效率公民的必备能力Statistical thinking would one day be as necessary f
2、or efficient citizenship as the ability to read and write.,H.G.Wells,6,统计学的应用领域,流行统计软件,SASSPSSBMDPSYSTATEPINFO和EPMAPEXCEL,统计分析前的准备,数据的输入数据的转换文件格式的转换变量的分组变量的计算与变换,变量的分类,定量变量连续的:收入、身高、温度离散的:家庭人数、考试不及格的次数、发生交通事故的次数定性变量次序变量:对学校的喜欢程度(非常喜欢、比较喜欢、一般、比较不喜欢、非常不喜欢),职业技能水平(高级、中级、低级、没水平)名义变量:性别(男、女),种族(汉、蒙、满),婚姻
3、状况(未婚、已婚、离婚、丧偶),数据的基本处理,排序选择拆分计算变量转换变量可视化离散替换缺省值,分类汇总排秩,课前复习,分数练习,问卷处理,样本数(一),组别差异比较:各组至少20个以上;要求很低也要15个以上;理想:30个以上,样本数(二),样本数(三),样本抽样数与总体人数并非成比例关系;一般问卷调查研究中,正式抽样数最好在350以上;AIRSSINA 与GAY: 10%;总体小于500,20%以上;再少,30%以上;抽样样本数愈多推论的效度愈可靠,抽样方法,如何选择一个用于代表总体的样本? 数目;方法。如何抽样?,17,统计学的内容,描述性统计分析,频数分布表正态分布数据如果符合正态分
4、布,那就具备了一般统计分析的充分条件。,偏态数据,推断统计,推断统计是用已收集和分析过的样本数据去推断总体值的统计方法。差异推断统计:均数差异联合推断统计:相关推断,置信区间,置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。,举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,
5、60%),那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之五。 如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信空间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。,小概率事件(0.05)0.05显著;0.01高度显著;0.001极其高度显著小概率事件是几乎不可能发生的事情,在一次试验或观察中小概率事件发生了,于是我们有理由怀疑这一假设的真实性,拒绝原假设。原假设:没有差异/没有关联,差异推断统计,单样本均值差数检验独立双样本均值差数检验相关双样本均值差数检验独立多样本均值差数检验,练习题,用“多变量入门练习数据”,分析身高160以上(包含160)与160以下,体重上是否存在差异?用”六班成绩”中的期中数学年级平均分为87.16.试分析3班的“期中数学”成绩与之相比有无差异?6个班之间的情况又是如何?用ch6中的数据中是10个运动员新旧训练成绩,试分析新训练法有推广价值吗?,联合推断统计,双变量偏相关相关系数r,问卷的基本分析,问卷的项目分析、效度检验、信度检验作为编制正式问卷的依据。效度检验:整张问卷的可靠程度;信度检验:一致性;项目分析:主要测验个别题项的适切性或可靠程度。,难度鉴别度,极端组法同质性检验,
限制150内