单变量的统计描述讲稿.ppt
《单变量的统计描述讲稿.ppt》由会员分享,可在线阅读,更多相关《单变量的统计描述讲稿.ppt(23页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、单变量的统计描述单变量的统计描述第一页,讲稿共二十三页哦一、变量的层次一、变量的层次1 1、定类变量、定类变量、定类变量、定类变量 定类变量是变量层次最低的定类变量是变量层次最低的定类变量是变量层次最低的定类变量是变量层次最低的,它的取值只有类别属性之分它的取值只有类别属性之分它的取值只有类别属性之分它的取值只有类别属性之分,而无大小程度之分而无大小程度之分而无大小程度之分而无大小程度之分.如如如如民族民族民族民族,婚姻等婚姻等婚姻等婚姻等.2 2、定序变量、定序变量、定序变量、定序变量 定序变量的层次高于定类变量定序变量的层次高于定类变量定序变量的层次高于定类变量定序变量的层次高于定类变量.
2、它的取值除了有类别属性之外它的取值除了有类别属性之外它的取值除了有类别属性之外它的取值除了有类别属性之外,还有等级次序的差别还有等级次序的差别还有等级次序的差别还有等级次序的差别.常见的如受教育程度常见的如受教育程度常见的如受教育程度常见的如受教育程度,满意度满意度满意度满意度,社会经济地位等社会经济地位等社会经济地位等社会经济地位等.3 3、定距变量、定距变量、定距变量、定距变量 定距变量的层次又高于定序变量定距变量的层次又高于定序变量定距变量的层次又高于定序变量定距变量的层次又高于定序变量.定距变量的取值定距变量的取值定距变量的取值定距变量的取值,除了具有次序属性外除了具有次序属性外除了具
3、有次序属性外除了具有次序属性外,取值之间的距离取值之间的距离取值之间的距离取值之间的距离可以度量可以度量可以度量可以度量.如家庭住房面积如家庭住房面积如家庭住房面积如家庭住房面积,家庭人口数等家庭人口数等家庭人口数等家庭人口数等.4 4、定比变量、定比变量、定比变量、定比变量 定比变量是将两类相关的数加以对比,形成的相对数,用以反映现象的构成、比重、定比变量是将两类相关的数加以对比,形成的相对数,用以反映现象的构成、比重、定比变量是将两类相关的数加以对比,形成的相对数,用以反映现象的构成、比重、定比变量是将两类相关的数加以对比,形成的相对数,用以反映现象的构成、比重、密度和速度等数量关系。例如
4、将家庭人口数与家庭总支出对比计算家庭人均支出密度和速度等数量关系。例如将家庭人口数与家庭总支出对比计算家庭人均支出密度和速度等数量关系。例如将家庭人口数与家庭总支出对比计算家庭人均支出密度和速度等数量关系。例如将家庭人口数与家庭总支出对比计算家庭人均支出水平。水平。水平。水平。第二页,讲稿共二十三页哦二、二、二、二、单变量的统计描述方法单变量的统计描述方法 基本描述基本描述基本描述基本描述 集中趋势集中趋势集中趋势集中趋势离散趋势离散趋势离散趋势离散趋势定类层次定类层次定类层次定类层次 次数、比例、比率、次数、比例、比率、次数、比例、比率、次数、比例、比率、表格、图示表格、图示表格、图示表格、
5、图示 众数众数众数众数异众比率异众比率异众比率异众比率 定序层次定序层次定序层次定序层次 次次次次数数数数、比比比比例例例例、比比比比率率率率、表表表表格格格格、图图图图示示示示、累累累累计计计计次次次次数、累计百分比数、累计百分比数、累计百分比数、累计百分比中位数中位数中位数中位数四分位差四分位差四分位差四分位差 定距层次定距层次定距层次定距层次 次数、比例、比率、次数、比例、比率、次数、比例、比率、次数、比例、比率、表格、图示、累计次表格、图示、累计次表格、图示、累计次表格、图示、累计次数、累计百分比、分数、累计百分比、分数、累计百分比、分数、累计百分比、分组组组组 均值均值均值均值标准差
6、标准差标准差标准差 第三页,讲稿共二十三页哦(一)分布(一)分布(一)分布(一)分布 统计表统计表统计表统计表 统计图统计图统计图统计图1 1、分布分布分布分布 统计学里的分布是指一个概念或变量,它的各种情况出现的次数或频数,也称频次分布。如统计学里的分布是指一个概念或变量,它的各种情况出现的次数或频数,也称频次分布。如统计学里的分布是指一个概念或变量,它的各种情况出现的次数或频数,也称频次分布。如统计学里的分布是指一个概念或变量,它的各种情况出现的次数或频数,也称频次分布。如住房产别包括住房产别包括住房产别包括住房产别包括1212种情况,按被访人的回答,可以得到种情况,按被访人的回答,可以得
7、到种情况,按被访人的回答,可以得到种情况,按被访人的回答,可以得到1212对数据:对数据:对数据:对数据:(x1x1,n1)n1),(x2(x2,n2)n2)(x12(x12,n12).n12).括号中的第一项表示变量的可能选项,第二项表示所对应的频次。括号中的第一项表示变量的可能选项,第二项表示所对应的频次。括号中的第一项表示变量的可能选项,第二项表示所对应的频次。括号中的第一项表示变量的可能选项,第二项表示所对应的频次。需要注意的是:需要注意的是:需要注意的是:需要注意的是:(1)(1)变变变变量取值必须完备,只有这样才能使被访者一一无遗地进行归类。量取值必须完备,只有这样才能使被访者一一
8、无遗地进行归类。量取值必须完备,只有这样才能使被访者一一无遗地进行归类。量取值必须完备,只有这样才能使被访者一一无遗地进行归类。(2)(2)变量取值必须互斥,变量取值必须互斥,变量取值必须互斥,变量取值必须互斥,这样才能使每一个观察值归入一类,且仅仅归入一类。这样才能使每一个观察值归入一类,且仅仅归入一类。这样才能使每一个观察值归入一类,且仅仅归入一类。这样才能使每一个观察值归入一类,且仅仅归入一类。2 2、统计表、统计表、统计表、统计表 用表格形式来表示变量的分布。统计表必须具备的内容有:表号用表格形式来表示变量的分布。统计表必须具备的内容有:表号用表格形式来表示变量的分布。统计表必须具备的
9、内容有:表号用表格形式来表示变量的分布。统计表必须具备的内容有:表号(统计表统计表统计表统计表x x,x)x),表头,表头,表头,表头(包括标题、时间、地点包括标题、时间、地点包括标题、时间、地点包括标题、时间、地点),标识行,标识行,标识行,标识行(产别、频数、频率产别、频数、频率产别、频数、频率产别、频数、频率),主体行主体行主体行主体行(第一项位置,按列填写变量的不同选第一项位置,按列填写变量的不同选第一项位置,按列填写变量的不同选第一项位置,按列填写变量的不同选项;第二项位置,按列填写变量取值相应的频次和百分比等等项;第二项位置,按列填写变量取值相应的频次和百分比等等项;第二项位置,按
10、列填写变量取值相应的频次和百分比等等项;第二项位置,按列填写变量取值相应的频次和百分比等等)。要写明统计的总数。表尾需要写清资。要写明统计的总数。表尾需要写清资。要写明统计的总数。表尾需要写清资。要写明统计的总数。表尾需要写清资料来源。料来源。料来源。料来源。第四页,讲稿共二十三页哦定类变量的统计表定类变量的统计表定类变量的统计表定类变量的统计表表表表表1 1、天津市居民住房的产别分布、天津市居民住房的产别分布、天津市居民住房的产别分布、天津市居民住房的产别分布(1997)(1997)产别产别次数次数百分比百分比1 1、直管公产、直管公产43143143.143.12 2、单位产、单位产169
11、16916.916.93 3、自有资产、自有资产13713713.713.74 4、房改购全部产权、房改购全部产权18718718.718.75 5、房改购部分产权、房改购部分产权52525.25.26 6、合作产权、合作产权2 20.20.27 7、军产、军产10101.01.08 8、宗教产、宗教产10101.01.01212、其他产、其他产2 20.20.2TotalTotal10001000100.0100.0第五页,讲稿共二十三页哦教育教育fcf cf%C%C%一级一级685506812.4100.012.4二级二级9048215816.387.628.7三级三级1063922641
12、9.371.348.0四级四级19328645735.152.083.1五级五级939355016.916.9100.0总数总数550100.0定序变量统计表定序变量统计表定序变量统计表定序变量统计表 表表表表2 2 某企业员工的教育水平某企业员工的教育水平某企业员工的教育水平某企业员工的教育水平第六页,讲稿共二十三页哦定距变量统计表定距变量统计表定距变量统计表定距变量统计表表表3 3、天津市不同收入组居民的住房与收入现状、天津市不同收入组居民的住房与收入现状(1997)(1997)收入的十等份收入的十等份分组分组使用面积(平使用面积(平方米)方米)居住面积(平居住面积(平方米)方米)月租金(
13、元)月租金(元)家庭月平均收家庭月平均收入(元)入(元)1 128.4928.4919.3419.3417.6817.68472.00472.002 233.6533.6523.0423.0426.2826.28726.83726.833 336.3836.3823.7123.7122.9022.90867.42867.424 432.4532.4522.0222.0224.5724.571003.861003.865 536.1736.1724.2924.2924.2124.211154.361154.366 638.9038.9026.9226.9226.9626.961306.41130
14、6.417 740.0840.0826.6426.6429.9529.951481.371481.378 842.2542.2526.9726.973.643.641673.791673.799 943.5843.5826.8026.8029.1329.131995.301995.30101058.7058.7034.6634.6630.4230.422955.382955.38第七页,讲稿共二十三页哦定距变量制表需要考虑的问题定距变量制表需要考虑的问题定距变量制表需要考虑的问题定距变量制表需要考虑的问题1 1、组数、组数 组数太少会掩盖变量变动时频次的变化,组数太多,会使每组内频次过少,看不
15、出明组数太少会掩盖变量变动时频次的变化,组数太多,会使每组内频次过少,看不出明显的规律。一般根据理论和经验进行分组。显的规律。一般根据理论和经验进行分组。2 2、等距分组与非等距分组、等距分组与非等距分组 一般情况下采用等距分组,但研究一些特殊问题,如贫困问题,需要对低收入分得细一些。一般情况下采用等距分组,但研究一些特殊问题,如贫困问题,需要对低收入分得细一些。3 3、组限(组限(class limitsclass limits)就是每组的范围,包括上限和下限。对于离散型变量一般采取相邻就是每组的范围,包括上限和下限。对于离散型变量一般采取相邻组限不重叠的原则,而对于连续型变量,可能出现相邻
16、组限重叠的情况,这时采取的组限不重叠的原则,而对于连续型变量,可能出现相邻组限重叠的情况,这时采取的原则就是原则就是“上组限不在内上组限不在内”原则。原则。4 4、分组步骤、分组步骤第一,搜集数据第一,搜集数据;第二,在数据中找出最大值第二,在数据中找出最大值L L,最小值最小值S S及极差值及极差值R;R;第三,把数据分组,如第三,把数据分组,如K K组组;第四,计算组距第四,计算组距h;h;第五,计算组中值第五,计算组中值 。第八页,讲稿共二十三页哦3 3、统计图、统计图、统计图、统计图定类变量定类变量:圆瓣图圆瓣图;条形图条形图定序变量定序变量:条形图条形图定距变量定距变量:直方图直方图
17、;折线图折线图第九页,讲稿共二十三页哦第十页,讲稿共二十三页哦(二)集中趋势测量法(二)集中趋势测量法(二)集中趋势测量法(二)集中趋势测量法(1 1)集中趋势测量法)集中趋势测量法)集中趋势测量法)集中趋势测量法(measures of central tendency)measures of central tendency):就是找:就是找:就是找:就是找出一个数值来代表变量的资料分布,以反映资料的集结情况。该方出一个数值来代表变量的资料分布,以反映资料的集结情况。该方出一个数值来代表变量的资料分布,以反映资料的集结情况。该方出一个数值来代表变量的资料分布,以反映资料的集结情况。该方法的
18、意义,就是根据该代表值法的意义,就是根据该代表值法的意义,就是根据该代表值法的意义,就是根据该代表值(或称典型值或称典型值或称典型值或称典型值)来估计或预测每个研究来估计或预测每个研究来估计或预测每个研究来估计或预测每个研究对象的数值。对象的数值。对象的数值。对象的数值。(2 2)运用该方法要舍去)运用该方法要舍去)运用该方法要舍去)运用该方法要舍去 变量的某些信息,但由于所根据的数变量的某些信息,但由于所根据的数变量的某些信息,但由于所根据的数变量的某些信息,但由于所根据的数值最有代表性,所产生的误差最小。值最有代表性,所产生的误差最小。值最有代表性,所产生的误差最小。值最有代表性,所产生的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变量 统计 描述 讲稿
限制150内