spss数据文件的建立和操作.ppt
《spss数据文件的建立和操作.ppt》由会员分享,可在线阅读,更多相关《spss数据文件的建立和操作.ppt(52页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、u1.数据文件的建立u2.数据的编辑u3.数据文件的操作u4.变量级别的数据管理1.数据文件的建立u建立SPSS数据文件是利用SPSS进行数据管理和统计分析的首要工作。用于分析的数据资料有两种,一种是原始资料,需要将它们录入进SPSS软件,建立数据文件;另一种是己经被录入为其他数据格式的资料,需要将其内容导入到SPSS中。u1.1 数据文件的特点u1.2 定义变量u1.3 录入数据u1.4 外部数据的导入1.1 数据文件的特点uSPSS数据文件是一种有结构的数据文件,它由数据结构和数据内容两部分组成,其中结构部分用于定义数据类型、宽度、缺失值等,而内容才是我们具体要分析的数据。uSPSS数据文
2、件的扩展名是.sav对每个变量及相关属性的描述就是对每个变量及相关属性的描述就是SPSS 数据文件的结构数据文件的结构数据数据变量名变量名个案个案case变量变量u因此SPSS中建立数据文件的步骤包括两项工作:n定义数据文件结构(定义变量)n录入SPSS数据属性属性变量变量1.2 定义变量u可以使用File菜单中的New命令来建立一个数据文件,也可以在启动SPSS时选择Type in data选项输入新的数据文件。u在数据编辑窗口(SPSS Data Editor)中点击左下端的Variable View标签变量窗口。u在Variable View中,定义变量的属性。uSPSS中的变量有十个属
3、性:n变量名(Name)变量类型(Type) n变量宽度(Width)小数点的位数(Decimals)n变量名标签(Label)变量值标签(Values)n缺失值(Missing)列的显示宽度(Columns)n对齐方式(Align)测(计)量尺度(Measure)u要定义一个变量时,至少要定义变量名和变量类型。变量名(Name)u变量名是变量参与分析的唯一标志,定义变量结构时首先应给出每个变量的变量名。否则,系统默认为var00001、var00002、var00003等。为变量命名要遵循一定的规则。n长度少于64个字符(32个汉字),可以用汉字n要唯一,不区别大小写字符,将FAN与fan看
4、作同一个变量n尽量见名识义n不符合规则系统会给出提示变量类型(Type) (包括Width与Decimals)uSPSS的变量类型(Type)共有3种:数值型、字符型和日期型。数值型变量按不同的要求共分为标准型、逗号型、圆点型、科学计数型、美元型和自定义货币型,系统默认的为标准数值型变量(Numerical)。u单击变量视图(Variable View)中的Type选项组,选项组中右侧会出现省略号按钮,单击该按钮,会弹出Variable Type(变量类型)对话框。 u 变量长度的系统默认值可以由主菜单的Edit中的Option中的Data窗口重新设置u 字符数超过8个字符的字符型变量称为长字
5、符型变量,等于或少于8个字符的称为短字符型变量。u 字符型变量不能参与运算,系统将同一字母的大、小写认为是两个不同的字符。u自定义货币型(Custom currency)nSPSS提供5种自定义数值变量的类型。对应的自定义类型,系统自动命名为CCA、CCB、CCC、CCD、CCE型,系统默认为逗号数值型,如123456.78显示为123,456.78。n可以由主菜单的Edit中的Option中的Currency窗口定义常用的数值型变量。u 例如,要定义人民币的输入格式,则在Prefix文本框中输入“¥”,在Suffix文本框中输入“元”,则在数据编辑窗口定义为CCA类型的数据中,输入1234,
6、数据显示为“¥1,234元”。 测(计)量尺度(Measure)u统计数据是对客观现象计量的结果,按照对事物计量的精确程度,可将所采用的计量尺度由低级向高级分为:定类尺度、定序尺度、定距尺度、定比尺度。uNorminaln 定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。定类变量的特点是其值仅代表了事物的类别和属性,仅能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序或等级。n 在SPSS中,能使用定类尺度的数据可以是数值型,也可以是字符型变量。必须符合穷尽和互斥的原则。穷尽的原则就是指每个个体都必须能归为一个类别,互斥的原则是指每个个体都只能归为一个类
7、别。n 相应变量为定类变量或(无序)分类变量。uOrdinaln定序尺度是对事物之间等级或顺序差别的一种测度。n定序尺度的特点是可以测度类别差,还可以测度次序差,但是定序尺度无法测出数据之间的准确差值,所以其计量结果只能排序,不能进行算术四则运算。n对定类尺度的变量只能计算频数和频率量。定序变量除可以计算频率之外,还可以计算累计频率。n相应变量为定序变量或有序分类变量。uIntervaln 定距尺度是对事物类别或次序之间间距的测度。定距变量的特点是其不仅能将事物区分为不同类型并进行排序,而且可准确指出类别之间的差距是多少。 n 测量结果往往表现为数值,所以计量结果可以进行加减运算。uScale
8、n 定比尺度是能够测算两个测度值之间比值的一种计量尺度,它的测量结果同定距变量一样也表现为数值,其与定距变量的差别在于有一固定的绝对“零点”,而定距变量则没有,定距变量中的“0” 并不表示“没有”,仅仅是一个测量值,而定比变量中的“0” 就真正表示“没有”。n 定比变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有可计算两个测度值之间比值的特点,因此它可进行加、减、乘、除运算,而定距变量只可进行加减运算。u由于定距尺度与定比尺度在绝大多数统计分析中没有本质上的差别,在SPSS中就将其合并为一类,统称为“Scale”测量尺度(间隔尺度)。u相应变量为间隔变量或连续性变量。u
9、在这4种测量尺度之间,按照信息量的高低,可将高层次测量尺度的测量结果转换为低层测量尺度的测量结果,但这样会损失一部分信息。不能将低层次的测量尺度转换为高层次测量尺度的结果,这样可能会引入错误的信息。u当输入的是数字时,系统默认的是Scale,当输入的是字符串时,系统默认的是Nominal。变量名标签(Label)与变量值标签(Values)u变量名标签(Label)n 变量名标签是对变量名附加的解释说明,增加结果数据的可读性。由于早期版本的变量名不能超过八个字符,有时不能清楚地表达变量的含义,这时要靠变量名标签来对变量名加以解释。如果变量名有标签,系统在输出时以标签代替变量名输出。u变量值标签
10、(Value)n 是对变量的具体数值所代表的意义的标注。n 大多数变量值都是以符号或数字来表示的。但对于定类变量和定序变量,用数字或符号不能够很明确地表现出变量值的意义时,可以用变量值标签来说明它们所代表的实际意义。u 定义完变量值标签后,在SPSS主窗口中,在菜单栏中选择View | Value Labels命令,则在SPSS主窗口中经过变量值标签定义的数值型变量显示为所定义的变量值。缺失值(Missing)uMissing项是一个重要而且容易被忽视的选项,它用于定义变量缺失值。u缺失值Missing,即错误的数据,对于没有测量到的和测量、记录、录入错的数值,在SPSS中可以处理成缺失值。u
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 数据文件 建立 操作
限制150内