sas基本统计情况文本笔记.doc
《sas基本统计情况文本笔记.doc》由会员分享,可在线阅读,更多相关《sas基本统计情况文本笔记.doc(68页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Range极差极差 mean(1,2,3)平均平均 std 标准差标准差/*自动导入*/Libname cwb “”;proc import datafile=“E:WORK杂七杂八SAS数据库分期乐入池数据明细数据(风险指标监控表sheet=风险指标监控表总表;getnames=yes; 导入源文件字段名作为SAS数据集的字段名自动导入%macro chouc(today_date);datafile=“C:Users、sheet=“、“;run;%mend;%chouc(20170116);、proc export data=sashelp.carsoutfile=/folders/myf
2、olders/sasuser.v94/TutorialsPoint/car_data.csvdbms=csv;run;/4*先排序*/proc sort data=new_cy2;by _COL1 ;run;/*标题*打印*/proc print ;title 员工薪水;RUN;proc print data=cwb.result20170208 label;id package;var overdue_principal_za overdue_principal_fql; label overdue_principal_za=“、“ overdue_principal_fql=“、“ ;ru
3、n;proc print data=cwb.result20170208;where principal_sell 20000000;run;/*、*/1proc tabulate data=work.risk005b;class _COL22; 、var _COL5;、table _COL22 _COL5;、/、math chinese、*、mean var、run;2proc tabulate data=work.risk005b;class _COL22;var _COL5 _COL4;table _COL22, (_COL4 _COL5)*(mean max min);run;tabl
4、e _COL22 all, (_COL4 _COL5)*(mean max min); 、 ALL、 2.、 table (_COL22 all)*(_COL4)*(mean);、 table (sex all), (math chinese)*(mean std);keylabel mean=、 std=、 all=、;label sex=、 math=、 chinese=、;run;-/*复制*强制追加*把B加到A中*而SET是要新建一个的*/proc append base=chouc.chouc01 data=chouc.chouc02 force;/*force强制*/run;/*复
5、制*强制追加*把B加到A中*而SET是要新建一个的*/proc sort data=chouc.chouc01 dupout=chouc.bb noduprecs;/*noduprecs一行完全相同的重复记录*/by descending _COL0 ;run;-/*sql*联合查询*/Proc sql;Select * from aUnion /*多个查询结果合并成一个结果,并去掉重复*/Intersect /*查询公共部分数据*/Except /*把公共部分去掉的数据*/Outer union /*对多个查询结果横向合并*/Select * from b;Quit;-/*去*重复*方法之一
6、*/只显示nameselect name from tb group by name having count(*) 1显示所有数据select * from name in (select name from tb group by name having count(*) 1)*2、输出重复的观测值,使用nodupkey选项,注意:使用该选项后直接将原数据集中的重复值删除。注意dupout和out的区别;proc sort data=clasdata dupout=dups3 nodupkey;by name class;run;*输出不重复的观测值。;proc sort data=cla
7、sdata out=nodups4 nodupkey;by name class;run;*3、去掉重复的观测值使用nodup选项。;proc sort data =Clasdata out =NODUPS5 nodup;by name class;run ;/*删除*2017年1月3日的数据*/data cwb.result;set cwb.result;if account_time=“03jan2017“d then delete;run;SQL 去重复:SELECT DISTINCT “栏位名栏位名“FROM “表格名表格名“举例来说,若要在以下的表格,举例来说,若要在以下的表格,St
8、ore_Information,找出所有不同的店名时,找出所有不同的店名时,Store_Information表格表格store_name Sales Date1$1500 Jan-05-19992$250Jan-07-19991$300Jan-08-19993$700Jan-08-1999我們就鍵入,我們就鍵入,distinctSELECT DISTINCT store_name FROM Store_Information結果結果:123-/*频率*一般用这个*/proc freq data = asd;tables .变量 run;/*、*、*/proc summary data=wor
9、k.risk004 mean max min cv var;class _COL4;var _COL4;output out=aa mean=a max=b min=c cv=d var=e;run;proc print data=work.aa;run;/*分类*频次*/proc means data=cwb.Overdue20170102;var veight;/*变量占比,即在总体中的相对重要程度*/freq _COL4;/*按照_COL4求观测值频度*/class _COL222;/*按_COL22分类*/run;/*MEANS、SUMMARY*、*、 PLOTS 、/NORMAL 、
10、*/proc univariate data=work.aa plots ;var _col4;run;/*取第2行到第10行的数据*/Data aa;Set aaa (firstobs=2 obs=10)/*取前2行数据*/Data aa;Set aaa (obs=2);Run;-/1*筛选例*/data a(where=(_COL101500);set cy;where _COL2118 and _COL181500;where _COL29=“上班人群“;run;-/2*有7000个人,随机抽样25个*/PROC SURVEYSELECT DATA = a out = new_cy2 m
11、ethod = srs /*固定格式*/n =25 seed = 7000;RUN;/*读取*几条记录*/PROC SQL NUMBER OUTOBS=3;SELECT * FROM WORK.A;QUIT;/3*有1000个人,按性别(sex)分为两层,每层按0.1的比例抽样*/proc surveyselect data=cout=dmethod=srssamprate=0,1seed=25070419; strata sex;run; proc print data=d;run;/*分层抽取*/proc surveyselect /*随机*/data = Work.chouc01out
12、= chouc.chouc01method = srssampsize = (5, 5,15 )/*抽取数据量*顺序与分层例相同*/noprint;strata _col22; /*分层*/run;/*求平均值*/proc sql;select _COL3,mean(loan_amt,repay_amount)from fql;quit;/* N,10分位等 proc means data=wj.yrs_201612 N P1 p10 p25 p50 p75 p90 p99 min max mean sum maxdec=2;/*规定最多输出2位小数*/vars crlim epp_amt R
13、_prin eve_prin age FEE_RATE epp_num R_num;run;-/*更新*已知数据集A和B,用A做为主数据集,生成新数据AB*/data ab;update a b;by id;/*根据卡号更新数据*/run;/*模型*reg回归分析*/proc reg data=cwb.Overdue20170102;model _COL21= _COL22;run; 统计关键字( 1. means 过程的一般格式proc means 选项列表;by 变量名称(分组变量);class 变量名称(分组变量);freq 变量名称(数值变量,用以表示相应记录出现的频数)weight
14、变量名称(数值变量,用以表示相应记录的权重系数)var 变量名称(待分析的数值变量);run;univariate 过程的一般格式proc univariate 选项列表;by 变量名称(分组变量);class 变量名称(分组变量);freq 变量名称(数值变量,用以表示相应记录出现的频数)weight 变量名称(数值变量,用以表示相应记录的权重系数,占比,)histogram 变量名称/选项列表output pctlpts= pctlpre= var 变量名称(待分析的数值变量);run;SAS 中可以计算的描述性统计量关键字及其含义关键字所代表的含义n有效数据记录数nmiss缺失数据记录数
15、mean均数std标准差stderr标准误var方差median中位数mode众数cv变异系数max最大值min最小值range全距sum总计sumwgt加权值总计css校正的离均差平方和uss未校正的离均差平方和clm可信限(上下界值)lclm可信限下侧界值uclm可信限上侧界值skew(skewness)偏度kurt(kurtosis)峰度t分布位置假设检验之 t 统计量probt上述 t 统计量对应的概率值q1第一四分位数q3第三四分位数qrange四分位数间距p1第一百分位数p5第五百分位数p10第十百分位数p90第九十百分位数p95第九十五百分位数p99第九十九百分位数)-/*把分析
16、结果以PDF显示*/ods pdf file=“C:UserschengwubinDesktop_ppdf.pdf“; /*可以在指定路径或系统显示*/proc means data=work.aa;var _COL4 _COL5;output out=work.bbbbb;run;proc print data=work.bbbbb;run;ods pdf close;/*把分析结果以HTML显示*/ODS HTML FILE=“C:UserschengwubinDesktopFX.HTML“CONTENTS=“FXCON.HTML“/*固定格式*文件体存诸*/FRAME=“FXFR.HTM
17、L“/*固定格式*合并表内容*/PAGE=“FXPA.HTML“;/*固定格式*指定分析存储到HTML*/PROC MEANS DATA=WORK.AA;VAR _COL4;RUN;ODS HTML CLOSE;/*RTF格式,既word*/ods listing close;/*关闭输出窗口*/ods rtf file=“C:UserschengwubinDesktop_ppdf.rtf“;proc means data=work.aa;var _COL4 _COL5;output out=work.bbbbb;run;proc print data=work.bbbbb;run;ods r
18、tf close;ods listing ;/*打开输出窗口*/*输出为DAT格式*/filename wwb “C:UserschengwubinDesktop“;/*定义输出路径和文件名逻辑文件名*/option nocenter;/*全局变量,显示不居中,靠左*/ods listing file=“C:UserschengwubinDesktopqa.dat“;proc print data=work.qa;/*SAS 程序*/run;ods listing;/*打开 OUTPUT 窗口*/*输入为 CSV 格式,可用 EXCEL 打开*/option nocenter;filename
19、 exout “C:UserschengwubinDesktopworkfql 抽查cc1 期.csv“;ods listing close;固定ods results off; 固定ods csvall file=exout; 固定proc print data=chouc.chouc01;run;ods csvall close; 固定ods results on; 固定ods listing; 固定-/*GLMg 、*、 3 、*、*/data aa;input id sex $ y1-y3;y=y1; age=10;y=y2; age=15;y=y3; age=20;cards;1 f
20、 120 130 1602 m 130 150 1703 f 110 135 159;run;proc glm data=aa;class sex;model y1-y3=sex;repeated age 3 (10 15 20 );run;/*mixed 、 glm 、*/data ab;input id sex $ y1-y3;y=y1; age=10;y=y2; age=15;y=y3; age=20;cards;1 f 120 130 1602 m 130 150 1703 f 110 135 159;run;proc mixed data=ab;class sex age;model
21、 y=sex age;repeated;/*、 R、 R 、*/run;-例:/*、*、 gplot/proc gplot data=A;symbol i=none v=star;/*SYMBOL 、SYMBOL 、 SYMBOL2、SYMBOL3*/plot amount*_COL0;/*、 SATV 、 SATM 、 PLOT 、*/run;/*、*/proc gplot data=sasuser.air;symbol1 i=join v=none line=1 ;/*、 SYMBOL 、 LINE=1、*/symbol2 i=join v=none line=2 ;/*、 SYMBOL
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sas 基本 统计 情况 文本 笔记
限制150内