实用统计分析方法与应用.ppt
《实用统计分析方法与应用.ppt》由会员分享,可在线阅读,更多相关《实用统计分析方法与应用.ppt(42页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、实用统计分析方法与应用p现代统计学的研究对象:统计方法和统计逻辑现代统计学的研究对象:统计方法和统计逻辑p现代统计学的分类:现代统计学的分类:从实际应用中的方法来区分可分为现代统计学概述现代统计学概述1以总体全面资料或非随机性局部资料为基础的统计理论与方法体系统计总体论)、统计设计、统计调查、统计整理、统计指数、动态分析理论、依据随机样本推断总体特征的理论与方法体系概率论、经典统计理论、贝叶斯理论、统计判决理论等描述统计数理统计R编程可视SAS编程Eviews编程可视Matlab编程可视SPSS可视Stata可视Excel可视。统计软件统计软件2p常用统计软件一览常用统计软件一览(3种数据形态
2、种数据形态)SPSS的特点:的特点:1:可:可视化操作,界面友好美化操作,界面友好美观。2:数据接口多。:数据接口多。3:操作:操作简单,用,用户体体验好。好。4:较之之Excel数据数据处理能力更理能力更强。p数理统计的基本框架:数理统计的基本框架:3微积分概率论数理统计基础。计量经济学时间序列p数理统计的基本框架:数理统计的基本框架:微积分:微积分:数学基础,为概率论的运算以及数理统计的统计量提供基础。概率论:概率论:数理统计学所考察的数据都带有随机性(偶然性)的误差。这给根据这种数据所作出的结论带来了一种不确定性,其量化要借助于概率论的概念和方法。数理统计基础:数理统计基础:对数据的结构
3、分析和条件检验。对以数据为基础的计量经济学提供前端分析。计量经济学:计量经济学:利用建立模型和优化模型解决实际问题的方法。时间序列分析:时间序列分析:是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。4p数理统计的基本框架:数理统计的基本框架:5总体所研究对象的全体。个体:总体中最小的研究单位。总体容量:总体中所包含的个体个数。总体中每一个个体都具有相同的观察特征。样本从总体中抽出若干个个体组成的集体样本容量:样本中所包含的个体个数。样本的分类取决于取得样本的方法。如简单随机样本等。随机变量对客观事物进行观察试验的结果。
4、随机变量是将试验事件数量化。6随机变量的数学特征7p随机变量的数学特征随机变量的数学特征u随机变量的分类定性分类随机变量可分为分类变量和有序变量定量分类随机变量按数据集是否能够取有限个或至多可列个值,可分为离离散型变量散型变量和连续型变量连续型变量。离散型变量:随机变量随机变量X X只可能取有限个或至多可列个值只可能取有限个或至多可列个值连续型变量:变量可以在某个区间内取任一实数,即变量的取值可以是连变量可以在某个区间内取任一实数,即变量的取值可以是连续的续的p随机变量的数学特征随机变量的数学特征8u分布:分布是形容数据的一类集体形态的特征,分布列或分布函数代表了数据出现在不同位置拥有的不同概
5、率。离散型随机变量的分布列:离散型随机变量的分布列:表现出每一个随机变量取值及出现的概率例:例:价格价格A1(70万)万)A2(88万)万)A3(108万)万)占比25%50%25%某楼盘当期开盘的户型总价分布列常见的离散型变量分布:常见的离散型变量分布:0-1分布,泊松分布分布,泊松分布p随机变量的数学特征随机变量的数学特征9p随机变量的数学特征随机变量的数学特征10最常用的连续型随机变量分布最常用的连续型随机变量分布正态分布正态分布 在统计中,许多重要的分布都是连续型分布,其中一种特别重要的连续型随机变量的概率分布就是正态分布(Normal Distribution)。正态分布最初为 De
6、 Moivre于 1773 年发现,其后,拉普拉斯(Laplace)和高斯(Gauss)对它作出了很大的贡献,尤其是高斯的贡献最为突出,所以正态分布又称为高斯分布。p随机变量的数学特征随机变量的数学特征u期望期望u方差方差u协方差与相关系数协方差与相关系数u大数定律与中心极限定理大数定律与中心极限定理11p随机变量的数学特征随机变量的数学特征期望:期望:在概率论和统计学中,一个离散型随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。离散型随机变量:离散型随机变量:12以频率为权重的加权平均 随机变量随机变量X的数学期望,记作的数学期望,记作E(X),
7、即),即 13例例 某楼盘当期开盘的户型总价的分布列求整个项目的平均价格p随机变量的数学特征随机变量的数学特征 E(X)=70*25%+88*50%+108*25%=88.5价格价格A1(70万)万)A2(88万)万)A3(108万)万)占比25%50%25%p随机变量的数学特征随机变量的数学特征14u连续型随机变量设连续型随机变量X的概率密度为 f(x),则u正态分布的期望正态分布的期望p数学期望的意义数学期望的意义15 试验次数较大时,X的观测值的算术平均值 在E(X)附近摆动数学期望又可以称为期望值(Expected Value),均值(Mean)E(X)反映了随机变量X取值的“概率平均
8、”,是X的可能值以其相应概率的加权平均。p方差的引入方差的引入16E(X1)=50 20 30 50 70 801/8 1/8 1/2 1/8 1/8E(X2)=50 总价(万元)占比 40 50 60 1/4 1/2 1/4设有两个楼盘,其各户型总价取值规律如下:总价(万元)占比 两种个楼盘的总价均值是相同的,但楼盘2的波动更大p方差方差17u均方差(标准差)设 是一随机变量,如果 存在,则称为 的方差,记作 或 即 p方差的计算步骤方差的计算步骤18Step 1:计算期望 E(X)Step 2:计算 E(X2)Step 3:计算 D(X)离散型 连续型 离散型 连续型 p协方差协方差 在概
9、率论和统计学中,协方差用于衡量两个变量的总体误差。而方差在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。是协方差的一种特殊情况,即当两个变量是相同的情况。直观上来看,协方差表示的是两个变量总体的误差,这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。19p相关系数相关系数 前面说到当两个变量互为统计独立时,
10、协方差COV=0 但反之协方差COV=0时,两个变量并不一定统计独立 相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用表示,相关系数的取值范围为-1,120定义定义21样本与总体p引引 言言22 随机变量及其所伴随的概率分布全面描述了随机变量及其所伴随的概率分布全面描述了随机现象随机现象的统计性规律。的统计性规律。概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。例如:望今缘在开售之前做市
11、场调查,目标总体内有购房需求客户的当期支付能力或者客户当前对户型面积的需求。所得出的数据集是服从的分布是未知的。数理统计的任务则是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。p样本与总体样本与总体23总体与样本总体与样本 在数理统计中,把研究对象的全体称为总体(population)或母体,而把组成总体的每个单元称为个体。例如我们做市场调查,目标客户群体就是总体,每一个客户称为个体。总体:总体:样本:样本:在抽取过程中,每抽取一个个体,就是对总体X进行一次随机试验,每次抽取的n个个体 ,称为总体X的一个容量为n的样本(sample)或子样;其中样本中所包含的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实用 统计分析 方法 应用
限制150内