《[经济学]数据分析.ppt》由会员分享,可在线阅读,更多相关《[经济学]数据分析.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、o重点:n假设检验;nt检验或z检验。纲要o1.变量的设定o2.频数分布、列联表o3.假设检验n3.1假设检验思想和步骤n3.2 z检验和t检验(使用条件:定量因变量)n3.3F检验和方差分析(使用条件:定量因变量)n3.4卡方检验和列联表(使用条件:非定量因变量)o4.相关分析和回归分析SPSS学习内容: o1.变量的设定n练习一、你最近一年共拥有几件T恤 1.0件2一件 3.两件 4.三件 5.四件 6.五件或以上二、你最近一年平均每件传统T恤平均花费了多少钱?( )请填写三、你平时喜欢穿T恤吗 1非常不喜欢 2.不喜欢 3.一般 4.喜欢 5.非常喜欢四、你穿T恤最主要的原因是? 1简单
2、 2.个性 3.便宜4凉快 5.舒适 6.其他五、你购买DIY-T恤时注重哪些方面?(多选题) 1面料( )2. 衣料的做工( ) 3.视觉效果( ) 4.是否褪色( ) 5价格 ( ) 6.操作简单( ) 7.到货时间( ) 8.是否有人指导 ( ) 9.厂家信誉( ) 附:如果是多项选择题如何设置变量?六、关于DIY-T恤你还有什么好建议吗? o问卷输入n先编号再输入,以免遗漏或重复输入n问卷检查o问卷的某些部分填写不完整o调查对象的回答表明他没有弄清楚问题的含义或没有阅读说明,如有些问题他不必回答却回答了o调查对象的回答差异性不大,例如有的调查对象填写7级量表时总是选择4o返回的调查问卷
3、本身丢失了几页o问卷回收超过了时限o调查对象不符合要求n编辑o是为了提高准确性和精确性而进行的问卷的再检查,目的是筛选出问卷中看不清楚、不完整、不一致或模棱两可的答案。还要进行一致性检查,比如找出逻辑上不合理的情况。o对不合格问卷的处理n退回现场n填补缺失值中型值代替用估计值代替结对删除n丢弃不合格问卷o2.频数分布、列联表n与频数分布有关的统计量: frequencies命令之statistic选项;或者descriptives命令。data07-03, salary 和 minority, jobtime?n均值比较:Compare Means命令。 data07-03 gender an
4、d salary, jobcat and salary,gender /obcat, and education,n列联表:可同时描述两个或两个以上变量的情况。可以将联列表看做是将几个频数分布表合并到一张表中。Data07-03,gender and jobcat, gender and minorityo3.假设检验n3.1假设检验步骤和思想n3.2 z检验和t检验(使用条件:定量因变量)n3.3F检验和方差分析(使用条件:定量因变量)n3.4卡方检验和列联表(使用条件:非定量因变量)o假设检验的步骤n首先建立零假设(即无差异假设)和备选假设n选择合适的统计量和显著性水平,并求相应统计值,如
5、果没有超出显著水平对应的临界值时,则说明无显著差异(即接受零假设),反之,如果超出临界值,则说明有显著差异(即拒绝零假设)o 3.2 z检验和t检验#(使用条件:定量因变量)假设检验 例1:图: 假设平均数 = 3.0的抽样分布第二种方法:与临界值比较2.5%1.962.5%o假设检验的思想n首先设想假设(零假设)是真的成立;然后考虑在零假设成立的条件下,已经观测到的样本信息出现的概率。如果这概率很小,这就表明一个概率很小的事件在一次试验中发生了。n而小概率原理认为,概率很小的事件在一次试验中是几乎不可能发生的,就是说:出现了一个不合理的现象。从而得出结论:事先的零假设是不正确的,拒绝零假设。
6、否则,不能拒绝零假设。n至于什么算是“概率很小”,都有事先指定。比如概率5%、1%等o小概率事件的实例说明n在一个袋子中装有红、白两种颜色的球共100个,有人说这100个球中只有一个是红球,其余99个都是白球。之后进行了一次一次试验,结果从袋子中摸出的是一个红球。n请问:你认为袋中只有一个红球吗? = 1.579/5.385 = 0.293t = (4.724-4.0)/0.293 = 0.724/0.293 = 2.471 4.0t = (X - )/sXsX = s/ nsX = 1.579/29H1: 假设检验 例2:5%ot检验的SPSS应用n单一样本t检验Data 08-02,n两个
7、样本(相互独立样本)data07-03,gender and salary, gender and salbegin?n两个样本(配对样本)data08-04,前后“手形控制”变量配对比较。其他数据的检验:前后睁眼力控制。o3.3方差分析n单因素(分成三组或以上)方差分析o系统数据sales.sav,分析地区和利润的显著性差异检验, DATA09-01,不同饲料对体重的影响差异 促销水平对销售额的影响(促销水平对销售额的影响(30家商店)家商店)商店编号商店编号 促销水平促销水平高高中中低低1108529873107648945965684279538752976110642共计共计83623
8、783/10=8.362/10=6.237/10=3.7(83+62+37)/30=6.067xxj1.总体平方和-SST,square sum of total2.组间平方和-SSB,square sum between groups3.组内平方和-SSW,square sum within groups,VWkjxjjxnSSB12kjnjixxjijSSW112kjjixxijnSST112o方差分析统计量cnSSWCSSBF1o3.3方差分析n单因素(分成三组或以上)方差分析o系统数据sales.sav,分析地区和利润的显著性差异检验, DATA09-01,不同饲料对体重的影响差异DA
9、TA07-03,岗位种类对收入影响。n多因素方差分析.DATA09-03,不同大白鼠和激素对其重量的影响(了解).o3.4卡方检验和列联表ijijijE)E(O 2nCREjiijdf=(c-1)(r-1)5% 11O11E O11 就是指“上网男性”,如何计算?上网没有上网男性201030女性1515303525全部:60o3.3卡方检验和列联表nSpss应用:列联表的statistic命令o系统数据sales.sav,分析地区和产业类型的显著性差异检验,DATA07-04,男女和“薪金高低”的差异显著性检验?假设检验合适方法一个自变量多个自变量z检验和t检验(单变量或二分)卡方检验F检验(
10、多分变量)F检验非定量自变量,定量因变量非定量自变量非定量因变量非定量自变量,定量因变量o判断:假设检验合适方法n检验男女性的收入金额的显著性差异n检验男女性的高低两类收入的显著性差异n检验男女性的是否上网的显著性差异n检验促销的三种不同水平对销售额影响的显著性差异n检验促销的三种不同水平以及不同商店规模,对销售额影响的显著性差异o5.相关分析n两个变量间相关分析.o定量变量相关分析:运用correlation命令,pearson选项。DATA10-01,income deposit. DATA07-03,salary和 salbeginn偏相关分析.oDATA10-03,分析生长量与月平均气
11、温,控制变量是月平均湿度,降雨量,月平均日照时数.分析生长量与月平均湿度,控制其它变量?2rr SSTSSBr 2销售额(元)广告费用(元)回归分析的基本原理回归分析的基本原理o假设观察样本假设观察样本(xi,yi) (x为自变量为自变量, y为因变量,为因变量,i1,2,n) 。o样本点样本点 与直线纵向距离的平方和与直线纵向距离的平方和 最小,则最小,则 为最佳直线。为最佳直线。o根据最小二乘法原理,使根据最小二乘法原理,使Q最小的最小的a、b须满足方程组:须满足方程组:o求解方程组即可得求解方程组即可得参数参数a、b。o设预测误差设预测误差 , ,则一元线性,则一元线性回归的标准差计算公
12、式为:回归的标准差计算公式为: yabxiixy( , )21()niiiQyabx112111nniiiinnniiiiiiinabxyaxbxx yiiiyy), 0 (2N21()niiiQyy2QSEn o6 回归分析n多元回归, data07-03salary and education,salbegin, salary and prevexp,age? o报告的格式n封面n提交信(略)n授权信(略)n内容目录n执行总结n研究问题n研究方法n研究设计n数据分析n研究结果n研究局限和忠告n结论和建议n附件o附:问卷设计过程n.确认所需信息n.确定访谈方法的类型n.确定单个问题的内容n.设计问题以避免无法回答或不愿回答情况的发生n.选择问题的结构n.选择问题的措词n.确定问题的顺序n.确认问卷页面的形式与版面设计n.复制问卷n.通过预调查清除缺陷