《应用统计学教学北大总复习ppt课件.pptx》由会员分享,可在线阅读,更多相关《应用统计学教学北大总复习ppt课件.pptx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、总复习总复习v 数据质量评估数据质量评估v 选择数据分析方法选择数据分析方法v 执行描述和统计推断分析执行描述和统计推断分析v 写量化研究论文写量化研究论文1第一步、数据质量评估第一步、数据质量评估v 样本代表性样本代表性 文本解读 是否概率抽样 研究总体与抽样框 PSU的数量、抽取方法 是否分层,分层指标是否与研究高度相关 调查的回答率 抽样和调查的质量控制 计算 标准误(简单随机抽样vs复杂抽样;绝对误差 & 相对误差) 偏差 覆盖误差 无回答误差 2v 测量质量测量质量 信度 前测后测法 复本法 折半法 内部一致性法:alpha0.6 效度 内容效度 准则效度 结构效度探索性因子分析验证
2、性因子分析因子负载、共同度、因子累计贡献率0.55组合信度、平均变异萃取量0.5因素区别力第二步、选择数据分析方法第二步、选择数据分析方法v 解释性研究解释性研究v 多水平模型:多水平模型: 自变量不属于同一个测量水平时,使用多水平模型,其中定距定比变量用分层线性回归(HLM)v 潜潜变量法:变量法: 研究潜变量之间的因果关系时,使用该方法。观测变量和潜变量都是定距定比时,使用结构方程模型,定类定序时使用潜在类别分析v 纵贯数据纵贯数据/ /历时数据:历时数据: 时间序列分析、事件史分析等v 横截面数据:横截面数据: 方差分析、相关分析、回归分析等3v 描述性研究描述性研究 类序变量 距比变量
3、v 数据整理数据整理 因子分析 聚类分析 无回答插补v 数据质评数据质评 信度系数 因子分析第二步、选择第二步、选择数据分析方法数据分析方法v 方差分析方差分析因变量为定距定比自变量为定类定序分析的是因变量在自变量的各个类别上是否有均值差异P0.05说明有显著的差异事后比较可以用Scheffe系数注重交互项的作用分为一元单因素、一元多因素和多元方差分析4v 相关分析相关分析P0.05说明有显著的相关趋近1表示高度相关趋近0表示不相关相关系数的选择要恰当相关分析无控制、局限于两个变量之间的关系,无法回答数量上的共变关系v 回归分析回归分析P0.05说明有显著的相关回归分析方法的选择要恰当回归分析
4、有控制、研究多个变量之间的关系,能回答数量上的共变关系能回答自变量与因变量的关系,模型整体解释力第三步、执行描述和推断第三步、执行描述和推断v 描述描述v变量为定距定比(散点图、折线图、直方图)变量为定距定比(散点图、折线图、直方图)集中趋势 均值、中位数、众数离散趋势 方差、标准差、四分互差v变量为变量为定类定序(圆瓣图、柱形图、条形图)定类定序(圆瓣图、柱形图、条形图)频数和百分比分布 注意行百分比和列百分比的解读不能计算均值可以计算中位数、众数5第三步、执行描述和推断第三步、执行描述和推断v 推断逻辑推断逻辑概率(依据概率来下结论)概率分布(概率从何而来,从概率分布而来)抽样分布(抽样数
5、据,如何得到概率分布,通过抽样分布而来)正态分布(如果获得大多数现象的抽样分布?通过正态分布而来,中心极限定理是桥梁,将大多数现象可用正态分布来表达)标准正态分布(去掉量纲,形成固定的概率分布表)v 推断方法推断方法参数估计 点估计:样本均值、样本比例、样本方差可获得无偏估计 区间估计:在一定置信水平下的参数值的区间范围假设检验 小概率原理6第三步、执行描述和推断第三步、执行描述和推断v 相关分析相关分析7定类定类定类定类定序定序定序定序定距定距/比比定距定距/比比系数、系数、Q系数系数Gamma相关系数相关系数Pearson 相关系数相关系数C系数,系数,V系数系数Kendalls tau-
6、b/tau-c系数系数Lambda()Somersd系数系数Goodman & Kruksal Tau-ySpearman等级相关系数等级相关系数第三步、执行描述和推断第三步、执行描述和推断v 方差分析方差分析 分析目的:因变量在自变量的不同类别上的均值是否相等 种类:一元单因素、一元多因素、多元方差分析 如果自变量的统计显著(p-因变量(因变量(在在95%置信水平下,在控制了其置信水平下,在控制了其他变量的情况下,他变量的情况下,)整体评价整体评价连续型定距连续型定距定比定比OLS回归、回归、稳健回归稳健回归Y=a+bxx每增加每增加1个单位,个单位,y增加增加b个单位个单位Adj. R2离
7、散型定距离散型定距定比定比Count regressionLn(r)=a+bxx每增加每增加1个单位,在一段时间内事个单位,在一段时间内事件平均发生的次数是原来的件平均发生的次数是原来的exp(b)倍倍LL0;伪伪R21卡方检验卡方检验p0.05二分类定二分类定类变量类变量Binarylogisticx每增加每增加1个单位,因变量发生与不个单位,因变量发生与不发生的概率之比是原来的发生的概率之比是原来的exp(b)倍倍多分类定多分类定类变量类变量Multi-nominal logisticx每增加每增加1个单位,因变量新的发生个单位,因变量新的发生比是原来的比是原来的exp(b)倍,发生比是指
8、倍,发生比是指选择选择m类和选择类和选择k类的概率之比类的概率之比定序变量定序变量ordinal logisticx每增加每增加1个单位,因变量新的发生个单位,因变量新的发生比是原来的比是原来的exp(b)倍,发生比是指倍,发生比是指高于某水平和低于该水平的概率之高于某水平和低于该水平的概率之比比bxakypmyp)()(ln(bxamypmyp)()(ln(bxapp)1ln(第四步、写量化研究论文第四步、写量化研究论文v 选题要有创新,理论假设要有争论色彩,要可检验选题要有创新,理论假设要有争论色彩,要可检验v 要尽到文献综述的义务要尽到文献综述的义务v 说明数据来源说明数据来源v 检验数据质量检验数据质量v 分析数据结果分析数据结果 说明理论假设 有概括和归纳 不局限于一个模型 模型之间要比较 有理论意义和现实意义10结束,谢谢!结束,谢谢!祝各位暑期愉快!祝各位暑期愉快!11