《《统计学讲义第二章》课件.pptx》由会员分享,可在线阅读,更多相关《《统计学讲义第二章》课件.pptx(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学讲义第二章ppt课件统计学的基本概念统计数据的收集统计数据的整理与显示统计数据特征的描述概率与概率分布参数估计与假设检验方差分析目录CONTENTS01统计学的基本概念统计学是一门收集、整理、分析和解释数据的科学。它旨在探索数据的内在规律和特征,为决策提供依据。统计学广泛应用于各个领域,如社会科学、医学、经济学等。统计学的定义通过图表、表格等方式呈现数据,帮助人们理解数据的基本特征和分布情况。描述统计学推断统计学应用统计学利用样本数据推断总体特征,进行假设检验和参数估计。将统计方法应用于各个领域,解决实际问题。030201统计学的分类通过对大量数据的观察和分析,发现其内在规律和特征。大量
2、观察法对数据进行整理、分类、归纳,用数字、图表等方式呈现数据的分布特征。统计描述法根据样本数据推断总体特征,进行假设检验和参数估计。统计推断法利用样本数据估计总体参数,如均值、方差等。参数估计法统计学的研究方法02统计数据的收集通过观察和实验获取,如气象观测、市场调查等。观测数据通过问卷调查、访谈等方式获取,如人口普查、消费者调查等。调查数据通过政府部门、企业等机构提供的记录获取,如财务报告、销售记录等。行政记录通过科学实验获取,如医学研究、农业试验等。科学实验数据统计数据的来源抽样调查从目标总体中选取一部分样本进行调查,然后根据样本结果推断总体情况。普查对目标总体进行全面调查,获取全面、准确
3、的数据。重点调查对目标总体的重点部分进行调查,以了解总体基本情况。典型调查选择具有代表性的单位或个人进行深入调查,以了解总体情况。统计数据的收集方法登记误差由于记录或输入错误等原因导致的误差,如数据录入错误。代表性误差由于样本选取不当或样本结构与总体结构不一致导致的误差。系统性误差由于测量工具、方法等存在缺陷或误差导致的误差,如测量仪器不准确。随机误差由于随机因素导致的误差,如随机抽样误差。统计数据的误差03统计数据的整理与显示将数据按照大小进行排列,以便更好地观察数据的分布情况。数据排序数据分组数据压缩数据转换将数据分成若干组,以便对数据进行分类和汇总。将数据中的异常值进行剔除或处理,以便更
4、好地反映数据的整体特征。将数据转换成不同的形式,以便更好地进行统计分析。统计数据的整理柱状图用于展示分类数据之间的比较关系。散点图用于展示两个变量之间的相关关系。饼图用于展示数据的比例关系。折线图用于展示时间序列数据的变化趋势。统计数据的图表显示数据表格的设计对数据进行汇总,以便更好地观察数据的分布特征。数据的汇总数据的比较数据的描述01020403对数据进行描述,以便更好地了解数据的特征和分布情况。表格的设计应简洁明了,易于理解。对不同数据集进行比较,以便更好地了解它们之间的关系。统计数据的表格显示04统计数据特征的描述数值型数据用于描述连续变量或测量变量,如身高、体重、年龄等。集中趋势描述
5、数据的中心趋势,如平均数、中位数、众数等。离散程度描述数据的离散程度,如方差、标准差等。分布形态描述数据的分布形态,如正态分布、偏态分布等。数值型数据特征的描述分类数据特征的描述用于描述定类变量或类别变量,如性别、婚姻状况、国籍等。分类数据描述各类别的相对频率或比例。相对频率描述两个或多个分类变量之间的关系。列联表描述各类别的频数分布情况。频数分布1顺序数据用于描述有序变量或等级变量,如评分等级、教育程度等。等级描述描述数据的等级顺序或大小关系。百分比分布描述各类别的百分比分布情况。累积百分比分布描述各类别的累积百分比分布情况。顺序数据特征的描述05概率与概率分布概率的取值范围0到1之间,其中
6、0表示事件不可能发生,1表示事件一定发生。概率的加法原则如果两个事件互斥,即同时发生其中一个事件就不能发生另一个事件,则两个事件的概率之和等于它们各自概率的和。概率描述随机事件发生的可能性大小的量度,通常用P表示。概率的基本概念离散型随机变量的概率分布表示随机变量取各个可能值的概率,通常用P(X=xi)表示。连续型随机变量的概率分布表示随机变量在某个区间内取值的概率,通常用F(x)表示。概率分布描述随机变量取各个可能值的概率的函数,通常用F(x)表示。概率分布的基本概念ABCD二项分布描述n次独立重复试验中成功次数X的概率分布,记作B(n,p)。正态分布描述连续型随机变量X的概率分布,记作N(
7、,)。指数分布描述随机事件发生的时间间隔T的概率分布,记作E()。泊松分布描述单位时间内(或单位面积上)随机事件发生的次数X的概率分布,记作P()。常见的概率分布06参数估计与假设检验用单个数值来表示未知参数的估计值。例如,使用样本均值来估计总体均值。点估计提供未知参数可能值的范围,而不是单一的点估计。例如,估计总体均值在95%的置信水平下位于某个区间内。区间估计点估计与区间估计零假设(H0)要检验的假设,通常是关于总体参数的否定陈述。判断错误地拒绝零假设的概率。显著性水平()通过样本数据对总体参数提出假设,然后使用统计方法检验该假设是否成立。假设检验与零假设相对立的假设。对立假设(H1)假设
8、检验的基本概念单侧检验只考虑参数大于或小于某个值的情形。p值观察到的数据或更极端的数据出现的概率,用于判断是否拒绝零假设。双侧检验同时考虑参数大于和小于某个值的情形。单样本假设检验仅针对单个样本数据进行的假设检验。单样本假设检验07方差分析03目的检验各组数据的均值是否存在显著差异,从而判断不同处理或分组对结果的影响。01方差分析(ANOVA)一种统计技术,用于比较两个或更多组数据的均值是否存在显著差异。02前提假设数据服从正态分布、各组方差齐性、样本独立。方差分析的基本概念ABCD方差分析的步骤1.提出假设包括零假设(各组均值相等)和对立假设(至少有一组均值不相等)。3.决策根据统计量的值和显著性水平()判断是否拒绝零假设。2.计算统计量通过计算F值或P值等统计量来评估各组均值是否存在显著差异。4.结论若拒绝零假设,则认为各组均值存在显著差异;否则,认为各组均值无显著差异。比较不同药物、治疗方法或实验条件下的效果。生物医学研究比较不同产品、价格或促销策略对销售的影响。市场研究比较不同组人群的特征、行为或态度。社会科学研究分析不同批次产品或生产条件下的产品质量差异。质量控制01030204方差分析的应用感谢您的观看THANKS