《【高中数学】获取数据的途径(课件) 高一数学同步备课系列(人教A版2019必修第二册).pptx》由会员分享,可在线阅读,更多相关《【高中数学】获取数据的途径(课件) 高一数学同步备课系列(人教A版2019必修第二册).pptx(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、9.1.3 获取数据的途径第9章 统计人教A 版2019 必修第二册学习目标 1.知道获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等,培养数据分析的核心素养2了解总体、样本、样本量的概念,了解数据的随机性,培养数学抽象的核心素养新知导入“大数据”是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性.这些数据可能得自社交网络、电子商务网站、顾客来访记录和许多其他来源.【问题】凭你的经验,日常有哪些获取数据的方法和途径呢?【提示】如:通过调查获取数据,通过试验获取数据,通过查询获取数据等.统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,
2、是统计学研究的重要内容在实践中,获取数据的途径多种多样,像统计报表和年鉴、社会调查、普查和抽样、互联网、试验设计等等都是常见的下面介绍获取数据的一些基本途径1.通过调查获取数据对于有限总体问题,如人口总数、城乡就业状况、农村贫困人口脱贫状况、生态环境改善状况、青少年受教育状况、高中生近视的比例、产品合格率、高中生日平均上网时间等问题,我们一般通过抽样调查或普查的方法获取数据。针对不同问题的特点,为了有效收集所需数据,专家发明了各种不同的抽样方法除了我们已经学过的简单随机抽样和分层随机抽样,还有系统抽样、整群抽样、不等概率抽样、自适应抽样、两阶段抽样等很多其他的方法:在实际应用中,关键在于是否能
3、充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误。在前面的学习中,我们对此有了一定的认识2通过试验获取数据试验是获取样本观测数据的另一种重要途径例如,要判断研制的新药是否有效、培育的小麦新品种是否具有更高的产量等情况,没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据、又如特种钢、轮胎的配方和产品质量等,也需要通过试验获取样本观测数据.通过试验获取数据时,我们需要严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础在统计学中,这种安排试验的学问叫做“试验设计”,感兴趣的同学可以查阅试验设计教科书3.通过观察获取数据在
4、现实生活中,我们感兴趣的很多自然现象都不能被人类所控制,如地震、降水、大气污染、宇宙射线等。自然现象会随着时间的变化而变化,不能用我们已经学过的有限总体来刻画,也就不能用抽样的方法获取观测数据:另一方面,由于自然现象不能被人为控制,也不能通过试验获取观测数据。研究这类现象,只能通过长久的持续观察获取数据.对于各个不同的行业,往往需要专业测量设备获取观测数据。随着科技水平的提高,专业测量设备的自动化程度越来越高,通过观测获取和存储数据的成本越来越低,这成为大数据产生的根源一般地,通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,这些信息十分宝贵,统计学理论和方法是挖掘这些
5、信息的强有力的工具之一.4.通过查询获得数据我们感兴趣的问题,可能有众多专家研究过,他们在研究中所收集的样本观测数据可能存储于学术论文、专著、新闻稿、公报或互联网上.这些数据是宝贵的财富,我们可以收集前人的劳动成果并加以利用,从而减少收集数据的成本。我们往往把这样获得的数据叫做二手数据国家统计局是我国最主要的统计数据收集和发布的部门,调查统计的数据涉及经济、社会、民生的方方面面国家统计局的统计数据通过多种形式进行公布,例如定期发布新闻稿、举办新闻发布会、发布统计公报、出版各类统计资料等。统计公报有年度统计公报、经济普查公报、人口普查公报、农业普查公报等;统计资料出版物有中国统计摘要、以中国统计
6、年鉴为代表的统计年鉴系列等.例如,我们想了解2014年全国的交通事故情况,通过查找中国统计年鉴可以得到如表9.1-3所示的数据如果我们关心机动车交通事故逐年变化的情况,那么需要通过查找每年的数据表,并把它们合并整理随着信息技术的发展,通过互联网获取数据越来越成为获取二手数据的主要方式。例如,可以从国家统计局的官方网站查询得到国家统计局公布的各种统计数据.在网络上也有专门提供数据服务的公司,它们提供政府部门允许公开的各类数据.当然,互联网的最大优势是,人们可以利用强大的搜索功能,在整个网络上查找所需要的数据。但从网络上查找的数据,因为数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“
7、清洗”数据,去伪存真,为进一步的数据分析奠定基础获取数据的途径 为调查小区平均每户居民的月用水量,下面是三名学生设计的方案学生甲:我把这张月用水量调查表放在互联网上,只要是上网登录该网站的人就可以看到这张表,他们填表的信息可以很快的反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量学生乙:我给我们居民小区的每一个住户发一张月用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量学生丙:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个的给这些住户打电话问一下他们的月用水量,然后就可以估算出小区平均每户居民的月用水量.请你分析上述三名学生设计的调查方案,能够获得平
8、均每户居民的月用水量吗?为什么?你有何建议?获取数据的途径为调查小区平均每户居民的月用水量,下面是三名学生设计的方案学生甲:网上发调查表 学生乙:给每户发调查表 学生丙:电话抽样学生甲的方法得到的样本不能够反映不上网的居民的情况,它是一种方便样本,所得到的样本代表性差,不能准确的获得平均每户居民的月用水量;学生乙的方法实际上是普查,花费的人力物力更多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;学生丙的方法是随机抽样,如果该小区的每户居民都装有电话,建议用随机抽样方法获得数据.即用学生丙的方法,既节省人力物力,又可以得到比较精确的结果抽样方法的选取看总体容量和样本量的大小
9、,当总体容量较小时,采用抽签法;当总体容量较大,样本量较小时,采用随机数法看总体是否由差异明显的几个部分组成,如果是,则选用分层随机抽样;否则的话,考虑用简单随机抽样 简单来说,总体容量小,简单随机抽样;总体差异明确,分层随机抽样.实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法抽样方法的选取 例1.下列问题中采用怎样的抽样方法较为合理?(1)运动会服务人员为参加400米决赛的六名同学安排跑道(2)一次数学竞赛中,某班有10人在110分以上,40人在90100分,10人 低于90分,现从中抽取12人了解有关情况(1)总体容量较小,而且差异不大,用简单随机抽样方法中的抽签法和 随机数
10、法都比较方便(2)不同成绩段的学生对同一问题的看法可能存在较大差异,共用分层随机抽样较为合理获取数据的途径获取数据的基本途径 适用类型 注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据 没有现存的数据可以查询严格控制实验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据 自然现象 要通过长久的持续观察获取数据通过查询获得数据 众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗数据”,去伪存真例2.要得到某乡镇的贫困人口数据,应采取的方法是()
11、A通过调查获取数据 B通过试验获取数据C通过观察获取数据 D通过查询获得数据【解析】某乡镇的贫困人口数据属于有限总体问题,所以可以通过调查获取数据【答案】A例3.为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以排除安全隐患,获取电灯电路的相关数据应该用什么方法?为什么?解:由于一个学校的电灯电路数目不算大,属于有限总体问题,所以应该通过调查获取数据,并且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方法.例4.为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为
12、这样的调查结果能很好地反映该市市民的意愿吗?解:(1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.课堂练习1.请从国家统计局网站上查找我国水资源及其使用情况的一些数据,根据数据谈谈当前保护水资源的重要性。2.近视是青少年存在的普遍问题,你能查找相关数据,并利用数据说说近几年我国在防
13、治青少年近视上取得的成效吗?随堂检测每层的个体数不一定都一样多,故A错误;由于每层的容量不一定相等,若每层抽同样多的个体,从总体来看,各层之间的个体被抽取的可能性就不一样了,故B错误;对于第i层的每个个体,它被抽到的可能性与层数i无关,即对于每个个体来说,被抽入样本的可能性是相同的,故C正确;每层抽取的个体数是有限制的,故D错误.所以答案选择CC 2.某校有1700名高一学生,1400名高二学生,1100名高三学生,高中数学兴趣小组欲采用分层随机抽样的方法,在全校抽取42名学生进行某项调查,则下列说法正确的是()A.高一学生被抽到的可能性最大 B.B.高三学生被抽到的可能性最大C.高三学生被抽
14、到的可能性最小 D.每名学生被抽到的可能性相等在分层随机抽样中,每个个体被抽到的可能性相等,故每名同学被抽到的可能性相等,故选D.D 3.某校共有学生2000名,各年级的女生和男生人数如下表:由题意可知,二年级女生的人数应该是20000.19=380.所以一年级有学生750人,二年级学生总数也是750人.一年 级 二年 级 三年 级女生 373 男生 377 370 已知从全校学生中随机抽取1名,抽到二年级女生的可能性是0.19.现用分层随机抽样的方法,从全校学生中抽取64名,则应在三年级抽取学生多少名?则应该在三年级抽取的学生人数为64-24-24=16人.4.甲乙两台机床在相同的技术条件下
15、,同时生产一种零件.现在从甲乙机床生产的零件中分别抽取40件,60件.甲的平均尺寸为10,乙的平均尺寸为12.那么抽取的100件产品的平均尺寸是多少?由题意知,甲机床生产的零件的平均尺寸,权重分别为乙机床生产的零件的平均尺寸权重分别为,求分层随机抽样平均数步骤:求样本中不同层的平均数求样本中不同层的相应权重应用公式进行求解5.某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户,为了调查社会购买力的某项指标,要从中抽取一个样本量为100的样本,记做;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作.为完成上述两项抽样,则应采取的抽样方法是()A.简单随机抽样,分层随机抽样 B.分层随机抽样,简单随机抽样C.简单随机抽样,简单随机抽样 D.分层随机抽样,分层随机抽样对于,总体由高收入家庭、中等收入家庭、和低收入家庭差异明显的三部分组成,且所调查的指标与收入情况密切相关,所以应采用分层随机抽样;对于,总体中的个体数较少,且所调查内容对12名被调查人员是平等的,应采用简单随机抽样,答案选BB