《抽样调查南京市大学生课外体育锻炼情况.doc》由会员分享,可在线阅读,更多相关《抽样调查南京市大学生课外体育锻炼情况.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样调查 摘要:改革开放以来,高等统计教育有了很大的发展。抽样调查是统计学专业的专业基础课,对于统计学生而言,了解与掌握有关抽样调查的知识和技术也非常重要。而且抽样调查可以很好分析数据,让我们得到我们希望的信息。关键词:分层抽样调查 问卷 总体 样本正文:一调查问卷设计(假设以抽样调查南京市大学生课外体育锻炼情况)1问卷类型的确定调查问卷的类型按回答问题的形式分,有“开放式问卷”和“封闭式问卷”两种。根据我们所研究的目的和主题不同,我们可以采用不同类别的问卷。例如,用画圈的形式回答下列问题:你的性别:男.1,女.2。这种形式的问卷便于被调查者回答,也便于进行资料的整理以及深入的统计分析。2研究
2、假设的确定以及量表的制定在设计问卷的过程中,除了考虑调查的目的和主题外,还必须考虑到研究者的研究假设。所谓研究假设是根据有关理论和事实,研究者对有关变量之间的相互关系的一种叙述或断言。例如,“性别与大学生课外体育锻炼的型态有关系”就是我们的研究假设。我们知道所谓研究假设就是备择假设。相应的原假设为“性别与大学生课外体育锻炼的型态没有关系”。我们要根据所收集的数据资料,进行相应的假设检验。如果结论是拒绝、接受,那么这一研究假设就可以认为是合理的。针对这一研究假设,就应该有相应的问卷设计。例如要有关于测量“是否有很多交际”的量表,还要有关于测量“大学生课外体育锻炼型态”的量表。根据相关文献显示,根
3、据所测量的变量的四种级别,量表从低级到高级有三种水平,它们分别是:定类量表。用于测量定类变量。例如用1表示男,2表示女。用该量表测量的变量不能做加、减、乘、除运算。适用的统计方法有频数分析;求众数、比例;检验;部分相关分析(列联相关等)。定序量表。用于测量定序变量。例如用1表示很不喜欢,2表示不喜欢,3表示无所谓,4表示喜欢,5表示非常喜欢等等。用该量表得到的数字表示等级或大小顺序,并不表示量的绝对大小,等级间的间隔也不一定相等,因此一般也不能作加、减、乘、除运算。适用的统计方法有求中位数、百分位数、部分的相关分析等。定距量表。用于测量定距变量。例如温度、身高、体重等。它有大小的关系。可以相互
4、做加、减运算。适用的统计方法有求均值、标准差、皮尔逊积矩相关、T检验等。3量表的转换在本次调查中,我们采用一种累加的李克量表,将多个定序变量进行综合后,得到一个新的综合性的变量,并将其按照定距变量来对待。李克量表有3级、4级等多种,根据问题的性质可采用适当的量表。4.样本量的估计(1)各指标最优分配平均法该方法的基本思想是先在众多的指标中,选择最重要的K个,分别按最优分配原则计算出各层应分配的样本量,然后求其平均值: 由于各指标之间一般具有较高的相关性,因此,各指标的最优分配结果悬殊不会太大。考虑到在计算最优分配时还受到 估计误差的影响,因此,在实际中这样处理就可以了。(2)查特吉(Chatt
5、erjee)折中方法(1967年)假定经过挑选后,有K个主要指标, 为第j个指标在第h层按最优分配的样本量,n为第h层应分配的样本量,查特吉提出折中的办法是:查特吉法与平均法的结果很接近,它们都是在诸中进行折中。若 间相差很大,不能明显的折中,此时,需建立一些准则来确定各层样本量的分配。 二抽样方案的设计为了调查南京市大学生每周参加课外体育的次数,由于事先不清楚具体的范围,我们参考了网上学生锻炼情况,我们将南京市大学生每周参加课外体育锻炼次数分为4个层次:关系的是如下四个指标:那么,总体中具有第j种特征的单元总数为:,其中。而具有第j种特性单元在总单元数N中的比例就是 。下面为了估计总体指标,
6、初步设想了简单随即抽样和分层抽样二个方案,并对其可行性经行分析。1简单随机抽样1.1样本量的确定 已知估计的总体参数是总体比例,j=1,2,3,4,则用样本比例作为估计量。设d是的绝对误差限,则样本量,其中。在实际计算中必须实现对进行估计,可以根据前面的历史数据给出的估计分别为15% ,59.5% ,20% ,5.5% 。再由一些参考书上的经验值给出置信度为95%,绝对误差限d为 。(即方差上限确定),代入相应的公式即可求得的近似估计。若,则就去,否则用修正。为了抽样操作的方便,取,这样可避免抽取4个样本的操作,变为只抽一个样本,可在保证精度的同时减少工作量。1.2.对总体比例的估计从上述只有
7、0,1两种指标值的总体中抽取1个样本量为的简单随机样本后,设是这个样本中对于第j个特征指标值为1的单元数,则样本比例,估计量的方差的估计量为其中。当大时,我们有的近似置信区间(置信度为):,其中。2整群抽样2.1样本量的确定将南京市各大高校分为3个部分(重点本科院校,普通本科院校,专科院校),一般来说群大小是不相等的,对群的抽样仍按简单随机抽样,用1.1中的方法确定样本量为n,则记所抽群的大小为,i=1,2,n。2.2对总体比例的估计设群中具有所考虑的第j 中特征的小单元数为,则很自然地,总体比例的估计可采用:则估计量的方差的估计为:其中。三;抽样方案的可行性分析:此次调查工作的费用主要是问卷
8、印制,大体固定。在这种情况下,评价一个方案的好坏,主要是看哪种方案在精度相同的前提下更节省时间和精力。对于简单随机抽样的方法,虽然按照样本量确定的过程可将抽取4个样本化为只抽取一个样本,但是这种抽样方法可能导致抽取的样本中的个体单元比较分散,造成调查工作的不便,因此,这是该种方法的弊端。而对于分层抽样的方法,在保证与之前方法同样的精度下,只需对初级单元(每个高校)进行一次抽样,而且样本中次级单元的分布也相对集中,便于调查访问工作的进行。综合上述的分析,初步认为,分层抽样的方法是最佳选择。可按照该方法的流程,把全是所有高校都编成一个抽样框,按照样本量的确定方法确定所要抽取的高校数量,在用简单随机
9、抽样抽取班级,对入样高校在校园进行现场问卷发放,然后再收回即可进行分析。另外,在实际中我们预计可能会出现学生缺勤、不作答等情况,导致回收的问卷数量不够。因此,在实施分层抽样方案的同时,可用简单随机抽样的方案进行弥补,即对缺少的问卷通过在食堂或道路拦截访问来填补。两种方案相结合,保证了我们想达到的预期效果。四创新性探索在得到南京市大学生每周参加课外体育锻炼次数的大概估计之后,我们开始思考大学生的体育锻炼活动是否活跃,以及影响大学生参加课外体育锻炼各种可能的因素等问题。1. 对大学生参加体育锻炼的分类:根据某些分析的要求,还可以把该综合变量按其得分的大小重新归成两类、三类或五类。假定求出该调查样本
10、的“大学生每周参加课外体育锻炼次数”的平均值为,标准差为,按照某人的得分值X的大小将他对应的大学生参加体育锻炼型态归结到低、中、高三类中的一类,即如果 , 低 , 中 , 高如果归成两类的话,则可以按平均值为分界线。2. 影响南京市大学生参加课外体育锻炼型态的因素初探2.1.问题的提出在调查问卷中涵盖了可能影响南京市大学生参加课外体育锻炼型态的各种可能的因素,例如性别、年级、学校设施等。我们要分别鉴别这些因素与南京市大学生参加课外体育锻炼型态是否有关,对于每一种因素很自然的要用到独立性检验的方法(列联表方法)。2.2.方案设计以交际这个因素为例,在将南京市大学生参加课外体育锻炼型态归为三类的前
11、提下,考虑二维总体.设X表示性别情况,可能的取值为;Y表示南京市大学生参加课外体育锻炼型态,可能的取值为。利用上述分层抽样的方案抽取的容量为n的样本,其中事件发生的频数为。又记。易见,。将这些数据列入一张表中,这张表称为列联表。XY则该方法可用于检验假设: 应使用的检验统计量为:,当时检验统计量的极限分布为分布,其自由度为。所以假设检验问题的近似拒绝域为,其中为显著性水平。即当检验统计量的观测值落入拒绝域时,可认为性别因素与南京市大学生参加课外体育锻炼型态有关系;否则,就认为二者无关。2.3.预期效果根据2.2的方案,我们可将调查问卷中所涉及的因素进行逐一检验。最后,得到对南京市大学生参加课外体育锻炼型态真正有影响的因素。这便是本次方案设计的最大收获。小结:本文仅对所研究的问题进行了方法上的初步探索,由于理论与实际的区别,我们不可能面面俱到。最重要的还是要靠实际操作来检验方案的可行性。最重要的是,更进一步的研究也必须建立在实际操作后总结的基础上。在今后,我会就该问题继续探索。