《§9.8 敏感问题的社会调查.pdf》由会员分享,可在线阅读,更多相关《§9.8 敏感问题的社会调查.pdf(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、问题:问题: 敏感问题敏感问题( (如考试作弊、赌博、偷税漏税等如考试作弊、赌博、偷税漏税等) ) 的社会调查因为很难得到被调查人的配合,一直的社会调查因为很难得到被调查人的配合,一直 是一个难题。现在假如想要调查社会中这类人的是一个难题。现在假如想要调查社会中这类人的 比例,怎样设计调查问卷才能尽可能的保证调查比例,怎样设计调查问卷才能尽可能的保证调查 结果的真实性?结果的真实性? 这里我们以对学生考试作弊现象的调查和估计为这里我们以对学生考试作弊现象的调查和估计为 例例, , 建立数学模型研究敏感问题的调查和估计方法。建立数学模型研究敏感问题的调查和估计方法。 设计合理的调查方案来提高应答
2、率设计合理的调查方案来提高应答率, , 降低不真实降低不真实 回答率回答率, , 尽量准确地估计有过作弊行为的学生所占的尽量准确地估计有过作弊行为的学生所占的 比例。比例。 问题问题 A: 你手机号的尾数是偶数吗?你手机号的尾数是偶数吗? B: 你考试做过弊吗?你考试做过弊吗? 第一个问题不敏感,比如手机号末尾奇偶性第一个问题不敏感,比如手机号末尾奇偶性 第二个问题是我们关心的第二个问题是我们关心的 调查方案设计调查方案设计 给被调查者两个问题给被调查者两个问题 大学生考试是否做过弊大学生考试是否做过弊 请被调查者到另外一个屋子去掷硬币,请被调查者到另外一个屋子去掷硬币, 掷到正就回答第一个问
3、题,掷到正就回答第一个问题, 掷到反就回答第二个问题。掷到反就回答第二个问题。 具体做法具体做法 不需要告诉调查者正反面,只要告诉调查不需要告诉调查者正反面,只要告诉调查 者你答的是“是”还是“否”就行。者你答的是“是”还是“否”就行。 假设假设200个人中有个人中有65个人回答是;个人回答是; 200个人抛硬币,平均来说有个人抛硬币,平均来说有100正面,正面,100反面;反面; 对对100个抛到正面的人,回答了第一个问题,可以个抛到正面的人,回答了第一个问题,可以 认为奇偶各占一半,即认为奇偶各占一半,即100个人中有个人中有50个人回答了个人回答了 是;剩下的是;剩下的100个人中就是回
4、答第二个问题,只有个人中就是回答第二个问题,只有 15个人回答是,个人回答是, 由此估计有由此估计有15的人考试做过弊的人考试做过弊 分析结果分析结果 一般的,对于我们前面设计的问卷一般的,对于我们前面设计的问卷,如果我们事,如果我们事 先设计回答问题先设计回答问题A的人数比例为的人数比例为 (比如通过摸球来实比如通过摸球来实 现现)。假设回收了假设回收了n份问卷,其中有份问卷,其中有n1个“是”,则个“是”,则 (1) 约有约有份问卷回答问题份问卷回答问题A,份问卷回答问题份问卷回答问题B; n(1)n n(2) 在回答问题在回答问题A的的份问卷中,大约有份问卷中,大约有份回答的份回答的 是
5、“是”是“是”, ,因此还有因此还有个“是”是选择的问题个“是”是选择的问题B 的人回答的。的人回答的。 1 2 n 1 1 2 nn 1 1 2 1 n n p = 因此,可以估计作弊同学的比例为因此,可以估计作弊同学的比例为。记。记 要估计的作弊的比例为要估计的作弊的比例为p,则,则 1 1 2 (1) nn n (1) 我们这里对我们这里对作弊比例的估计好不好呢?是无偏的吗?作弊比例的估计好不好呢?是无偏的吗? 讨论:讨论: 分析:分析:设设 1, 1,2, . 0, i i Xin i = 若第 个被调查学生回答“是”, 若第 个被调查学生回答“否”, 若第 个被调查学生回答“是”,
6、若第 个被调查学生回答“否”, 12 , n XXX 独立同分布,记它们都和独立同分布,记它们都和X同分布。同分布。 1 1 11 11 2 22 111 n k k n EX EX n n E pE = = 计算估计量的期望如下计算估计量的期望如下 我们的估计量是无偏的。我们的估计量是无偏的。 1()0()= ()EXPPP= + 回答“是”回答“否”回答“是”回答“是”回答“否”回答“是” 记记P(回答“是”回答“是”)=,则,则 1 (1) 2 EXp=+ 由全概率公式得由全概率公式得 111 (1) 222 = 11 EXp Epp + = 注意到注意到 因此因此 (2) 与直接调查并
7、真实作答相比,我们这里的机制使得与直接调查并真实作答相比,我们这里的机制使得 估计的方差有什么变化?估计的方差有什么变化? 分析:分析:实际上,实际上, ()() 1 2 1 22 1 1 2 1 11 n k k n DX nDX n DpD n = = 222 ()()DXE XEX=,而而 因此因此 ()() 2 22 11 DX Dp nn = 容易计算,直接调查并真实作答的方差容易计算,直接调查并真实作答的方差d为,为, 2 pp d n = 经过计算有经过计算有 () () 2 2 11 41 Dpd n =+ 在前面的例子中,假设我们发放了在前面的例子中,假设我们发放了200份问
8、卷,其份问卷,其 中有中有58个人回答的是“是”,则个人回答的是“是”,则 1 2 = n=200,n1=65, , 此时,此时, 1 1 2 0.15 1 n n p = 估计的标准差为估计的标准差为 ()() 2 2 22 6565 200200 0.066 1200 1 0.5 Dp n = 无论如何,这个设计是聪明的。无论如何,这个设计是聪明的。 在我们上面设计的方案中,回答问题在我们上面设计的方案中,回答问题A的人的问的人的问 卷不但无用而且还带来混淆。如果回答问题卷不但无用而且还带来混淆。如果回答问题B的人的的人的 比例更多的话显然能使得信息的收集更加有效。但这比例更多的话显然能使得信息的收集更加有效。但这 样一来又会增添被调查者的顾虑。样一来又会增添被调查者的顾虑。