《食品质量安全抽检数据分析论文.doc》由会员分享,可在线阅读,更多相关《食品质量安全抽检数据分析论文.doc(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数学建模校内竞赛论文 论文题目:食品质量安全抽检数据分析组号:284#成员:王林炜 陈小红 葛敏雪 选题:A题 姓名 学院 年级 专业 学号 联系电话 数学分析 高等代数 高等数学 线性代数 概率统计 数学实验 数学模型 CET4 CET6 王林炜 自动化 2011 物流工程 20115172 15922768472 / / 86 86 / 85 / 567 / 陈小红 自动化 2011 物流工程 20115223 13637985570 / / 95 86 / 92 / / / 葛敏雪 自动化 2011 物流工程 20115174 13512354364 / / 91 90 82 / / 5
2、19 / 2013-05-21 食品质量安全抽检数据分析摘要“民以食为天”,食品安全关系千家万户,本文根据深圳市给出2010年、2011年、2012年的食品质量安全抽检数据,针对深圳市的食品质量安全做出了分析。通过对数据的研究,我们对数据进行了处理,将主要食品分为六大类,分别是:蔬果类、肉蛋类、水产类(、淀粉类、调味类、豆乳类。在建立数学模型时,应用了数据筛选和均值统计法、层次分析法、回归分析法、数据拟合法、概率统计分析。针对问题一,我们将影响食品安全的因素分为微生物、重金属、添加剂、其他这四大类。先用数据筛选和均值法对数据进行处理,从而得到2010年、2011年和2012年每个季度食品因微生
3、物、重金属、添加剂、其他而导致的不合格率,并用图表表示出每一类三年的变化趋势。然后用层次分析法,定量地求出三年食品安全系数。三年内食品安全质量有波动,总体上说,安全情况有下降趋势,食品安全有待提高。年份201020112012食品安全系数0.19320.56760.2238等级针对问题二,由于微生物、重金属、添加剂、其他这四方面的不合格导致了食品质量的不过关,但是这四类直接因素又由其它因素影响,通过对数据的分析,我们将影响食品安全的这些因素归结为检测地点、食品产地、抽查季节、生产环节、流通环节、餐饮环节六个要素。通过建立回归模型,运用MATLAB软件,求出六大要素与食品质量间的线性关系,定量求
4、出各因素在影响食品安全中所占影响度大小和影响规律。最终得到,在食品质量影响因素中食品产地影响最大,食品加工环节影响次之,季节影响最小,抽查地点几乎无影响。针对问题三,根据第一问和第二问,我们可以得到不同因素的影响程度是不同的。为了科学有效地反映食品安全情况,合理简化抽检方法,我们减少稳定数据的测量量,增加不稳定数据的测量量,使测量环节有效减少,重要环节的监测力度加大。通过使用SPSS软件,求解出新选出的各项因素与食品安全的线性关系,并通过回归曲线进行检验,论证了新的检验方法求得出的数据与原检验方法下的数据误差趋于0,新方法具有科学性。最终得到,新的抽检方法为减少调料类、豆乳类、蔬果类、淀粉类食
5、品抽检次数,增加水产类、肉蛋类抽检次数。关键词:统计 层次分析 回归分析 拟合 残差分析 蒙特卡洛法 一、 问题重述 “民以食为天”,食品安全关系到千家万户的生活与健康。随着人们对生活质量的追求和安全意思的提高,食品安全已成为社会关注的热点,也是政府民生工程的一个主题。城市食品的来源越来越广泛,人们消费加工好的食品的比例也越来越高,因此除食材的生产收获外,食品的运输、加工、包装、贮存、销售以及餐饮等每一个环节皆可能影响食品的质量与安全。另一方面,食品质量与安全又是一个专业性很强的问题,其标准的制定和抽样检测及评价都需要科学有效的方法。深圳是食品抽检、监督最统一、最规范、最公开的城市之一。请下载
6、2010年、2011年和2012年深圳市的食品抽检数据(注意蔬菜、鱼类、鸡鸭等抽检数据的获取),并根据这些资料来讨论:1. 如何评价深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势;2. 从这些数据中能否找出某些规律性的东西:如食品产地与食品质量的关系;食品销售地点(即抽检地点)与食品质量的关系;季节因素等等;3. 能否改进食品抽检的办法,使之更科学更有效地反映食品质量状况且不过分增加监管成本(食品抽检是需要费用的),例如对于抽检结果稳定且抽检频次过高的食品领域该作怎样的调整?二、问题分析对于问题一,由于调查中食物种类复杂,为了方便问题的讨论,我们将食品分为六大类,即淀
7、粉类,水产类,蔬果类,肉蛋类豆乳类和调味品,对数据进行筛选。在考虑食品安全情况的影响因素时,根据数据分析,我们主要分析四大主要因素,分别为微生物、重金属、添加剂和其他。从附录中得到深圳市2010,,2011,2012三年抽检样本数据,并用EXCEL制表进行统计和整理,求出每个因素导致的每个季度的食品不合格率。根据相应的数据制作出每个因素安全情况三年的变化趋势。再用层次分析法,从定量的角度求出三年的总体变化趋势。对于问题二,第一问中涉及的影响因素是食品是否安全的直接因素,但这些因素又是由其它相关因素决定。分析数据,我们将影响食品安全的这些因素归结为检测地点、食品产地、抽查季节、生产环节、流通环节
8、、餐饮环节六个要素。这一问要求的是这些要素与食品质量的规律性关系,即线性关系。通过建立回归模型,来定量求出各因素在影响食品安全中所占影响度大小和影响规律。对于各因素对食品安全的影响程度,利用偏回归平方和衡量每个变量在回归中所起的作用大小(即影响程度),对每个变量的偏回归平方和进行了计算,最后把影响程度由深到浅的各因素进行了排序。最后进行回归方程的显著性检验,将总的平方和分解为回归平方和和剩余平方和,运用F检验法来判定线性回归方程的显著性。对于问题三,要改进原有抽检方法,找到一个新方法,使其在成本相同的情况下,测得数据结果更准确,在测得数据结果和老方法接近下,成本更低。根据第一问和第二问得到的数
9、据,得到不同因素的影响程度是不同的。减少稳定数据的测量量,加大不稳定数据的测量量,减少测量环节,加重必要环节。由于我们获取的数据均是在原抽检方法下得到的数据,而没有真正标准真实的数据,所以无论我们用什么样的新方法,只能在原抽检下的数据(或有关预测、推测数据)进行验证。故新方法在测量不稳定数据的结果与原方法不具可比性。但稳定数据的结果两种方法下的测量数据基本一致。新方法得到后,检验新方法的科学性、合理性。拟合曲线确定其未来检测值,采用蒙特卡洛法抽检,带入回归方程进行验证新方法是否合理。三、问题假设1、 假设模型求解过程中所用的数据都是合理的2、假设不考虑抽检时抽检人员的人为影响3、假设每次抽检时
10、遵循公平性原则4、假设所有食品取主要食品即六大类,其余食品对质量安全分析无影响5、假设抽检时所有环节、所有因素的成本和工时相同四、 参数及符号说明符号表示的意义备注Ai 目标层指标i=1Bi 准则层指标i=1,2,3,4Ci方案层指标i=1,2,3 第 i层权重i=1,2,3标准化后的第 i层权重i=1,2,3入一致性指标过度数C.I一致性指标R.I.平均随机一次性指标C.R.一致性比例指标bij 每个因子的评分i=1,2,3j=1,2,3,4Ci综合评价指数i=1,2,3PI食品安全质量综合评价指数影响食品质量安全的因素。i=1,2,.6各食品安全系数a=1,2.6相互独立且服从同一正态分布
11、的随机变量变量的偏回归平方和i=1,2,.6回归平方和剩余平方和待估计系数参数的回归值参数的最小二乘估计五、 模型的分析、建立与求解(1)问题一的分析与模型的建立1、统计、计算、绘制图表来表示出六大类食品,在2010、2011、2012三年中各季度下抽检样品中不合格食品里,微生物、重金属、添加剂的变化趋势;通过数据筛选和统计得出附表一,根据附表一,计算求解出各个季度下 微生物、重金属、添加剂、其它等因素不合格的概率年份201020112012季度二三四一二三四一二三四微生物0.0330.0510.1410.1050.020.1870.3420.0670.0590.0360.074重金属0.03
12、90.0300.3890.1490.1780.16200.1220.0770.134添加剂0.0380.0300.1170.0380.1780.1190.0980.0860.0370.092其它0.050.0480.1410.0410.01500.0270.1020.0670.0230.028后根据表格,绘制图表来表示三年中各季度下抽检样品中不合格食品里,微生物、重金属、添加剂的变化趋势:各因素不合格的概率年平均201020112012微生物0.0750.1640.059重金属0.0230.2200.083添加剂0.0230.1130.078其它0.0800.0210.055从图表得出结论:三
13、年来,因微生物 、重金属、添加剂导致的不合格率变化趋势有波动,食品安全整体有下降,从总体上说,食品安全情况没有改善。2、 根据三年中六类食品的食品安全情况,采用层次分析法,定量结合定性的评价出由于微生物、重金属、添加剂超标而导致食品不安全的年度食品安全情况。对深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势做出定量的综合评价,首先对3年的数据处理按季节分为12个子样本点的抽检值进行分析,得到各子样本食品质量安全情况。运用层次分析法决定食品安全单位指标在综合评价中权重。 建立层次结构模型(1)构造各季节食品安全质量综合评价的阶梯层次结构根据层次分析法的基本步骤,建立食品质
14、量安全评价递阶层次模型,如下图所示。食品安全综合评价A1 AA 微生物B1 重金属B2 添加剂B3 其它B42010年食品安全情况C12012年食品安全情况C32011年食品安全情况C2目标层A准则层B方案层C 图:食品综合评价递阶层次结构(2)建立两两比较的A-B层判断矩阵并进行一致性检验。建立A-B层判断矩阵的依据是:考虑B层的四个因素对食品质量安全综合评价的重要性时,根据在查找数据知年均指标微生物最重要,且B1比重金属、添加剂、其它含量等值重要。而在重金属、添加剂、其它含量等值中,而各类食品都用到添加剂,所以,添加剂比重金属、其它重要。而其它比重金属重要。利用19标度法(见下表)进行成对
15、比较,同时参考专家意见,确定各因素之间的相对重要性并赋以相应的分值,构造出各层次中的所有判断矩阵,并计算权向量和一致性检验。表2 19 标度的意义标度aij 意义1Ci 与Cj 的影响相同3 Ci 比Cj 的影响稍强5Ci 比Cj 的影响强7Ci 比Cj 的影响明显地强9Ci 比Cj 的影响绝对地强2 ,4 ,6 ,8为上述两判断级的中间值1 ,1/ 2 , ,1/ 9 Ci 较Cj 的影响之比与上述说明相反 1、 根据判断矩阵标度内容及其含义,可得A-B层判断矩阵B: B1 B2 B3 B4 1 4 2 3 B1 1/4 1 1/2 3/4 B2 B= 1/2 2 1 3/2 B3 1/3
16、4/3 2/3 1 B4 其中B矩阵中的每一个元素Bij根据调查相关数据定性判断出:2、 用方根法计算出判断矩阵B的权重值并进行归一化: 方根法(几何平均法): Wi= i=1,2,3,.,n归一化: =计算步骤:1、B中的元素按行相乘得一新向量;2、将新向量的每一个分向量开n次方;3、将所有向量归一化即为权重向量。3、计算判断矩阵B的最大特征值并进行一致性检验. 计算一致性指标C.I 其中,n为判断矩阵的阶数计算一致性比例其中为平均一致性指标,当时判断矩阵具有好的一致性。找查相应的平均随机一致性指标R.I。平均随机一致性指标n12345678910R.I000.520.891.121.261
17、.361.411.461.49 经计算得图表:AB1B2B3B4=4C.I.=0R.I.=0.89C.R.0.1B114232.210.484.00B21/411/23/40.550.124.02B31/2213/21.110.243.99B41/34/32/310.740.163.99(3)建立两两比较的B-C层判断矩阵并进行一致性检验。根据途径一的表格中数据 (表1-1)可完成表格:方法和计算B判断矩阵一致。B1C1C2C3=3C.I.=0R.I.=0.52C.R.0.1 C110.4571.2710.8340.253.00C22.18712.7801.8250.553.00C30.787
18、0.36010.6570.203.00B2C1C2C3=3C.I.=0R.I.=0.52C.R.0.1C110.1050.2770.3080.073.00C29.56512.6512.9380.673.00C33.6090.37711.1080.253.00B3C1C2C3=3C.I.=0R.I.=0.52C.R.0.1C110.2040.2950.3920.113.00C24.91311.4491.9240.533.00C33.3910.69011.3280.363.00 B4C1C2C3=3C.I.=0R.I.=0.52C.R.0.1 C110.3981.4550.8340.243.00C
19、22.51313.6552.0940.603.00C30.6880.27410.5730.163.00(4)三年中食品安全评价结果表 1、列表计算 Bi biB1B2B3B40.480.120.240.16C10.250.070.110.240.1932C20.550.670.530.600.5676C30.200.250.360.160.22382、 2、深圳市食品质量系数(PI)分级 (表2-2)(5)市场食品质量安全的综合评价指数的计算 PI=根据深圳市食品安检局标准处推荐的评价标准(GB38382002食品安检质量标准以及食品质量分级)为参考依据,见下表1.3表1.3深圳市食品质量系数
20、(PI)分级质量安全值级别食品质量评价0.80劣严重劣食品这样就得到了2013年第一至四期食品安全抽样检验产品抽查样本的食品安全的优劣状况,并做出定量的综合评价。其它年份的食品安全情况同理可求。求解程序见附录1。表1.4为求得的各个抽查样本的食品质量安全状况和定量综合评价。其中C.R.为一致性指标(当C.R. F1-(k,n-k-1)时拒绝H0,F越大,说明回归方程越显著;与F对应的概率p 时拒绝H0,回归模型成立。% Y为n*1的矩阵;% X为(ones(n,1),x1,xm)的矩阵;% alpha显著性水平s2=sum(r.2)/(n-m-1);b,bint,s,s2rcoplot(r,r
21、int); %用这个图来来做参差及其置信区间的图,如果数据的置信区间不包含零点,则可认为这个数据是异常的,应把它剔除利用第一个多元回归方程求出来的理论值1234567895612.35177.24392.85625.65133.74517.04552.8NAN4092.11011121314151617184521.45590.14991.25385.5NAN4273.75060.75389.95187.01920212223242526274665.65516.64964.05177.85883.24665.05083.34559.05763.5282930313233343536NAN56
22、93.94801.05304.85392.14680.95378.56118.14876.937385245.05315.5利用最终的回归方程求出来的理论值1234567895396.85211.34469.55686.95266.84518.04558.8NAN3984.41011121314151617184530.95542.45072.95320.4NAN4187.65053.05270.05106.61920212223242526274939.95417.54890.65329.46012.64679.35136.44752.25618.2282930313233343536NAN5734.44688.45228.35412.64666.75430.95990.74914.137385260.75308.521