食品质量安全抽检数据分析 数学建模.doc

上传人:豆**** 文档编号:17287411 上传时间:2022-05-23 格式:DOC 页数:19 大小:592.50KB
返回 下载 相关 举报
食品质量安全抽检数据分析 数学建模.doc_第1页
第1页 / 共19页
食品质量安全抽检数据分析 数学建模.doc_第2页
第2页 / 共19页
点击查看更多>>
资源描述

《食品质量安全抽检数据分析 数学建模.doc》由会员分享,可在线阅读,更多相关《食品质量安全抽检数据分析 数学建模.doc(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流食品质量安全抽检数据分析 数学建模.精品文档.食品质量安全抽检数据分析摘 要随着经济的发展,食品安全已成为社会关注的热点。深圳作为食品抽检、监督最统一、规范和公开的城市之一,拥有科学有效的食品质量安全标准的制定、抽样检测及评价方法具有重要意义。对于问题一,首先本文根据食品标准分类系统划分了16个食品领域大类;其次选取了深圳市2010年、2011年和2012年生产、流通及消费环节的食品抽检数据,以果蔬、水产品、肉制品为例,绘制出了微生物、重金属以及添加剂含量的安全情况随时间变化的曲线;最终分析得出微生物检测项目中,水产品和肉制品的不合格率变化幅

2、度较大,添加剂和重金属检测中,各食品在不合格率在逐渐降低,安全性提高。对于问题二,首先本文考虑到食品质量是否合格受多方面因素影响,确定了季节因素、食品销售地点(即抽检地点)、食品产地3大因素作为影响因素;其次建立了二项Logistic回归模型,并运用SPSS软件求解,得出了各因素对食品合格率的影响大小分别为产地因素63%、销售地点(即抽检地点)33%以及季节因素4%,其中产地、销售地点(即抽检地点)因素为负相关,季节因素为正相关;再次采用Hosmer和Lemeshow检验对模型结果进行检验,以检验模型拟合优度。对于问题三,首先本文根据深圳市种植业产品、水产品以及禽畜产品抽检数据,分析了食品抽检

3、合格率与抽检场所、季度和地理区域的关系;其次依据合格率实现情况确定适当的抽检方法和抽检次数,并结合深圳市现有食品抽检方案,进行总结;再次利用百分比抽检法,根据抽样特性曲线与两类误差的关系,对现行抽检方案和OC曲线进行分析,改进抽检方法,使之科学且有效地反映食品质量状况又不过分增加监管成本。最后,本文对模型进行了改进,使模型更具有实际意义。关键词:食品分类 变化趋势 二项Logistic回归模型 百分比抽检 OC曲线一、 问题重述食品质量与人民生活水平关系密切。随着社会经济发展与消费健康意识的提高,食品安全问题日益成为社会关注焦点,民生工程建设的重点工作之一。城市食品具有来源广、加工工序复杂、流

4、通渠道密等特点,食品质量受生产、加工、消费环节等多方面因素影响。因此,食品质量检测需要专业性技术支持,从标准制定到抽样检测及评价均需要科学有效的检测方法。深圳市是食品抽检、监督最统一、最规范、最公开的城市之一。通过分析2010年、2011年和2012年深圳市的食品抽检数据(注意蔬菜、鱼类、鸡鸭等抽检数据的获取),重点讨论如下问题:问题一:评价深圳市2010-2013年个主要食品领域(微生物、重金属、添加剂含量等)安全情况的变化趋势;问题二:根据数据资料找出规律性关系,并进行分析;问题三:如何改进食品质量抽检方法,以达到低监管成本的同时,科学有效的反映食品质量状况,例如对于抽检结果稳定且抽检频次

5、过高的食品领域如何调整。二、问题分析问题一分析为了评价深圳市近三年主要食品领域安全情况变化趋势,首先需根据食品标准分类系统划分食品领域大类,并根据各类别食品的主要抽检特征,选取一系列较科学的检验指标刻画其安全情况。因此,我们查阅了中国食品分类标准,按照生产、流通及消费环节,选取了深圳市2010年、2011年和2012年蔬菜、鱼类、鸡鸭作为例子,绘制各检测项目含量随时间的增减变化曲线,刻画各主要食品领域微生物、重金属以及添加剂含量的变化趋势。问题二分析 由于食品质量是否合格受多方面因素影响,而若被解释变量设为食品质量是否合格,即二分类变量,则可使用二项Logistic回归模型。根据题中所给出的数

6、据特征,我们确定季节因素、食品销售地点(即抽检地点)、食品产地3大因素作为分类变量,将初步处理后的数据导入SPSS软件,即可根据概率结果分析各因素与食品合格率的关系。为了对模型二的结果进行检验,我们采用Hosmer和Lemeshow检验,分别对合格产品和不合格产品进行已观测值与预测值拟合,以检验模型拟合优度。问题三分析根据深圳市2010年、2011年、2012年的食品抽检数据,结合深圳市现有食品抽检方案,进行总结。我们选取了种植业产品、水产品以及禽畜产品三类,并依据抽检场所、季度以及抽检分区三方面分别计算食品合格率,并结合合格率实际情况适当减少抽检次数,以科学且有效地反映食品质量状况又不过分增

7、加监管成本。利用百分比抽检法,根据抽样特性曲线与两类误差的关系,对现行抽检方案和OC曲线进行分析,改进抽检方法。三、模型假设1、所有数据都是随机抽取且准确而真实,可以真实地反映深圳市的食品质量安全情况。2、 每个区执行的监管力度基本相同,即均按照国家质检总局和深圳市本地区的食品安全相关条例实施并且贯彻执行的。3、 假设四类安全指标对食品领域的影响是相互独立,没有关联性。4、 深圳市最近几年的经济,人均消费水平等社会宏观方面因素的发展基本都呈稳定的趋势。5、 假设监管部门每一年中对每家企业随机抽检产品数目相同。四、符号说明 第类产品第小类不合格产品指标含量 第类产品的指标含量 产品小类的种类个数

8、 事件发生与否的二分类因变量 时间发生的概率 事件的观测值 一系列影响事件发生概率的因素的线性函数 二分类变量, 影响因变量的自变量因素 第 i季度j食品领域的不合格批次数 某一指标在j食品领域组成成分中具有的含量 定量描述食品领域之间具体质量安全情况的一个尺度 三年中j食品领域被抽检的总批次数 定量作为对食品领域质量安全情况分类的标准 定量作为对企业产品质量评价的量纲L(p) 抽样方案的接受概率五、模型的建立与求解问题一的模型建立与求解5.1.1 食品分类分析根据我国目前制定的企业标准,食品分类系统用于界定食品添加剂的使用范围,该标准的食品分类系统共分十六大类,标准见表1。表1 食品分类标准

9、编号种类编号种类01乳及乳制品(除了13类特殊营养用食品涉及品种)09水产及其制品(包括鱼类、甲壳类、贝类、软体类、棘皮类等水产)02脂肪,油和乳化脂肪制品10蛋及蛋制品03冷冻饮品11甜味料,包括蜂蜜04水果和蔬菜(包括块根类)、豆类、食用菌、藻类、坚果以及籽类等12调味品05可可制品、巧克力和巧克力制品(包括类巧克力和代巧克力)以及糖果13特殊营养用食品06粮食和粮食制品,包括大米、面粉。杂粮、块根植物、豆类和玉米提取的淀粉等(不包括07类焙烤制品)14饮料类07焙烤制品15酒类08肉及肉制品16其他 以上食品分类标准相较完备,根据深圳市食品质量检测数据,本文重点选取了2010年、2011

10、年和2012年蔬菜、鱼类、鸡鸭作为例子,并据其代表生产、流通及消费环节,刻画各主要食品领域微生物、重金属以及添加剂含量的变化趋势,分析深圳市近年食品安全情况。5.1.2 安全情况变化趋势 为了评价深圳市2010-2013年个主要食品领域安全情况的变化趋势,结合上述食品分类标准,本文将产品分类精炼为果蔬、水产品和肉制品及其制品三大类别,重点考察其微生物、重金属、添加剂含量随时间的变化。由于合格产品在源数据中无具体数值体现,本文选取不合格产品并将其归类于果蔬、水产品和肉制品及其制品,其各指标含量数据整理得到: (1)上式(1)中, 表示第类产品第小类不合格产品指标含量,其中,分别表示果蔬、水产品和

11、肉制品及其制品三类,表示大类下具体小类,表示产品小类的种类个数,表示第类产品的指标含量。整理数据如下所示:表2 微生物(单位:cfu/g)年份季度果蔬水产品及其制品肉类及其制品2010全年0002011第一季度1.05233*1060.14*1060.916*106第二季度000.28856*106第三季度01.8747*1060第四季度002.6432*1062012第一季度000.12*106第二季度03.05*1060.46*106第三季度000第四季度02.2*1060.72*106注:为方便起见,将2010年全年在图中表示为20100, 则2 011年第一季度表示为20111,同理2

12、0121表示2012年第一季度等。图1 不同类别食品微生物含量比较 如图1所示,水产品和肉类及其制品随季度周期均呈波动幅度较大的变动。鉴于肉类产品其新鲜易腐特点,在流通运输过程中易产生微生物;同时,受季节气温因素影响,年份内第二季度和第四季度微生物检测含量较大,不合格率高。果蔬类产品近年微生物检测控制力度较大,产品基本合格。表3 添加剂(单位:g /kg)时间季度果蔬水产品及其制品肉类及其制品2010全年000.0622011第一季度3.21050.25080.14423第二季度0.0654200.030737第三季度000第四季度000.084962012第一季度000.065第二季度0.0

13、820.0260.028续表3 添加剂(单位:g /kg)时间季度果蔬水产品及其制品肉类及其制品2012第三季度000第四季度2.20.3260.207注:为方便起见,将2010年全年在图中表示为20100, 则2 011年第一季度表示为20111,同理20121表示2012年第一季度等。图2 不同类别食品添加剂含量比较 由图2可知,水产品和肉类产品及其制品中添加剂成分较少,检测不合格率稳定保持于较低水平;果蔬产品于2010年至2011年第二季度间有明显上升趋势,而后大幅度降低,稳定于添加剂含量低水平线,但2012年第四季度三类产品均出现添加剂不合格率上升现象。表4 重金属(单位:mg/kg)

14、时间季度果蔬水产品及其制品肉类及其制品2010全年0.043002011第一季度02.1359.96第二季度000第三季度3.800第四季度200.662012第一季度000第二季度02.20第三季度000第四季度000注:为方便起见,将2010年全年在图中表示为20100, 则2 011年第一季度表示为20111,同理20121表示2012年第一季度等。图3 不同类别食品重金属含量比较 如上所示,果蔬类产品于2011年第三季度及第四季度出现重金属含量超标现象,而水产品及其制品于2011年第一季度及2012年第二季度出现两次超量高峰,肉类产品2011年第一季度重金属含量不合格率达10%;近年来

15、,随着深圳市食品质检部门监控力度的加大,三类产品重金属超标现象得到明显遏制,基本满足100%产品合格,有力保障了消费者食品消费安全。综上所述,果蔬类,水产品和肉制品及其制品三大类产品的微生物、重金属以及添加剂含量部分存在幅度波动,但总体来说,近年均趋于较低水平发展趋势。基于市场利益需求的驱动与政府食品质量监督部门的监控,二者均衡相较,深圳市食品质量整体呈较高水平发展,消费者食品质量较稳定安全。问题二的模型建立与求解研究对象食品质量是否合格受多方面因素影响,由于这个问题中被解释变量为非连续定距类型变量,故将这个多元回归模型的被解释变量设为食品质量是否合格(1表示合格,0表示不合格),是个纯粹的二

16、值品质型变量,故使用二项Logistic回归模型对其进行分析。5.2.1 用于二分类变量的理论依据事件发生的条件概率与自变量之间的非线性关系通常是单调函数,即随增加(或减少),也单调增(或减)。设一个理论上存在的连续反应变量代表事件发生的可能性,当该变量的值跨越一个临界点(如时)便导致致事件发生,于是有 (2)其中,表示事件的观测值;表示事件发生与否的二分类因变量,表示事件发生,反之。假设厂和自变量间存在线性关系,即 (3)则事件发生的条件概率用函数表示为 (4)为了从函数得到回归模型,式(4)式可写为 (5)式(5)为当取值时的累积分布函数,被定义为一系列影响事件发生概率的因素的线性函数 (

17、6)5.2.2 模型建立对于二分类因变量分析问题,一般可以采用非线性多元函数进行,而常用的便是Logistic回归模型。Logistic模型能够很清楚的说明自变量对因变量的影响强度和因变量发生的概率。设是自变量,是模型的因变量,建立回归模型如下: (7)为截距,为斜率。其中,是二分类变量,是影响因变量的自变量因素。 发生事件的概率是由自变量构成的非线性函数,其表达式如下: (8) 发生比()可以反映因变量随自变量变化而变化的强度,并且发生比一定为正值,因为,表示的含义为:固定某一自变量不变,某一自变量发生一个单位的变化,那因变量也会发生个单位的改变,当从1减小到0时,logit(y)取负值且绝

18、对值越来越大,当从1增加到无穷时,它取正值且越来越大。自变量可以是连续变量、区间变量、二分类变量、多项类变量。发生比的计算公式为: (9)题目中所给的数据项中包括产品季节因素、食品销售地点(即抽检地点)、食品产地因素,根据Logistic回归模型对这三项变量赋值定义见表5。表5 Logistic回归模型变量赋值定义表合格与否季度生产地抽检地合格与否季度生产地抽检地01241321111103161114032801361325112303250222042702281415022114281235041312261411这里采用Logistic回归方法,产品是否合格作为被解释变量(0/1二值变

19、量),其余各变量为解释变量,且其中季节因素、食品销售地点(即抽检地点)、食品产地因素均为分类变量。回归分析的变量及赋值见表6。表6 变量赋值表变量特征变量含义变量类型变量取值Y因变量产品是否合格二值变量产品合格=1;产品不合格=0X1自变量季节分类变量1-3月=1;4-6月=2;7-9月=3;10-12月=4X2产地分类变量宝安区=1;罗湖区=2;福田区=3;南山区=4;盐田区=5;龙岗区=6;光明新区=7;坪山新区=8X3销售地点(即抽检地点)分类变量深圳市内=1;广州省内=2;广州省外=3基于原始数据,本文建立了Logistic回归模型,并运用SPSS软件对上表赋值处理后的数据进行回归分析

20、,分析结果见表7。表7 非条件Logistic回归分析结果变量BS.E.dfSig.Exp(B)X10.0220.4610.00210.0501.023X2-0.3450.8790.15410.0480.708X3-0.1810.2210.67010.0450.834常数1.3732.1210.41910.0293.947注:B为标准偏回归系数,S.E.为标准差,为卡方检验值,df为自由度,Sig.为对应的概率P值。.通过计算,三个变量(因素)均具有显著意义(它们进入回归方程中),回归方程中各变量的偏回归系数估计值见表8,这3个因素的影响大小见图4。图4 主要影响因素比重图由表7和图4可知,针

21、对食品合格与否按照因素影响大小排序,分别为产地因素63%、销售地点(即抽检地点)33%以及季节因素4%,其中产地、销售地点(即抽检地点)因素为负相关,季节因素为正相关。就产地因素,按照宝安区、罗湖区、福田区、南山区、盐田区、龙岗区、光明新区、坪山新区顺序食品合格率逐渐降低,即宝安区食品合格率最高,坪山新区食品合格率最低;就销售地点因素,按照深圳市内、广州省内、广州省外顺序食品合格率呈下降趋势,即深圳室内食品合格率最高,广州省外食品合格率最低。就季节因素,广东省地处低纬,属热带和亚热带季风气候区,受气温、水分、湿度等因素共同作用,食品合格率与季节变化呈负相关。5.2.3 模型检验 为了对模型二的

22、结果进行检验,我们采用了Hosmer和Lemeshow检验,检验结果见表9。表8 Hosmer 和 Lemeshow 随机性检验表步骤不合格= 0.00合格= 1.00总计已观测期望值已观测期望值1234567891021.84700.153211.23110.869211.35011.250210.86721.833321.90300.097200.10721.693210.92911.171211.32810.872210.85611.144200.08210.8181如表8所示,因变量有两个值不合格为0和合格为1。本文将模型进行Hosmer和Lemeshow检验后,绘制出不合格数据与合格

23、数据的拟合曲线图,从图中可以看出观察值和预测值逐渐接近,模型的拟合度较好。图5 不合格产品的已观测和期望值的拟合图 由图5所示,不合格产品的已观测值与预测值呈现出越来越接近的趋势,可知模型的拟合度优度较高,可靠性较好。图6 合格产品的已观测和期望值的拟合图由图6所示,合格产品的已观测值与预测值同样呈现出越来越接近的趋势,可知模型的的拟合度优度较高,可靠性较好。综上,不合格产品与合格产品已观测值和预测值均呈现出接近程度越来越高的趋势,有较高的拟合度,模型二的建立与求解有较高可靠性。问题三的模型建立与求解5.3.1 食品抽检因素控制 根据深圳市2010年、2011年、2012年的食品抽检数据,我们

24、选取了种植业产品、水产品以及禽畜产品三类,并依据抽检场所、季度以及抽检分区三方面分别计算食品合格率,就数据结果提供抽检方案修改意见。(1)食品抽检的合格率与抽检场所的关系 本文通过查阅大量数据得出各抽检场所的食品合格率见表9。表9 各抽检场所的食品合格率抽检场所种植业产品水产品禽畜产品生产基地83.33%100%100%农贸市场92.5%100%100%超市94.38%100%100%批发市场98.75%100%100%总计93.85%100%100%由表9可以看出,种植业产品(果蔬类)的合格率的大小关系是生产基地小于农贸市场小于超市小于批发市场。由此可见,抽检时要着重于生产基地的不定期抽检,

25、也应该增加其抽样次数,从源头上保证食品的安全。在农贸市场、超市、批发市场等销售环节的抽检可以相应根据抽检产品的合格率累计相应进行抽检次数的调整。(2)各类食品合格率与季度关系本文通过查阅大量数据得出不同季度的食品合格率见表10。表10 不同季度食品的合格率季度种植业产品水产品禽畜产品第一季度95.7%100%100%第二季度98.01%100%100%第三季度99.7198.78%98.67%第四季度93.85%100100因为食品的物理性质决定食品的安全情况会与季度的变化有关,不同季度的温度、空气湿度、光照情况、降水情况会影响食品的生产、保鲜、储存的安全情况。本文选取种植业产品(果蔬)、水产

26、品、禽畜产品为例说明季度与食品合格率的问题。由表中可看出种植业产品在第一季度与第四季度的抽检合格情况要低于第二、三季度的抽检,所以要增加在第一、三季度的抽检次数和样本量。水产品和畜禽产品在第三季度的合格率要低于其他季度,所以要增加在第三季度的水产品和畜禽产品的抽检力度,相应增加抽取次数、抽取的样本量和抽取的场所分布点。(3)深圳市各区的食品安全情况分析本文通过查阅大量数据得出深圳市不同区的食品合格率见表11。表11 深圳市不同区的食品合格率区数种植业产品水产品畜禽产品罗湖区93.75%100%100%福田区96.15%100%100%南山区93.75%100%100%宝安区(含龙华新区)94.

27、50%100%100%龙岗区(含大鹏新区)95.50%100%100%盐田区91.67%100%100%光明新区79.17%100%100%坪山新区95.83%100%100%深圳市有8各区,每个区的食品合格率会受到该区的食品生产、销售场所分布情况不同、食品仓储情况不同,该区的经济发展水平、人们的饮食消费习惯不同而有所差别。由表中可知,水产品和畜禽产品的合格率在各区的抽检结果都很高,所以可以根据各区各类食品的累加合格率进行适当的抽检次数的调整,种植业产品(果蔬)属于易变质,不便于保鲜,所以该类食品的合格率明显要低于其他类的食品。从各区的食品合格情况看,光明新区的食品合格率最低,仅仅为79.17

28、%,盐田区、罗湖区、南山区、宝安区(含龙华新区)的食品合格率属于中间等级,为91%95%。龙岗区(含大鹏新区)、坪山新区、福田区的食品合格率属于较高等级,为95%97%。福田区的产品合格率最高,可以根据累计食品合格率情况适当的减少抽检次数。5.3.2 百分比抽检法(1)深圳市的食品抽样方法根据深圳市市场监督管理局食品安全抽样检验工作管理规定(试行)资料显示,抽检计划应当包括以下内容:抽检时间;抽检对象;承担抽样和检验任务的检验机构;抽检样品的种类、批次;其他需在抽检计划中明确的事项等。对可能出现严重食品安全问题的食品生产经营单位或风险较高的食品,适当加大抽检频次或抽检批次,而对消费者申诉及举报

29、较多的食品;监督检查中发现问题比较集中的食品;案件查办中涉及的食品;根据有关部门通报情况需要进行抽检的食品;因其他原因需要在定期抽检的基础上,进行不定期抽检的某类食品、某一生产经营者的食品或者某一区域的食品可以进行不定期抽检,现将深圳市现有的食品安全抽样检验方法总结见图7。图7 深圳市现有的食品安全抽样检验方法总结框图深圳市的食品抽样一般都是一次性的,称之为一次抽检方案。一次抽检方案就是从批量为N的某食品中,抽取一个容量为n的样品,经检验后,由这个样品的不合格数d来决定这批食品是否合格。对于此种抽样问题,关键是确定抽样量n和合格判定数c,故一次抽检方案又称(N,n,c)方案。其抽检过程见图8。

30、从N个产品中任取n个样本检查n个样本中不合格的数量ddcdc产品合格产品不合格图8 一次抽检方案抽检过程图(2)抽样特性曲线与两类误差的关系食品抽样检验时存在的误差情况见表12。表12 抽样中可能出现的判定情况实际情况数据鉴定评价1.合格批dc合格批正确2.合格批dc不合格批错误3.不合格批dc合格批错误4.不合格批dc不合格批正确由表12可以看出,在食品抽样检验存在两类误差就是当判断食品为不合格批时,即型误差,一般用表示;而当判断食品为合格批时可能犯第二类错误,即型误差,一般用表示。(3)现行抽检方案和OC曲线及其分析当N较大时,n较小时可用二项分布近似计算L(p):为检验蛋品的沙门氏菌,按

31、5%的比例抽取,考虑批量不同的三个抽样方案:N=100,n=5,C=0;N=400,n=20,C=0;N=2000,n=100,C=0。其OC函数分别为其具体取值见表13。表13 接受概率的具体取值2468100.900.820.730.660.590.670.440.290.190.120.130.02000由表13可知,规定=5%,若食品的实际不合格率均为2%,P,均应判为合格,三种方案的接受概率分别问0.90、0.67、0.13,即型误差分别为0.10,0.33,0.87;当P均为10%时,P,均应为不合格,三种方案的接受概率,即型误差分别为0.59、0.12、0.00。可见百分比抽检方

32、案的主要缺点是:当食品质量相同时,对于小批量来说,型误差过大,容易把不合格食品误当成合格的食品处理;对于大批量来说,型误差过大,容易将合格的食品误当成不合格的食品处理。(4)抽检方法的改进有上述分析可知,改进百分比抽检的关键是改进合格判断数c。也就是说,当由于批量N增大或减小导致样本含量n随之增大或减小时,合格判断数c应作相应的调整。问题在于当n变化时,c应怎样调整才比较合理?显然,如果按双百分比抽检的调整方法规定一个百分比,受主观因素的影响较大。同时,由于这样只是简单地把合格判断数c归结成了批量N的一个线性变量,反映不出生产方和用户对产品的不同质量要求,即当质量要求随生产实际状况和技术经济要

33、求有相应变化时,c不能适应这种变化,都可能失之太严或太宽。不能仅仅从样本含量n的增大或减少倍数来决定合格判断数c的增大或减小倍数。应该按照对控制不合格品率的宽严程度相近的原则和生产实际中对产品的质量要求水准来确定合格判断数c。本文用下述办法来确定与抽检方案(5,0)宽严程度相近的抽检方案(50,c),c为待定数。设P=5%,先计算出抽样方案(5,0)的接受概率L(P)当两批产品质量相同时,显然无论用何抽样方案,它们的接受概率L(P)也都应一样或非常接近。不妨假设抽样方案(50,c)的接受率L(P)=0.7738,解方程即得到c。上式中:显然取c=3。由此可见,按原分分比抽检方案(50, 2)进

34、行验收是比较严的, 其接收率L(P)=0.5405。经过改进后,抽检案变为(50,3)。问题还并没有结束,当本文按抽检方案(5,0)来验收产品时,接收概率是L(P)=0.7738,这样的L(P)是否合理呢?如果这个L(P)=0.7738本身不合理,那么以此为标准推出的方案(50,3)验收产品的接收概率L(P)=0.7604就也是不合理。当不合格率很小时,本文期望以很高的概率L(P)来接受产品,而希望犯第一类错误的概率(生产者风险率)不大于当不合格率增大到一定程度,达到或超过规定的极限不合格率时,我们总是希望以很高的概率(1-)拒收产品,而希望犯第二类错误的概率(使用者风险率)不大于。如果一个抽

35、检方案的和都较小,则我们就认为由此而得出的接收概率是比较合理的。应当指出。和的确定,是生产和使用者根据党和国家的方针政策及双方的实际情况协商的结果。在某种程度上,与之间存在着一定的矛盾,但总可以在总体最优的原则下进行调整。因此,根据生产方的实际质量水平和历史资料,可以预测出将来生产的产品批可能的不合格率P。然后确定出百分比抽样系数并求出相应的样本含量n,按双方商定的生产者风险求出抽验方案的合格判断数c,最后再根据双方商定的使用者风险率确定出产品批的极限不合格率满足使用方的质量要求。则所求方案(n,c)即是比较合理的抽检方案。六、模型的优缺点与分析优点:1、 第一问中本文查阅了食品分类标准,并对

36、食品进行了合理的分类,使问题得到合理的简化,较有说服力。2、 本文应用了数理统计知识,合理地对食品领域的微生物、重金属、添加剂含量安全情况的变化趋势进行了描述,较好的解决了问题。3、第二问中本文运用logistic回归分析法,在原有数据的基础上,合理地得出了食品产地、食品销售地点(即抽检地点)、季节因素与食品质量的关系,使模型与实际更加贴近。4、第二问中本文对模型进行Hosmer和Lemeshow检验,绘制出不合格数据与合格数据的拟合曲线图,模型的拟合度较好。5、 在第三问中本文查阅大量资料,提出来深圳市抽样方法存在的问题,并合理地改进了食品的抽样方法,模型较理想。6、 在本文最后,为了使模型

37、是实际更加相符,本文原有的模型进行改进,并进行了推广。缺点:1、 本题所含的数据量较大,在提取过程中,对数据进行了一些简化处理,可能出现一些误差。2、 本文有些假设过于理想化,忽略了一些常规下可能的影响(如:经济因素等),这令本文的模型可能与实际情况产生误差,有一定局限性。七、模型的改进与推广模型改进:为了更好的分析食品产地、食品销售地点(即抽检地点)、季节因素与食品质量的关系,可以采用相关分析分析这几个指标之间的相互关系。相关分析是分析客观事物之间相关性的数量分析方法。明确客观事物之间有怎样的关系对理解相关分析是极为重要的。客观事物之间的关系大致可归纳为两大类,即函数关系和统计关系。利用相关

38、系数进行变量间线性关系的分析通常需要完成以下两大步骤:第一,计算样本相关系数。第二,对样本来自的两总体是否存在显著的线性关系进行推断。 对不同类型的变量应采用不同的相关系数来度量,常用相关系数由Pearson简单系数、Spearman相关系数和Kendall相关等。Pearson简单相关系数用来度量两定距型变量间的线性相关性。简单相关系数反映两个变量之间线性相关密切程度和相关方向的统计测定,它是其他相关系数形成的基础。两个随机变量 和 的简单相关系数的计算公式为: (10)或简化为: (11)相关系数具有以下性质:1. 相关系数的取值范围在-1和+1之间,即:;2. 若计算结果为正,则表明两变

39、量为正相关;若计算结果为负,则表明两变量为负相关;3. 相关系数的数值越接近于1(-1或+1),表示相关性越强;越接近于0,表示相关性越弱。如果或,则表示两个变量完全直线性相关。如果,则表示两个变量完全不相关(不是线性相关)式(10)中,为样本数,和分别为两变量的变量值。由式(11)可进一步得知简单相关系数也即: (12)式(11)说明,简单相关系数是个和分别标准化后的积的平均数。于是可知简单相关系数有以下几个特点:1. 和在式(10)和式(11)中是对称的,说明与的相关系数等同于与的相关系数。2. 由于相关系数是和标准化后的结果,因此简单相关系数是无量纲的。3. 对和作线性变换后可能会改变它

40、们之间相关系数的符合(相关的方向),但不会改变相关系数的值。4. 相关系数能够用于度量两变量之间的线性关系,但它并不是度量非线性关系的有效工具。Pearson简单相关系数的检验统计量为t统计量,其数学定义为: (13)在式(13)中,t统计量服从个自由度的t分布。SPSS将自动计算Pearson简单相关系数、t检验统计量的观测值和对应的概率值。模型推广: 本文中所建立的模型不仅对于解决题目中的问题具有很强的实用性,而且具有很好的推广性。例如本文运用的主成分分析法适用于其他类似一类组成成分比较复杂的问题。本文针对问题三所建立的模型具有较强的普适性,能够对各类主要食品进行较为理想的抽检,而且对批量

41、生产的各种零件、衣服等的质量抽检提供了一种较为简单高效的方法,具有较强的研究意义。参考文献1 食品分类系统 百度百科2 姜启源. 数学模型M. 第一版. 北京:高等教育出版社, 1993.3 朱道元. 数学建模精品案例M. 第一版. 南京:东南大学出版社, 1999.4 陈荣江. 概率论与数理统计M. 第一版. 北京:北京大学出版社, 2006.5 贾怀勤. 应用统计M. 第一版. 北京:对外经济贸易大学出版社, 2006.6 朱德通. 优化模型与实验M. 第一版. 统计大学出版社, 2003年4月.7 袁嘉祖,灰色系统理论及其应用,M+北京:科学出版社,1991。8 邓聚龙,灰预测与灰决策,M武汉:华中科技大学,2005。9 唐竹青,胡晓华, 布朗单一参数指数平滑法的推广,昆明理工大学理学院, 云南民族大学学报,2006年02期 。10 姜启源,数学模型(第三版),北京:高等教育出版社,2003。11 韩中庚,数学建模竞赛获奖论文精选与点评,北京:科学出版社,2007。12 汤小丹,计算机操作系统,西安:西安电子科技大学出版社,2007。13 杨启帆,李浙宁,王聚丰,涂黎晖,数学建模案例题集,高等教育出版社,2003年4月。14 苏金明,阮沈勇。MATLAB 实用教程M 北京,电子工业出版社,2005 年7月。15 Mark M.Meer

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁