《食品试验设计与统计分析期末复习资料.docx》由会员分享,可在线阅读,更多相关《食品试验设计与统计分析期末复习资料.docx(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章 1.统计学:研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学的推断。因而统计学是认识世界 的重要手段。 2.食品试验设计与统计分析:数理统计原理与方法在食品科学研究中的应用,是一门应用数学。 3.食品试验科学的特点:1.食品原料的广泛性 2.生产工艺的多样性 3.质量控制的重要性 4.不同学科的综合性 4.统计学发展概貌:古典记录统计学、近代描述统计学、现代推断统计学。 第二章 5.总体:根据研究目的确定的研究对象的全体。 6.个体:总体中一个独立的研究单位。 7.样本:根据一定方法从总体中抽取部分个体组成的集合。 8.样本含量 n(样本容量):即样本中个体的数目。(n30
2、的样本叫小样本,n30 的样本叫大样本) 9.随机样本:总体中的每一个个体都有同等机会被抽取组成样本。 10. 参数:由总体计算的特征数。 11. 统计量:由样本计算的特征数。 12. 参数和统计量的关系:由相应的统计量来估计参数,如样本平均数估计总体平均数,样本标准差估计总体标 准差。 13. 准确性(准确度):在调查或试验中某一实验指标或性状的观测值与真实值接近的程度。(观测值与真实值之间) 14. 精确性(精确度):在调查或试验中同一实验指标或性状的重复观测值彼此接近的程度。(观测值与观测值之间) 15. 试样中的误差:随机误差和系统误差。 16. 随机误差(抽样误差):由许多无法控制的
3、内在和外在偶然因素所造成的误差,不可避免和消除,影响试验 的精确性。 17. 系统误差(片面误差):由于试验对象相差较大,测量的仪器不准、标准试剂未经校正所引起,可以通过改 进方法、正确试验设计来避免、消除,影响试验准确性。 18. 资料的分类:连续性资料:对每个观测值单位使用仪器或试剂等量测手段来测定其某项指标的数值大小而得 到的资料。 间断性资料:用计数方式得到的数据资料。 分类资料:可自然或人为地分为两个或多个不同类别的资料。 等级资料:将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数 而得的资料。 19. 连续性资料的整理:采用组距式分组 1.求全距 2.确定组
4、数 3.求组距 4.确定组限和组中值(最小值为下限,最大值为上限。第一 组的组中值以接近于或等于资料中最小值为好。)5.制作次数分布表 20. 统计表的绘制原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和分析 21. 统计表种类:简单表,复合表 22. 统计图:用图形将统计资料形象化。长条图、圆图、线图、直方图、折线图。 23. 平均数 X:指出资料中数据集中较多的中心位置,描述资料的集中性。反应了总体分布的集中趋势。 24. 平均数的种类:算术平均数、中数、众数、几何平均数、调和平均数。 25. 算数平均数计算方法:直接法、加权法 26. 算数平均数的特性:离均差为 0
5、,离均差平方和最小。 27. 离均差:每个观测值均有一个偏离平均数的度量指标。算术平均数的离均差之和为零。 28. 离均差平方和:各个离均差平方后相加。 29. 方差(MS):也称均方,各数据与平均数的差的平方和与自由度的比。样本方差用S2表示。(无单位) 30. 自由度 df:样本内独立而能自由变动的离均差个数。 31. 标准差:样本方差的算术平方根。(有单位,与观测值单位相同) 32. 标准差的特性: 1.标准差的大小受每个观测值的影响,若数值之间变异大,其离均差亦大,标准差必然大。 2.各观测值加或减同一常数,标准差的值不变。 3.每个观测值乘以或除以一个不等于0 的常数 A 时,所得标
6、准差是原标准差的A 倍或 1/A。 33. 样本标准差:EXCEL 用 STDEV 函数计算。 34. 变异系数 CV:标准差相对于平均数的百分数。反映了总体的可比程度。 CV= S *100% X 35. 变异系数的作用:当资料所带的单位不同或单位虽然相同而平均数相差较大时,不能直接用标准差比较各个 样本资料的变异程度大小。消除了不同单位和平均数的影响。 第三章 36. 伯努利试验:只有两种实验结果的随机试验。 37. N 重伯努利试验:伯努利试验在完全相同的实验条件下独立的重复n 次,并作为一个随机试验。 38. 二项分布 xB(n,p):离散型随机变量分布。 k npkqn-k (k=0
7、,1,2,3,n) P(x=k)=C 39. 二项分布的特征 1.P n (K)02.(p+q)n=13.在一定范围内的总概率 P 等于被包含的几个概率之和。 4.当 p 值较小且 n 不大时,分布是偏倚的。随着 n 的增大,分布逐渐趋于对称。 5.当 p 值趋于 0.5 时,分布趋于对称。 40. 二项分布的应用条件: (1)试验结果为两大类或两种可能的结果。 (2)每次试验的条件不变,每次试验A 的发生概率均为 。 (3)各次试验独立,每个观察单位的观察结果不会影响到其他观察单位的结果。 41. 二项分布的平均数:m=np 42. 二项分布的方差:s2=npq 43. 泊松分布 xP(l)
8、:可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的分布。(即小概率事件 分布,意外事故、自然灾害都近似服从) P(x=k)= lke-l k! 44. 泊松分布特点:离散型随机变量概率分布,均值与方差相等。=2=。 45. 泊松分布的应用条件: 1. 随机地发生在单位时间或空间里的稀有事件的概念分布。 2. 在二项分布中,n 很大,p 很小时。 3. 事件不随机时,不能用泊松分布。 46. 正态分布 xN(m,s2):连续型随机变量的概率分布。 47. 正态分布的特点: 1. 正态分布曲线是以均数m为中心左右对称的单峰悬钟形曲线。在平均数的左右两侧,只要(x-m)绝对值相等, f(x
9、)值就相等。 2. f(x)在 x=m处达到最大值,且 f(m)=1/( 2p ) 3. f(x)是非负函数,以横轴为渐近线,分布从-到+,且曲线在m 处各有一个拐点。 4. m是位置参数,2 是形状参数。 5. 正态分布的次数多数集中于平均数m的附近,离均数越远,其相应的次数越少。 6. 曲线 f(x)与横轴之间所围成的面积等于1。 48. 标准正态分布 uN(0,1):m=0,2=1 的正态分布。 49. 标准正态变量(标准正态离差)u:u=(x-m)/ 50. 三种分布的关系: 1. 二项分布,当 n 很大,np、n(1-p)接近,该分布接近于正态分布。 2. 在 n、p0.5 时或 p
10、0.1 时可用二项分布代替正态分布。 3. 当 n、p0,且 np=l(较小常数)时,用泊松分布代替二项分布。 4. 当 p0.1 且 n 很大时,用泊松分布代替二项分布。 5. 泊松分布,l30 时,用正态分布代替。 51. 抽样分布:统计量的分布概率。 52. 抽样误差:由随机抽样造成的误差。 53. 标准误差(标准误,均数标准误):样本平均数抽样总体的标准差。反应精确性的高低,s s x 越大精确度越低。 m x = ms x = n s 54. t 分布:在计算 S x 时,由于采用 S 来代替s,使得 t 变量不再服从标准正态分布,而是服从t 分布。 t=(x-m)/S x 第四章
11、55. 统计推断:根据抽样分布规律和概率理论,由样本结果去推断总体特征。主要包括假设检验(显著性检验) 和参数估计。 )和试验误差e。 56. 表面效应:样本平均数与总体平均数的差异。包含两总体平均数的差异(处理效应)(m-m 0 x-m =m+e-m =(m-m 0 0 0 )+e 57. 统计假设检验:对研究总体提出假设,然后在此假设下构造合适的检验统计量,并由该统计量的抽样分布计 算出样本统计量的概率,再根据概率值的大小作出接受或否定假设的判断。 :通过检验,可能被接受,也可能被否定。 58. 无效假设 H 0 59. 备择假设 H A :与无效假设相对应的假设。 60. 进行假设检验的
12、基本依据:把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不 可能性原理。 的小概率标准。(常用显著水平有 0.05 和 0.01) 62. 统计假设检验步骤:1.建立假设2.确定显著水平 3.检验计算4.统计推断 63. 型错误(第一类错误):指当 H 0 61. 显著水平 a:决定接受或否定 H 0 本身正确,但通过假设检验后却否定了它,也就是将非真实差异错判为真 实差异。犯第一类错误的概率是a。(减少型错误,可将显著水平定得小一点。) 64. 型错误(第二类错误):当 H 0 本身错误时,通过假设检验后却接受了它,也即把真实差异错判为非真实差 异。(减少型错误,通常是
13、通过减少均数标准误来减小第二类错误的概率。而均数标准误的减小是通过精密的试验设计、严格的 试验操作和增大样本容量来实现的。由于一般来说大就小,增大了犯第一类错误的概率时,犯第二类错误的可能性就小。反之, 小,大。因此在实践中可以根据试验目的,通过调整的大小来控制检验时犯错误的概率。) 和 两种情况,因而这种检验有两个否定域,分别位于样本平均 0 65. 两尾检验:备择假设中,包含了 0 数分布曲线的两尾。 66. 一尾检验:否定域位于x 分布曲线某一尾的统计假设检验。 67. 选用两尾检验还是一尾检验应根据专业的要求在试验设计时确定。若事先不知道与 0 谁大谁小,为了检验 两者是否有差异就用两
14、尾检验。如果能凭借专业只是推测不会小于(或大于) 0 时,为了检验是否大于(或 小于) 0 应用一尾检验。 68. u 检验:在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。 69. u 检验使用范围:若样本资料总体方差已知,或样本含量30 时用 u 检验。 70. 假设统计误差中试验误差:随机误差 71. 统计假设检验中应注意的问题:1.试验要科学设计和正确实施 2.选用正确的统计假设检验方法 3.正确理解 差异显著性的统计意义 4.合理建设统计假设,正确计算检验统计量 单个样本平均数的假设检验 1)单个样本平均数的 u 检验: 某罐头厂生产肉类罐头,其自动装罐机在正常工作时每
15、罐净重服从正态分布N(500,64)(单位,g)。某 日随机抽查 10 瓶罐头,测其净重见表。分析装罐机当日工作是否正常? 编号 净重(g) 1 505 2 512 3 497 4 493 5 508 6 515 7 502 8 495 9 490 10 510 2)单个样本平均数的 t 检验: t 检验:在假设检验中利用 t 分布来进行统计量的概率计算的检验方法。 两个样本平均数的假设检验:由两个样本平均数之差,去判断这两个样本所在的总体平均数有无显著差异。 一、成组资料平均数的假设检验: 1)U 检验 和s 已知。 2、总体方差未知,但两个样本都是大样本时,平均数差数的分布呈正态分布。 2
16、2 1、如果两个样本资料都服从正态分布,且总体方差s 2 1 2)t 检验 1.如果两个样本资料都服从正态分布,且s =s 22 时,不论是大样本还是小样本,都有下式服从具有 自由度 df=n 1 +n 2 -2 的 t 分布:t = (x 1 - x ) 2 S 1 - (m x -x 12 1 2 - m ) 2 。 二、成对资料平均数的假设检验: 72. 二项百分率的假设检验 1)单个二项百分率的假设检验 2)单个二项百分率的假设检验 第五章 73. 方差分析(变量分析):关于观测值变异原因的数量分析。(三个或三个以上水平的分析,小于 3 个用 t 检验。) 74. 试验设计的作用: 1
17、.可以分析清楚试验因素对试验指标影响的大小顺序,找出主要因素,抓住主要矛盾2. 可以了解试验因素对试验指标影响的规律性 3.可以了解试验因素之间相互影响的情况 4.可较快地找出优化的 生产条件或工艺条件,确定优化方案5.可以正确估计、预测和有效控制、降低试验误差,提高试验精度 6.可 以明确为寻找更优生产或工艺条件、深入揭示事物内在规律而进一步研究的方向。 75. 试验指标:根据研究目的而选定的用来衡量或考核试验效果的质量特性。如:考察加热对果胶酶活性的影响,果 胶酶活性是试验指标。(单指标试验,多指标试验) 76. 试验因素:凡对试验指标可能产生影响的原因或要素。如:酱油质量受原料、曲种、发
18、酵时间等的影响,这些都 是影响酱油质量的因素。 77. 因素水平:试验因素所处的某种特定状态或数量等级。 如:比较 3 个大豆品种蛋白质含量高低,这 3 个品种就是 大豆品种这个试验因素的三个水平 78. 试验处理:事先设计好的实施在实验单位上的一种具体措施或项目。如:单因素试验中,试验因素的一 个水平就是一个处理多因素:水平组合 79. 平方和与自由度分解:设一个试验共有 k 个处理 n 个重复,则该试验资料共有nk 个观测值,其数据分组如 下: /S 80. F 值:两个方差之比。F= S22 t e 81. F 自由度:两个。df = df =k-1df = df 1 t 2 e =k(
19、n-1) 82. F 检验:用 F 值出现概率的大小推断两个方差是否相等的方法。 83. 方差分析表: 平方和(SS) SS t SS e 自由度(df) df t 变异来源 =k-1 处理间 均分(MS) =SS /df t t MS t F 值 SS t /SS e =SS -SS df =df -df T t e T t 处理内 SS df =nk-1 T T 总变异 MS e =SS e /df e 84. 线性模型:被分析的变量总体中每一个变数可以按其变异的原因分解成若干个线性组成部分。 x ij = m + a + e i i ij 85. 单因素线性模型的数学模型可归纳为:1.效
20、应的可加性2.分布的正态性3.方差的同质性 86. 多重比较:统计学中把多个平均数两两间的比较。(F 值显著或极显著否定了无效假设 H0,表明试验的总变异主要来 源于处理间的变异。)(常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法)。) 87. 最小显著差数法(LSD 法)的检验程序:在处理间的 F 检验显著的前提下,计算出显著水平为a的最小显著差 j ),若其绝对值LSDa,则为在a 水平上差异显著;反之,则 为在a 水平上差异不显著。这种方法又称为保护性最小显著差数法。LSD 法实质上是 t 检验。 - x 数 LSD a;任何两个处理平均数间的差数(x i 88. 最小
21、显著极差法(LSR 法)特点:把相互比较的两平均数的差数看成是平均数的极差,根据极差范围捏所包含 的处理数 K(称为秩次距)的不同而采用不同的检验尺度,以克服LSD 法的不足。 89. 最小显著极差法: q 检验和新复极差法。 90. q 检验法:检验统计量为 q 值。q=R/S X 91. 新复极差法(邓肯氏法,SSR): 92. 各处理重复数相等的方差分析: 93. 两向分组资料的方差分析 1.两向分组单独观测值试验资料的方差分析 94. 简单效应:在某因素同一水平上,另一因素不同水平对试验指标的影响。 95. 主效应:由于因素水平的改变而引起的平均数的改变量。 96. 互作效应:在多因素
22、试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同 水平上所产生的效应不同。 2.两因素等重复试验: 97. 两向分组有重复资料方差分析时数据总变异原因可以分解为:A 因素,B 因素,A*B和误差 98. 方差分析的基本假定:1.效应的可加性2.分布的正态性3.方差的同质性 99. 参数统计:限定分布的估计或检验。 非参数统计:对总体分布的具体形式不必作任何限制性假定和不以总体参数具体数值估计或检验为目的 100. 的推断统计。 101. 102. 103. 104. 105. 106. 第八章 107. 非参数统计检验:非参数统计主要用于对某种判断或假设进行检验。
23、x2 检验 适应性检验:判断实际观察次数属性分配是否依循已知属性分配理论或学说的一种假设检验方法。 独立性检验:用 x2 检验来探求两因子间是否彼此独立还是关联的检验。 相关系数的回归系数的符号:无法判断 线性回归分析中的假设检验:检验变量 x 和 y 是否有线性相关关系。 试验指标:根据研究目的而选定的用来衡量或考核试验效果的质量特性。(如:考察加热对果 胶酶活性的影 响,果胶酶活性是试验指标) 108. 试验因素:凡对试验指标可能产生影响的原因或要素。(如:酱油质量受原料、曲种、发酵时 间等的影响,这 些都是影响酱油质量的因素。) 109. 因素水平:试验因素所处的某种特定状态或数量等级。
24、(如:比较 3 个大豆品种蛋白质含量高 低,这 3 个品种 就是大豆品种这个试验因素的三个水平) 110. 试验处理:事先设计好的实施在实验单位上的一种具体措施或项目。(如:单因素试验中, 试验因素的一个 水平就是一个处理) 111. 112. 113. 114. 115. 116. 第十一章 117. 118. 119. (t ): L 表示正交表,n 表示试验点数,即正交表行数,t 表示因素的水平数,q 为最多能安 排的因素数,即正交表列数。 120. 121. 试验单位:在试验中能接受不同实验处理的独立的试验载体。 重复:在一个试验中,将一个处理实施在两个或两个以上的试验单位上。 处理:
25、是指事先设计好的实施在试验单位上的一种具体措施。 全面试验:试验中,对所选取的试验因素的所有水平组合全部给予实施的试验。 部分实施(部分试验):从全部试验处理中选取部分有代表性的处理进行试验。 试验设计的三原则:重复,随机化,局部控制 正交设计:利用正交表来安排与分析多因素试验的一种设计方法。 正交设计的基本特点:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交表 L q n 正交表的性质: 1.任何一列中各水平都出现,且出现次数相等。 2.任意两列间各种不同水平的所有可能组合都出现,且出现次数相等。 正交设计的基本步骤: 1)明确实验目的,确定实验目标 2)挑因素,选水平(水平 24 个,不超过 6 个) 3)选择合适的正交表(在能够安排下试验因素和交互作用的前提下,因素的个数不大于正交表记号中括号内的指数, 要考虑的因素及交互作用的自由度总和小于所选正交表的总自由度) 4)进行表头的设计1.只考察主效应,不考虑互作效应的表头设计。 2.只考虑互作效应的表头设计。 5)确定试验方案,实施试验 6)试验结果分析 表头设计:将试验因素安排到所选正交表的各列中去的过程。 交互作用:指因素间的联合搭配而产生的对试验指标的影响作用。 相关系数:是表示两个变量间线性相关的程度和性质的统计量。 122. 123. 124.