《MATLAB数据输入与分析.ppt》由会员分享,可在线阅读,更多相关《MATLAB数据输入与分析.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023年1月28日MATLAB和R软件1MATLAB数据输入与数据输入与分析分析2023年1月28日MATLAB和R软件2引言引言统计研究的对象是受随机因素影响的数据统计研究的对象是受随机因素影响的数据数据样本少则几个,多则成千上万,人们希望能用数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样少数几个包含其最多相关信息的数值来体现数据样本总体的规律。本总体的规律。面对一批数据如何进行描述与分析,需要掌握一些面对一批数据如何进行描述与分析,需要掌握一些数理统计的最基本方法。数理统计的最基本方法。我们将用我们将用MATLAB 及其统计工具箱及其统计工具箱(
2、Statistics Toolbox)来实现数据的统计描述和分析。来实现数据的统计描述和分析。2023年1月28日MATLAB和R软件3数据输入数据输入两种方法两种方法一种是在交互环境中直接输入一种是在交互环境中直接输入如果在统计中数据量比较大,这样作不太方便;如果在统计中数据量比较大,这样作不太方便;另一种办法是先把数据写入一个数据文件中,另一种办法是先把数据写入一个数据文件中,在在MATLAB中用相关命令读入数据中用相关命令读入数据具体作法:具体作法:.mat文件文件.dat或或.txt文件文件.xls文件文件2023年1月28日MATLAB和R软件4数据预处理数据预处理查找错误查找错误查
3、找异常值查找异常值数据分析数据分析描述性统计描述性统计参数估计参数估计假设检验假设检验方差分析方差分析回归分析回归分析.2023年1月28日MATLAB和R软件5数据分析操作实例数据分析操作实例数据集数据集2*2因子行为实验数据因子行为实验数据在一给定试验中按键的反应时间和特性在一给定试验中按键的反应时间和特性输入数据输入数据查找错误与异常值查找错误与异常值计算描述性统计量计算描述性统计量进一步数据分析进一步数据分析 2023年1月28日MATLAB和R软件62023年1月28日MATLAB和R软件7计算统计量的函数计算统计量的函数样本均值样本均值:mean调用格式调用格式:(1)Y=mean
4、(X)(2)Y=mean(X,dim)指定维指定维例:X=0 1 2;3 4 5;Y=mean(X)Y=1.5000 2.5000 3.5000 Y=mean(X,2)Y=1 42023年1月28日MATLAB和R软件8计算统计量的函数计算统计量的函数样本方差样本方差:var调用格式调用格式:(1)Y=var(X)(2)Y=var(X,1)用用n-1标准化标准化用用n标准化标准化 X=4-2 1;9 5 7;Y=var(X)Y=12.5000 24.5000 18.0000 Y=var(X,1)Y=6.2500 12.2500 9.00002023年1月28日MATLAB和R软件9计算统计量的
5、函数计算统计量的函数样本标准差样本标准差:std调用格式调用格式:(1)Y=std(X)(2)Y=std(X,1)X=4-2 1;9 5 7;Y=std(X)Y=3.5355 4.9497 4.2426 Y=std(X,1)Y=2.5000 3.5000 3.00002023年1月28日MATLAB和R软件10计算统计量的函数计算统计量的函数协方差矩阵协方差矩阵:cov调用格式调用格式:(1)C=cov(X)(2)C=cov(X,Y)(3)C=cov(X,1)(4)C=cov(X,Y,1)X=-1 1 2;-2 3 1;4 0 3;Y=cov(X)Y=10.3333 -4.1667 3.000
6、0 -4.1667 2.3333 -1.5000 3.0000 -1.5000 1.00002023年1月28日MATLAB和R软件11计算统计量的函数计算统计量的函数相关系数相关系数:corrcoef调用格式调用格式:R=corrcoef(X)中心矩中心矩:moment调用格式调用格式:M=moment(X,order)X=-1 1 2;-2 3 1;4 0 3;Y=corrcoef(X)Y=1.0000 -0.8486 0.9333 -0.8486 1.0000 -0.9820 0.9333 -0.9820 1.0000 Y=moment(X,3)Y=11.4074 0.7407 0202
7、3年1月28日MATLAB和R软件12参数估计与假设检验参数估计与假设检验最大似然估计和区间估计最大似然估计和区间估计:mle调用格式调用格式:(1)phat=mle(dist,data)(2)phat,pci=mle(dist,data,alpha)data=0.9501,0.2311,0.6068,0.4860,.0.8913,0.7621,0.4565,0.0185,0.8214,0.4447;phat=mle(normal,data)phat=0.5669 0.2835正态分布的均值和均方差正态分布的均值和均方差的最大似然估计的最大似然估计2023年1月28日MATLAB和R软件13参
8、数估计与假设检验参数估计与假设检验单总体的单总体的U检验检验:ztest调用格式调用格式:(1)H=ztest(X,m,sigma)(2)H=ztest(X,m,sigma,alpha)(3)H=ztest(X,m,sigma,alpha,tail)(4)H,p=ztest(.)(5)H,p,ci=ztest(.)例例 某车间用一台包装机包装糖果。包得某车间用一台包装机包装糖果。包得的袋装糖重是一个随机变量,它服从正的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,其均值为态分布。当机器正常时,其均值为0.5公公斤,标准差为斤,标准差为0.015公斤。某日开工后为公斤。某日开工后为检验包
9、装机是否正常,随机地抽取它所检验包装机是否正常,随机地抽取它所包装的糖包装的糖9袋,称得净重为(公斤):袋,称得净重为(公斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512,问机器是否正常?问机器是否正常?解:总体解:总体已知,已知,XN(,.0152),未知。于是提出假设未知。于是提出假设H0:=0.500和和H1:0.5。Matlab实现如下:实现如下:x=0.497 0.506 0.518 0.524 0.498.0.511 0.520 0.515 0.512;h,p,ci=ztest(x,0.5,0.015)求得求得h=1,
10、p=0.0248,说明在,说明在0.05的水平下,可拒绝原假设,即认为这天包装机的水平下,可拒绝原假设,即认为这天包装机工作不正常。工作不正常。2023年1月28日MATLAB和R软件14参数估计与假设检验参数估计与假设检验单总体的单总体的t检验检验:ttest调用格式调用格式:(1)H=ttest(X)(2)H=ttest(X,m)(3)H=ttest(.,alpha)(4)H=ttest(.,tail)(5)H,p=ttest(.)(6)H,p,ci=ttest(.)例例 某种电子元件的寿命某种电子元件的寿命x(以小时计以小时计)服从服从正态分布正态分布,2均未知均未知.现得现得16只元件
11、的寿只元件的寿命如下命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命大于问是否有理由认为元件的平均寿命大于225(小时小时)?解解 按题意需检验按题意需检验H0:225,取取=0.05。Matlab实现如下:实现如下:x=159 280 101 212 224 379 179 264.222 362 168 250 149 260 485 170;h,p,ci=ttest(x,225,0.05,1)求得求得h=0,p=0.2570,说明在显著水平为,说明在显著水平为0.05的情况下
12、,不能拒绝原假设,认为的情况下,不能拒绝原假设,认为元件的平均寿命不大于元件的平均寿命不大于225小时。小时。2023年1月28日MATLAB和R软件15参数估计与假设检验参数估计与假设检验双总体的双总体的t检验检验:ttest2调用格式调用格式:(1)H=ttest2(X,Y)(2)H=ttest2(X,Y,alpha)(3)H=ttest2(X,Y,alpha,tail)(4)H,p=ttest2(.)(5)H,p,ci=ttest2(.)例例 在平炉上进行一项试验以确定改变操作方法的建议在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率是否会增加钢的得率,试验是在同一平炉上进
13、行的。每试验是在同一平炉上进行的。每炼一炉钢时除操作方法外炼一炉钢时除操作方法外,其它条件都可能做到相同。其它条件都可能做到相同。先用标准方法炼一炉先用标准方法炼一炉,然后用建议的新方法炼一炉然后用建议的新方法炼一炉,以以后交换进行后交换进行,各炼了各炼了10炉炉,其得率分别为其得率分别为1标准方法标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.6 76.7 77.32新方法新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1设这两个样本相互独立且分别来自正态总体设这两个样本相互独立且分别来自正态总体N
14、(1,2)和和N(2,2),1,2,2均未知,问建议的新方法能否提均未知,问建议的新方法能否提高得率高得率?(取取=0.05)解解(i)需要检验假设)需要检验假设H0:1=2,H1:1 X=binocdf(0:20,20,0.5);H,p,k,c=kstest(X,0.05,0)H=1p=2.8173e-005k=0.5000c=0.2873X服从二项分布服从二项分布,不服不服从标准正态分布从标准正态分布,拒拒绝原假设绝原假设2023年1月28日MATLAB和R软件17非参数假设检验非参数假设检验例例 下面列出了下面列出了84 个伊特拉斯坎个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度
15、)人男子的头颅的最大宽度(mm),试检验这些数据是否来自正态总),试检验这些数据是否来自正态总体(取体(取=0.1)。141 148 132 138 154 142 150 146 155 158150 140 147 148 144 150 149 145 149 158143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137148 154 137 139 143 140 131 143 141 149148 135 148 152 143 144 141 143 147 146150 132
16、 142 142 143 153 149 146 149 138142 149 142 137 134 144 146 147 140 142140 137 152 145min(x),max(x)%求数据中的最小数和最大数求数据中的最小数和最大数hist(x,8)%画直方图画直方图fi=length(find(x=135&x=138&x=142&x=146&x=150&x=152)%各区间上出现的频率各区间上出现的频率mu=mean(x),sigma=std(x)%均值和标准差均值和标准差fendian=135,138,142,146,150,152%区间的分点区间的分点p0=normcdf
17、(fendian,mu,sigma)%分点处分布函数的值分点处分布函数的值p1=diff(p0)%中间各区间的概率中间各区间的概率p=p0(1),p1,1-p0(6)%所有区间的概率所有区间的概率chi=(fi-84*p).2./(84*p)chisum=sum(chi)%皮尔逊统计量的值皮尔逊统计量的值x_a=chi2inv(0.9,4)%chi2分布的分布的0.9分位数分位数解解 编写编写Matlab程序如下:程序如下:clcx=141 148 132 138 154 142 150 146 155 158.150 140 147 148 144 150 149 145 149 158.1
18、43 141 144 144 126 140 144 142 141 140.145 135 147 146 141 136 140 146 142 137.148 154 137 139 143 140 131 143 141 149.148 135 148 152 143 144 141 143 147 146.150 132 142 142 143 153 149 146 149 138.142 149 142 137 134 144 146 147 140 142.140 137 152 145;求得皮尔逊统计量求得皮尔逊统计量chisum=1.9723,0.1 2(7-2-1)=0.
19、1 2(4)=7.7794,故在水平,故在水平0.1下接受下接受 H0,即认为数据来自正,即认为数据来自正态分布总体。态分布总体。2023年1月28日MATLAB和R软件18非参数假设检验非参数假设检验双样本双样本K-S检验检验:kstest2调用格式调用格式:(1)H=kstest2(X1,X2)(2)H=kstest2(X1,X2,alpha)(3)H=kstest2(X1,X2,alpha,tail)(4)H,p,ksstat,cv=kstest2(.)X=-1:1:5;Y=randn(20,1);H,p,k=kstest2(X,Y)H=1p=0.0219k=0.6143Y是由是由ran
20、dn生成的生成的正态分布随机数正态分布随机数,拒拒绝绝X和和Y具有相同的具有相同的分布的假设分布的假设2023年1月28日MATLAB和R软件19非参数假设检验非参数假设检验符号检验符号检验:signtest调用格式调用格式:(1)p=signtest(X)(2)p=signtest(X,m)(3)p=signtest(X,Y)(4)p=signtest(.,alpha)(5)p,H=signtest(.)(6)p,H,stats=signtest(.)X=normrnd(0,1,20,1);Y=normrnd(0,2,20,1);p,H=signtest(X,Y,0.05)p=0.8238H
21、=0不能拒绝原假设不能拒绝原假设2023年1月28日MATLAB和R软件20非参数假设检验非参数假设检验秩和检验秩和检验:ranksum调用格式调用格式:(1)p=ranksum(X,Y)(2)p=ranksum(X,Y,alpha)(3)p,H=ranksum(.)(4)p,H,stats=ranksum(.)例例7 某商店为了确定向公司某商店为了确定向公司A或公司或公司B 购买某种购买某种产品,将产品,将A,B公司以往各次进货的次品率进行比公司以往各次进货的次品率进行比较,数据如下所示,设两样本独立。问两公司的较,数据如下所示,设两样本独立。问两公司的商品的质量有无显著差异。设两公司的商品
22、的次商品的质量有无显著差异。设两公司的商品的次品的密度最多只差一个平移,取品的密度最多只差一个平移,取=0.05。A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5B:5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3解解 分别以分别以A、B记公司记公司A、B 的商品次品率总体的均值。所需检验的假设是的商品次品率总体的均值。所需检验的假设是H0:A=B,H1:AB.Matlab实现如下:实现如下:a=7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5;b=5.7 3.2
23、 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3;p,h=ranksum(a,b)求得求得p=0.8041,h=0,表明两样本总体均值相等的概率为,表明两样本总体均值相等的概率为0.8041,并不很接近于零,并不很接近于零,且且h=0说明可以接受原假设,即认为两个公司的商品的质量无明显差异。说明可以接受原假设,即认为两个公司的商品的质量无明显差异。2023年1月28日MATLAB和R软件21方差分析方差分析单因素方差分析单因素方差分析:anova1调用格式调用格式:(1)p=anova1(X)(2)p=anova1(X,group)(3)p=ano
24、va1(X,group,displayopt)(4)p,table=anova1(.)(5)p,table,stats=anova1(.)X=2.1650 3.6961 1.5538 3.6400 4.95511.6268 2.0591 2.2988 3.8644 4.20111.0751 3.7971 4.2460 2.6507 4.23481.3516 2.2641 2.3610 2.7296 5.86170.3035 2.8717 3.5774 4.9846 4.9438;p=anova1(X)p=5.9952e-0052023年1月28日MATLAB和R软件22方差分析方差分析方差分析
25、方差分析2023年1月28日MATLAB和R软件23例例 用用4种工艺生产灯泡,从各种工艺制成的灯泡中各抽出了若干个测量其寿种工艺生产灯泡,从各种工艺制成的灯泡中各抽出了若干个测量其寿命,结果如下表,试推断这几种工艺制成的灯泡寿命是否有显著差异。命,结果如下表,试推断这几种工艺制成的灯泡寿命是否有显著差异。工艺工艺序号序号A1A2A3A41162015801460 150021670 16001540155031700164016201610417501720168051800解解 编写程序如下:编写程序如下:x=1620 1580 1460 15001670 1600 1540 155017
26、00 1640 1620 16101750 1720 1680 1800;x=x(1:4),x(16),x(5:8),x(9:11),x(12:15);g=ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4);p=anova1(x,g)求得求得 0.01p=0.0331 X=5.5 4.5 3.55.5 4.5 4.06.0 4.0 3.06.5 5.0 4.07.0 5.5 5.07.0 5.0 4.5;p=anova2(X,3)p=0.0000 0.0001 0.74622023年1月28日MATLAB和R软件25方差分析方差分析方差分析方差分析202
27、3年1月28日MATLAB和R软件26例例 一火箭使用了一火箭使用了4种燃料,种燃料,3种推进器作射程试验,每种燃料与每种推进器的种推进器作射程试验,每种燃料与每种推进器的组合各发射火箭组合各发射火箭2次,得到结果如下:次,得到结果如下:B1B2B3A158.2,52.6 56.2,41.265.3,60.8A249.1,42.854.1,50.551.6,48.4A360.1,58.370.9,73.239.2,40.7A475.8,71.5 58.2,51.048.7,41.4试在水平试在水平0.05下,检验不同燃料(因素下,检验不同燃料(因素A)、不同推进器(因素)、不同推进器(因素B)
28、下的射程是)下的射程是否有显著差异?交互作用是否显著?否有显著差异?交互作用是否显著?方差分析方差分析2023年1月28日MATLAB和R软件27解解 编写程序如下:编写程序如下:clc,clearx0=58.2,52.6 56.2,41.2 65.3,60.849.1,42.8 54.1,50.5 51.6,48.460.1,58.3 70.9,73.2 39.2,40.775.8,71.5 58.2,51.0 48.7,41.4;x1=x0(:,1:2:5);x2=x0(:,2:2:6);for i=1:4x(2*i-1,:)=x1(i,:);x(2*i,:)=x2(i,:);endp=a
29、nova2(x,2)求得求得p=0.0035 0.0260 0.001,表明各试验均值相等的概率都为小概率,故,表明各试验均值相等的概率都为小概率,故可拒绝均值相等假设。即认为不同燃料(因素可拒绝均值相等假设。即认为不同燃料(因素A)、不同推进器(因素)、不同推进器(因素B)下的射程有显著差异,交互作用也是显著的。下的射程有显著差异,交互作用也是显著的。2023年1月28日MATLAB和R软件28回归分析回归分析线性回归线性回归:regress调用格式调用格式:(1)B=regress(Y,X)(2)B,BINT=regress(Y,X)(3)B,BINT,R=regress(Y,X)(4)B
30、,BINT,R,RINT=regress(Y,X)(5)B,BINT,R,RINT,stats=regress(Y,X)(6).=regress(Y,X,alpha)2023年1月28日MATLAB和R软件29回归分析回归分析 X=1 11 21 31 41 51 61 71 81 91 10;Y=11.116512.062713.007514.035214.930316.169617.005918.179719.026420.0872;b,bint=regress(Y,X,0.05)b=10.0456 1.0030bint=9.9165 10.1747 0.9822 1.0238回归分析回归
31、分析2023年1月28日MATLAB和R软件30例例 合金的强度合金的强度y 与其中的碳含量与其中的碳含量x有比较密切的关系,今从生产中收集了一批有比较密切的关系,今从生产中收集了一批数据如下表:数据如下表:x 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18y 42.0 41.5 45.0 45.5 45.0 47.5 49.0 55.0 50.0试先拟合一个函数试先拟合一个函数y(x),再用回归分析对它进行检验。,再用回归分析对它进行检验。解解 先画出散点图:先画出散点图:x=0.1:0.01:0.18;y=42,41.5,45.0,45.5,45.
32、0,47.5,49.0,55.0,50.0;plot(x,y,+)可知可知y 与与x大致上为线性关系。大致上为线性关系。用用regress和和rcoplot编程如下:编程如下:clc,clearx1=0.1:0.01:0.18;y=42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0;x=ones(9,1),x1;b,bint,r,rint,stats=regress(y,x);b,bint,stats,rcoplot(r,rint)设回归模型为设回归模型为 y=0+1x 得到得到b=27.4722 137.5000bint=18.6851 36.2594 75
33、.7755 199.2245stats=0.7985 27.7469 0.0012即即0=27.4722,1=137.5000,0的置信区间是的置信区间是18.6851,36.2594,1的置信区间是的置信区间是75.7755,199.2245;R2=0.7985,F=27.7469,p=0.0012。可知模型成立可知模型成立观察命令观察命令rcoplot(r,rint)所画的残差分布,所画的残差分布,除第除第8个数据外其余残差的置信区间均个数据外其余残差的置信区间均包含零点,第包含零点,第8个点应视为异常点,将个点应视为异常点,将其剔除后重新计算,可得其剔除后重新计算,可得b=30.7820
34、 109.3985bint=26.2805 35.283476.9014 141.8955stats=0.9188 67.8534 0.0002应该用修改后的这个结果。应该用修改后的这个结果。2023年1月28日MATLAB和R软件31例例:若若x=2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,y=6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,10.59,10.6,10.8,10.6,10.9,10.76;用用 进行拟合进行拟合.回归分析回归分析非线性回归非线性回归:nlinfit调用格式调用格式:(1)beta=nlinfit(
35、X,Y,fun,beta0)(2)beta,R,J=nlinfit(X,Y,fun,beta0)先创建函数先创建函数:function y=f(beta,x)a=beta(1);b=beta(2);y=x./(a.*x+b);2023年1月28日MATLAB和R软件32回归分析回归分析在命令窗口输入在命令窗口输入:x=2:16;y=6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,.10.59,10.6,10.8,10.6,10.9,10.76;beta0=0.1,0.1;beta=nlinfit(x,y,f,beta0)beta=0.0845 0.1152拟合
36、函数是拟合函数是 回归分析回归分析2023年1月28日MATLAB和R软件33例例 在研究化学动力学反应过程中,建立了一个反应速度和反应物含量的在研究化学动力学反应过程中,建立了一个反应速度和反应物含量的数学模型,形式为数学模型,形式为其中其中1,5是未知的参数,是未知的参数,x1,x2,x3是三种反应物(氢,是三种反应物(氢,n戊烷,异构戊烷)戊烷,异构戊烷)的含量,的含量,y 是反应速度。今测得一组数据如下表,试由此确定参数是反应速度。今测得一组数据如下表,试由此确定参数1,5,并给出其置信区间。并给出其置信区间。1,5的参考值为(的参考值为(0.1,0.05,0.02,1,2)。)。序号
37、序号 反应速度反应速度y 氢氢 x1 n戊烷戊烷x2 异构戊烷异构戊烷 x31 8.55 470 300 102 3.79 285 80 103 4.82 470 300 1204 0.02 470 80 1205 2.75 470 80 106 14.39 100 190 107 2.54 100 80 65序号序号 反应速度反应速度y 氢氢 x1 n戊烷戊烷x2 异构戊烷异构戊烷 x38 4.35 470 190 659 13.00 100 300 5410 8.50 100 300 12011 0.05 100 80 12012 11.32 285 300 1013 3.13 285 1
38、90 120回归分析回归分析2023年1月28日MATLAB和R软件34解解 首先,以回归系数和自变量为输入变量,将要拟首先,以回归系数和自变量为输入变量,将要拟合的模型写成函数文件合的模型写成函数文件huaxue.m:function yhat=huaxue(beta,x);yhat=(beta(4)*x(2)-x(3)/beta(5)./(1+beta(1)*x(1)+.beta(2)*x(2)+beta(3)*x(3);然后,用然后,用nlinfit计算回归系数,用计算回归系数,用nlparci计算回归系计算回归系数的置信区间,用数的置信区间,用nlpredci计算预测值及其置信区间计算
39、预测值及其置信区间clc,clearx0=1 8.55 470 300 102 3.79 285 80 103 4.82 470 300 1204 0.02 470 80 1205 2.75 470 80 106 14.39 100 190 107 2.54 100 80 658 4.35 470 190 659 13.00 100 300 5410 8.50 100 300 12011 0.05 100 80 12012 11.32 285 300 1013 3.13 285 190 120;x=x0(:,3:5);y=x0(:,2);beta=0.1,0.05,0.02,1,2;%回归系数
40、的初值回归系数的初值betahat,f,j=nlinfit(x,y,huaxue,beta);%f,j是下面是下面命令用的信息命令用的信息betaci=nlparci(betahat,f,j);betaa=betahat,betaci%回归系数及其置信区间回归系数及其置信区间yhat,delta=nlpredci(huaxue,x,betahat,f,j)用用nlintool得到一个交互式画面,左下方的得到一个交互式画面,左下方的Export可向工作区传送数据,如剩余标准差等。可向工作区传送数据,如剩余标准差等。使用命令使用命令nlintool(x,y,huaxue,beta)可看到画面,可看
41、到画面,并传出剩余标准差并传出剩余标准差rmse=0.1933。回归分析回归分析2023年1月28日MATLAB和R软件35例例 某厂生产的一种电器的销售量某厂生产的一种电器的销售量y 与竞争对手的价格与竞争对手的价格 x 1和本厂的价格和本厂的价格x 2有有关。下表是该商品在关。下表是该商品在10个城市的销售记录。个城市的销售记录。x 1(元元)120 140 190 130 155 175 125 145 180 150 x 2(元元)100 110 90 150 210 150 250 270 300 250y(个个)102 100 120 77 46 93 26 69 65 85试根据
42、这些数据建立试根据这些数据建立y 与与 x 1和和 x2 的关系式,对得到的模型和系数进行检验。的关系式,对得到的模型和系数进行检验。若某市本厂产品售价若某市本厂产品售价160(元),竞争对手售价(元),竞争对手售价170(元),预测商品在该市(元),预测商品在该市的销售量。的销售量。解解 分别画出分别画出y 关于关于x 1和和y 关于关于x2 的散点图,可以看出的散点图,可以看出y 与与x2 有较明显的线有较明显的线性关系,而性关系,而y 与与x 1之间的关系则难以确定,我们将作几种尝试,用统计分之间的关系则难以确定,我们将作几种尝试,用统计分析决定优劣。析决定优劣。设回归模型为设回归模型为
43、 y=0+1x 1+2x2回归分析回归分析2023年1月28日MATLAB和R软件36编写如下程序:编写如下程序:x1=120 140 190 130 155 175 125 145 180 150;x2=100 110 90 150 210 150 250 270 300 250;y=102 100 120 77 46 93 26 69 65 85;x=ones(10,1),x1,x2;b,bint,r,rint,stats=regress(y,x);b,bint,stats得到得到b=66.5176 0.4139-0.2698bint=-32.5060 165.5411-0.2018 1.
44、0296-0.4611-0.0785stats=0.6527 6.5786 0.0247可以看出结果不是太好:可以看出结果不是太好:p=0.0247,取,取=0.05时回归模型时回归模型y=0+1x 1+2x2可用,但取可用,但取=0.01则模型不能用;则模型不能用;R2=0.6527较小;较小;置信区间包含了零点。置信区间包含了零点。2023年1月28日MATLAB和R软件37上机练习上机练习1.下面列出的是某工厂随机选取的下面列出的是某工厂随机选取的20只部件的装配时间(分):只部件的装配时间(分):9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,
45、10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7。设装配时间的总体服从正态分布,是否。设装配时间的总体服从正态分布,是否可以认为装配时间的均值显著地大于可以认为装配时间的均值显著地大于10(取(取=0.05)?)?2.下表分别给出两个文学家马克下表分别给出两个文学家马克吐温吐温(Mark Twain)的八篇小品的八篇小品文及斯诺特格拉斯(文及斯诺特格拉斯(Snodgrass)的)的10篇小品文中由篇小品文中由3个字母组个字母组成的词的比例。成的词的比例。马克马克吐温吐温 0.225 0.262 0.217 0.240 0.230 0.229 0.235
46、 0.217斯诺特格拉斯斯诺特格拉斯 0.209 0.205 0.196 0.210 0.202 0.207 0.224 0.223 0.220 0.201设两组数据分别来自正态总体,且两总体方差相等。两样本相设两组数据分别来自正态总体,且两总体方差相等。两样本相互独立,问两个作家所写的小品文中包含由互独立,问两个作家所写的小品文中包含由3个字母组成的词个字母组成的词的比例是否有显著的差异(取的比例是否有显著的差异(取=0.05)?)?上机练习上机练习2023年1月28日MATLAB和R软件383.将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,将抗生素注入人体会产生抗生素与血浆蛋白质结合
47、的现象,以致减少了药效。下表列出以致减少了药效。下表列出5种常用的抗生素注入到牛的体内种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。试检验这些百分比时,抗生素与血浆蛋白质结合的百分比。试检验这些百分比的均值有无显著的差异。设各总体服从正态分布,且方差相的均值有无显著的差异。设各总体服从正态分布,且方差相同。同。青霉素青霉素四环素四环素链霉素链霉素红霉素红霉素氯霉素氯霉素29.627.35.821.629.224.332.66.217.432.828.530.811.018.325.032.034.88.319.024.2上机练习上机练习2023年1月28日MATLAB和R软件
48、394.某人记录了某人记录了21天每天使用空调器的时间和使用烘干器的次数,并监视天每天使用空调器的时间和使用烘干器的次数,并监视电表以计算出每天的耗电量,数据见下表,试研究耗电量(电表以计算出每天的耗电量,数据见下表,试研究耗电量(KWH)与空)与空调器使用的小时数调器使用的小时数(AC)和烘干器使用次数和烘干器使用次数(DRYER)之间的关系,建立并之间的关系,建立并检验回归模型,诊断是否有异常点。检验回归模型,诊断是否有异常点。序号序号 1 2 3 4 5 6 7 8 9 10 11KWH 35 63 66 17 94 79 93 66 94 82 78AC 1.5 4.5 5.0 2.0 8.5 6.0 13.5 8.0 12.5 7.5 6.5DRYER 1 2 2 0 3 3 1 1 1 2 3序号序号 12 13 14 15 16 17 18 19 20 21kWH 65 77 75 62 85 43 57 33 65 33AC 8.0 7.5 8.0 7.5 12.0 6.0 2.5 5.0 7.5 6.0DRYER 1 2 2 1 1 0 3 0 1 0