《2023年CDA题库.pdf》由会员分享,可在线阅读,更多相关《2023年CDA题库.pdf(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 现有两个投资项目甲和乙,已知甲、乙方案的吩望值分别为10%,25%,标准离差分别为20%、49%,那 么(A)A、甲项目的风险限度大于乙项目的风险限度B、甲项目的风险限度小于乙项目的风险限度C、甲项目的风险限度等于乙项目的风险限度D、不能拟定2 多个方案比较时,标准离差越小的方案,其 风 险(B)A、越大 B、越小 C、两者无关 D、无法判断3 在 Excel2023中,柱形图类型属于图表中的(B)A、复合类型 B、标准类型 C、简朴类型 D、自定义类型4n个标准正态分布的平方和为(A)A、卡方分布 B、t 分布 C、F 分布 D、正态分布5(B)是依据样本估计总体分布中所含的未知参数或未
2、知参数的函数。通常它们是总体的某个特性值,如数学盼望、方差和相关系数等。A、区间估计 B、点估计 C、参数估计 D、无偏估计6(C)用于计算间隔不等的连续时点序列的评价发展水平。A、算术平均数 B、几何平均数 C、加权平均数 D、调和平均数7 当置信水平一定期,置信区间的宽度(A)A、随着样本量的增大而减小 B、随着样本量的增大而增大C、与样本量的大小无关 D、与样本量的平方根成正比8下列不能描述变量离盼望值大小的指标是(D)A、变异系数 B、标准差 C、方差 D、相关系数9 E X C E L 中,求标准差的函数是(D)A、A V E R A G E B、M E D I A N C、M O
3、D E D、S T D E V1 0 结构化数据根据连续性可分为(B)A、品质数据和数值型数据 B、连续型数据和离散型数据C、截面数据、时间序列数据和面板数据 1)、一手数据和二手数据1 1 结构化数据根据时间特点可分为(C)A、品质数据和数值型数据 B、连续型数据和离散型数据C、截面数据、时间序列数据和面板数据 D、一手数据和二手数据1 2 某公司拟进行一项存在一定风险的完整工业项目投资,有甲、乙两个方案可供选择。已知甲方案净现值的盼望值为1 0 0 0 万元,标准差为3 0 0 万元;乙方案净现值的盼望值为1 2 0 0万元,标准差为3 3 0 万元。下列结论中对的的是(B)oA、甲方案优
4、于乙方案 B、C、甲方案的风险小于乙方案1 3 参数估计分为(A)A、点估计和区间估计 B、C、点估计和无偏估计 D、甲方案的风险大于乙方案D、无法评价甲、乙方案的风险大小区间估计和无偏估计区间估计和一致估计1 4 求 C 5 和 H 5 两单元格平均值的函数形式是(B)A、A V E R A G E (C 5:H 5)B、A V E R A G E (C 5,H 5)c、S U M (C 5:H 5)/2 D、S U M (C 5,H 5)1 5 下列四项中,不对的的提法是(C)A、S Q L 语言是关系数据库的国际标准语言B、S Q L 语言具有数据定义、查询、操纵和控制功能C、S Q L
5、 语言可以自动实现关系数据库的规范化D、S Q L 语言称为结构查询语言1 6 无量纲化后各变量的标准差为(B)A、0 B、1 C、-1 D、原标准差1 7 在 E x c e l 2 0 2 3 中,数据源发生变化时,相应的图表(B)A、手 动 跟 随 变 化 B、自动跟随变化C、不跟随变化D、不受任何影响18 事件A的 概 率 P(A)必 须 满 足(C)A、O P(A)“描述记录”-(探索)。(可 填 答 案“频率”、“描述”、“探索”、“交叉表”)完毕第一步操作后,我们只找异常值,则需要在记录量中选择(界外值)。(可 填 答 案“描述性”、“卜匚估计量”、“界外值”、“百分位数”)在输
6、出结果中列出的五个最大值中排在第一的数值是(1 7 4 4 98)在输出结果中列出的五个最小值中排在第一的数值是(4 7 6 5)9 用 S P S S 软件做替换缺失值解决,完毕下列题目。1 .用连续均值填补缺失值后,1 0 月销售额为(8 3.0 2)2 .用附近点的平均值填补缺失值后,1 0 月销售额为(1 1 6.4 8)3 .用线性插值填补缺失值后,1 0 月销售额为(1 1 5.1)4 .用点的线性趋势填补缺失值后,1 0 月销售额为(1 1 5.7 7)1 0 用 S P S S 软件解决下列反复数据,完毕下列题目。需要给反复个案做标记,产生一个新标记变量的S P S S 操作是
7、选定“数据”选项下的(标记反复个案)选项。(可填答案“标记异常个案”、“标记反复个案”、“个案选择”标记反复个案新生成的变量用(0)标记反复个案。(可填答案为0 或 1)标记反复个案新生成的变量用(1)标记基本个案。(可填答案为0 或 1)删除反复数据时,需要选定数据-选择个案-选定假如条件满足框输入反复标记=1,输出框选择(删除未选定个案)。(可写答案:“过滤掉未选个案”、“将选定个案复制到新数据集”、“删除未选定个案”)1 1 某班2 0 名学生考试成绩如下表所示,采用E X CE L 数据分析描述记录功能,对成绩进行分析汇总给出相关记录指标。求这2 0 名学生的考试成绩均分(保存一位小数
8、)(8 3.7)求这2 0 名学生的考试成绩的中位数(8 3)求这2 0 名学生的考试成绩的众数(8 3)求这2 0 名学生的考试成绩标准差(保存两位小数)(7.6 6)1 2 某百货公司从1 995 年到2 0 2 3 年的季度收入情况如下:单位:(百万美元)用 S P S S 进行季节哑变量多元回归预测(1)协变量应放置(数值)类型的变量.(答 案 填“数值”,“字符”,“日期”,“二进制”)(2)S P S S 选用的参照项是第(4)季 度.(答案填写阿拉伯数字”1,2,3”)(3)虚拟变量1 的参数估计值为(-4 5 6 1.1 4 1)(保存三位小数)(4)此案例建立的哑变量回归方程
9、中有(3)个虚拟变量.(答案填写阿拉伯数字“1,2,3 )1 3 我国钢材消费量(万吨)与国民收入(亿元)的资料如下。运用S P S S 进行一元回归分析。(1)令钢材消费量为(因变量)。(答案填写“自变量”或“因变量”)(2)建立回归方程,用最小二乘法进行参数估计,求出a,b (a为斜率,b为截距)。算出b的 值 为(-4 6 0.5 2 8 2)。(结果保存3 位小数)(3)观测S P S S 结果中的模型汇总表,回归直线对样本数据点是否拟合良好(是)(填“是”或“否”)(4)若 19 8 1年 至 19 8 5 年,国民收入以4.5%的速度递增,则国民收入见下表。运用S P S S 预
10、测 19 8 1年的钢材消费量为(30 0 6.6 9)万吨。(四舍五入保存两位小数)14 以下数据是百度20 23年-20 23年各季度的营业收入,试采用E X C E L数据分析描述记录功能,对成绩进行分析汇总给出相关记录指标。求营业收入的均值(保存两位小数)(6 9.18)求营业收入的中位数(保存两位小数)(6 2.5 0)求营业收入的标准差(保存整数)(32)求营业收入的最大值(135.2)1 5 下表是某单位年终奖金分派表,采 用 E X C E L数据分析描述记录功能,求解该单位年终奖金分派中的最高金额、最低金额、平均金额、中间金额、众数金额等。求该单位年终奖金分派中的最高金额(5
11、 0 0 0 0)求该单位年终奖金分派中的最低金额(6 0 0 0)求该单位年终奖金分派中的平均金额(227 5 0)求该单位年终奖金分派中的众数金额(15 0 0 0)四、判断题1 中位数具有不唯一性(X)2 聚类分析中,各变量的取值不应有数量级上的过大差异(J)3 原假设是指研究者想收集证据予以反对的假设,通常指参数没有变化或变量之间没有关系。(J)4分销网络的区位选择属于间接的短期刺激(X)5 标准差越大,正态分布曲线越平坦,概率分布密度越低。6 顾客规定提供的产品或服务比较优秀,但并不是“必须”的产品属性或服务行为是兴奋型需求。(X)7 在多元线性回归模型中,解释变量可以有相关性(X)
12、8描述数据成分关系时,若成分过多可使用复合饼图或复合条饼图。(J)9标准差越大,正态曲线越高越陡峭。(X)10 KAN 0 模型定义了四个层次的顾客需求。(X)11客户获取通常发生在客户生命周期中的考察期(J)12b i g i n t 是 S Q L的数据类型。(V)13拟合优度R方越大,回归直线的拟合限度越好(J)14 正态分布曲线的两个尾端无限接近横轴且理论上不会与之相交。(J)1 5 异常值是指一批数据中的个别值,其数值明显偏离该批数据的其余值,也称离群值。(J)一、单选题1 无量纲化后各变量的标准差为(B)A、0 B、1 C、-1 D、原标准差2在 Ex c e l 中,数据类型涉及
13、(D)A、数值型数据 B、字符型数据 C、逻辑型数据 D、以上所有3下列调查中,适合用全面调查方式的是(A)A、了解某班学生“5 0 米跑”的成绩 B、了解一批灯泡的使用寿命 C、了解一批炮弹的杀伤半径 D、了解一批袋装食品是否具有防腐剂4下列调查方式中适合的是(C)A、要了解一批节能灯的使用寿命,采用普查方式B、调查你所在班级同学的身高,采用抽样调查方式c、环保部门调查某段水域的水质情况,采用抽样调查方式D、调查全市中学生天天的就寝时间,采用普查方式5 估计量的含义是指(A)A、用来估计总体参数的记录量的名称 B、用来估计总体参数的记录量的具体数值 C、总体参数的名称 D、总体参数的具体取值
14、6在 Ex c e l 2 0 2 3 的单元格中,输入函数=5 以(1 0,2 5,1 3),得到的值为(B)A、2 5 B、4 8 C、1 0 D、2 87 n 个标准正态分布的平方和为(A)A、卡方分布 B、t 分布 C、F分布 D、正态分布8下列四项中,不属于数据库特点的是(C)A、数据共享 B、数据完整性 C、数据冗余很高 D、数据独立性高9 在 Ex c e l 2 0 2 3 的工作表中,假定C3:C6 区域内保存的数值依次为1 0、1 5、2 0 和 4 5,则函=AV ERAG E(C3:C6)的 值 为(B)A、2 2 B、2 2.5 C、4 5 D、901 0 已知甲、乙
15、两班学生记录学考试成绩:甲班平均分为7 0 分,标准差为7.5分;乙班平均分为7 5 分,标准差为7.5 分。由此可知两个班考试成绩的离散限度(A)。A、甲班较大 B、乙班较大 C、两班相同 D、无法作比较l l Ex c e l 2 0 2 3 工作簿文献的默认扩展名为(A)A、x l s B、do c C、m b d D、PPt1 2 (B)用于计算平均发展速度A、算术平均数 B、几何平均数 C、加权平均数 D、调和平均数13在 S Q L中,用来显示数据库信息的系统存储过程是(D)A、s p-db help B、s p-db C、s p-help D s p-help db14(A)用于
16、计算时期序列的平均发展水平或间隔相等的连续时点序列的平均发展水平。A、算术平均数 B、几何平均数 C、加权平均数 D、调和平均数15在 E x c el2023中,柱形图类型属于图表中的(B)A、复合类型 B、标准类型 C、简朴类型 D、自定义类型16E X C E L中,求中位数的函数是(B)A、A V E R A G E B、ME D IA N C、MO D E D、S T D E V17当向E x c el2023工作簿文献中插入一张电子工作表时。,默认的表标签中的英文单词为(A)A、S heet B、B o o k C、T a b le D、Lis t18 下列不能描述变量离盼望值大小
17、的指标是(D )A、变异系数 B、标准差 C、方差 D、相关系数19 标准离差率是标准离差与(D)相比求出的相对数。A、投资报酬 B、风险报酬 C、原始投资 D、盼望值20下列说法对的的为(C )A、概率就是频率 B、概率为1 的事件可以不发生 C、概率为0 的事件一定不会发生 D、概率不可以是一个无理数21服从参数为x的泊松分布数学方差为(A)A、x B 1/x22求 C 5和 H 5两单元格平均值的函数形式是(B)A、A V E R A G E (C 5:H 5)B、A V E R A G E (C 5,H 5)C、S U M(C 5:H 5)/2 1)、S U M(C 5,H 5)23S
18、 Q L中基本查询语句是(A)A、S E LE C T B、S E LE C T F R O M C、W H E R E D、C R E A T24变异系数越大,表达风险限度越(A)A、大 B、小 C、不变 D、等于零25任一随机事件出现的概率为(D)A、在T 到 1之间 B、小于0 C、不小于1 D、在 0 与 1之间26在 E x c el 2023中,图表被建立在(A)A、二维坐标系中 B、一维坐标系中 C、三维坐标系中 D、更高维坐标系中2 7 目前,(A)数据库系统已经逐渐淘汰了网状数据库和层次数据库,成为当今最为流行的商用数据库系统。A、关系 B、面向对象 C、分布 D、层次28
19、一个9 5%的置信区间是指(C)A、总体参数有95%的概率落在这一区间内B、总体参数有5%的概率未落在这一区间内C、在用同样方法构造的总体参数的多个区间中,有 95%的区间包含该总体参数。I)、在用同样方法构造的总体参数的多个区间中,有 95%的区间不包含该总体参数。29结构化数据根据采集方式可分为(D)A、品质数据和数值型数据 B、连续型数据和离散型数据 C、截面数据、时间序列数据和面板数据 D、一手数据和二手数据30计算平均数的基本规定是所要的平均数的总体单位应是(B)A、大量的 B、同质的 C、差异的 D、少量的二、多选题1访问法涉及(ABCD)A、小组访谈法 B、街头访问 C、公司调研
20、 D、网上调查2 在 SQL中,对象的数据类型涉及的属性有(ABCD)A、数据种类 B、数据的长度或大小 C、数值的精度 D、数值中的小数位数3 假如参与分类的变量较多时(比如大于1000),可以选用的方法是(BC)A、层次聚类法 B、K-均值聚类法 C、两步聚类法 D、混合聚类法4 热力图的作用有(ABD)A、考察访问者是否按照产品预设的逻辑进行操作B、是否有一些没有被发现的习惯或行为C、考察访问者访问流程D、对于访问者在导航页的点击哪些是对的的,哪些是有问题的5 数据产生的重要来源有(ABCD)A、局域网 B、离线储存数据 C、互联网 D、物联网6 一组数据的(AC)一定是原始数据中的真实
21、值。A、众数 B、平均数 C、中位数(数据个数为奇数)D、中位 数(数据个数为偶数)7 根据数据量级别,数据可分为(AB)。A、传统数据 B、大数据 C、结构化数据 D、非结构化数据8 下列关于记录量的表述中,对的的有(ABCD)A、估计统一总体参数可以用多个不同记录量 B、记录量是样本的函数C、记录量不具有未知参数 D、记录量的分布成为抽样分布9 非全面调查涉及(ABC)A、重点调查 B、典型调查 C、抽样调查 D、人口普查10假如参与分类的变量是连续变量,则合用的聚类方法有(ABC)A、层次聚类法 B、K-均值聚类法 C、两步聚类法 D、混合聚类法11根据结构化水平,数据可分为(ACD)A
22、、结构化数据 B、大数据 C、半结构化数据 I)、非结构化数据12下列可描述相关关系的图表类型有(AC)A、散点图 B、饼图 C、气泡图 I)、瀑布图1 3 数据排序的优点有(A B C D)A、发现差异 B、便于浏览 C、把握离散限度 D、发现异常值1 4 概率密度曲线(A C)A、位于X轴的上方 B、位于X轴的下方 C、与 X轴之间的面积为1 I)、与 X 轴之间的面积不定1 5 流量渠道可分为(A B C D)A、直接访问 B、引介访问 C、搜索访问 D、广告系列四、判断题1 网站数据可通过W E B 日记和J S 标记获取。(V)2主键可以唯一标记表中某一记录的属性。(V )3 客户获
23、取是指吸引有价值的潜在客户,将他们变成现实客户的过程。(J)4变异系数又称标准离差率,是一个相对指标,表达标准差偏离盼望值的限度。(J)5 客户为公司提供的价值,即从客户的角度来感知公司提供产品和服务的价值(X )6均值决定正态曲线的具体位置(4)7卡方分布的曲线随着自由度的增大逐渐趋于对称。(V)8客户获取通常发生在客户生命周期中的考察期(J)9变异系数用来描述数据的集中趋势。(X)1 0 计量单位相同时,假如两组数据的均值相差悬殊,离散系数也许比标准差等绝对指标更故意义。(V )1 1 在 E x c e l 2 0 2 3 中,工作簿是以文献形式存在的,工作表存在于工作簿中。(J)1 2
24、 数据与信息是不可分离的,数据是信息的表达,信息是数据的内涵。(J)1 3 因子得分是各变量的线性组合(V)1 4 生活日用品的价格弹性大(X)1 5 一种预测方法的好坏取决于预测误差的大小。(V)一、单选题1 在天气预报中,有“降水概率预报”,例如预报“明天降水概率为7 8%”,这是指(D)A、明天该地区有7 8%的地区降水,其他2 2%的地区不降水B、明天该地区约有7 8%的时间降水,其他时间不降水C、气象台的专家中,有 7 8%的人认为会降水,此外2 2%的专家认为不降水D、明天该地区的降水的也许性为7 8%2下列四项中,不属于数据库特点的是(C)A、数据共享 B、数据完整性 C、数 据
25、 冗 余 很 高 1)、数据独立性高3 在 E x c e l 2 0 2 3 的工作表中,假定C 3:C 6 区域内保存的数值依次为1 0、1 5、2 0 和 4 5,则函=AV E R AGE(C 3:C 6)的 值 为(B)A、2 2 B、2 2.5 C、4 5 D、9 04结构化数据根据连续性可分为(B)A、品质数据和数值型数据B、连续型数据和离散型数据C、截面数据、时间序列数据和面板数据D、一手数据和二手数据5时间序列线性趋势可以采用的估计方法有(D)A、w i n t er s 指数平滑 B、移动平均法 C 季节分解法 D、h o l t指数平滑法6 结构化数据根据采集方式可分为(
26、D)A、品质数据和数值型数据 B、连续型数据和离散型数据 C、截面数据、时间序列数据和面板数据 D、一手数据和二手数据7 一组数据2,4,3,5,7,3,8的中位数为(C)A、3 B、5 C、4 D、68加权算术平均数的大小(D)A、受各组次数f的影响最大B、受各组标志值x的影响最大C、只受各组标志值x的影响D、受各组次数f 和各组标志值x的共同影响9可供分析的数据通常具有不同量纲,使得各个变量之间不具有综合性,而数据分析方法大多对变量有特殊的规定,比如符合正态分布或者变量之间具有可比性。(C)A、变量计算 B、加权解决 C、标准化 D、分类汇总1 0 在 S Q L中,创建数据库用的命令是(
27、D)A、C R E A T E S C H E MAB、C R E A T E T A B LEC、C R E A T E V IE WI)、C R E A T E D A T A B A S E1 1 (O 是将各个数值乘以相应的权数,然后加总求和得到总体值再除以总的单位数。A、算术平均数B、几何平均数 C、加权平均数 D、调和平均数1 2 在 E x c el 工作表中,单元格A 1 至 A 1 0 中分别存放的数据为1,1,2,3,5,8,1 3,2 1,3 6,5 7,单元格A 1 2 中存放这十个数值的最大值,下列对的的函数是(A)A、MA X(A 1:A 1 O)B、C OU NT
28、(A l:A 1 0)C、A V E R A G E(A l:A l 0)D、S U M(A 1:A 1 O)1 3 参数估计分为(A)A、点估计和区间估计 B、区间估计和无偏估计 C、点估计和无偏估计 D、区间估计和一致估计1 4 在 S Q L中,用来显示数据库信息的系统存储过程是(D)A、s p-d b h el p B、s p-d b C、s p-h el p D、s p-h el p d b1 5 下列属于结构化数据的是(A)A、数字 B、文本 C、图像 D、网页1 6当向E x c el 2 0 2 3 工作簿文献中插入一张电子工作表时,默认的表标签中的英文单词为(A)A、S h
29、eetB o o k C T ab l e D Li s t1 7 掷一枚骰子,出现的以下点数中,也许性最大的是(C)A、点数为3的倍数 B、点数为奇数 C、点数不小于3 D、点数不大于31 8 最常用的调查方法是(C)A、重点调查 B、典型调查 C、抽样调查 D、全面调查1 9 一个9 5%的置信区间是指(C)A、总体参数有9 5%的概率落在这一区间内B、总体参数有5%的概率未落在这一区间内C、在用同样方法构造的总体参数的多个区间中,有 9 5%的区间包含该总体参数。D、在用同样方法构造的总体参数的多个区间中,有 9 5%的区间不包含该总体参数。2 0 关于时间序列,说法对的的是(C)A、一
30、组截面数据 B、一组面板数据 C、准时间记录的一组数据D、按地点记录的一组数据2 1 在 E x c e l 中,数据类型涉及(D)A、数值型数据 B、字符型数据 C、逻辑型数据 D、以上所有2 2 在 E x c e l 2 0 2 3 中,图表被建立在(A)A、二维坐标系中 B、一维坐标系中 C、三维坐标系中 D、更高维坐标系中2 3 (A)所有数据相加后除以其个数A、算术平均数 B、几何平均数 C、加权平均数 1)、调和平均数2 4随机变量X 服 从(D)分布时,D X=E X。A、正态 B、指数 C、二项 D、泊松2 5在 S Q L 中,建立视图用的命令是(C)A、C R E A T
31、 E S C HE M A B、C R E A T E T A B L E C、C R E A T E V IE W D、C R E A T E D A T A B A S E2 6某公司拟进行一项存在一定风险的完整工业项目投资,有甲、乙两个方案可供选择。已知甲方案净现值的盼望值为1 0 0 0 万元,标准差为3 0 0 万元;乙方案净现值的盼望值为1 2 0 0万元,标准差为3 3 0 万元。下列结论中对的的是(B)。A、甲方案优于乙方案 B、甲方案的风险大于乙方案 C、甲方案的风险小于乙方案 D、无法评价甲、乙方案的风险大小2 7 无量纲化后各变量的平均值为(A)A、0 B、1 C、-1
32、D、原均值2 8 无量纲化后各变量的标准差为(B)A、0 B、1 C、-1 D、原标准差2 9 (C)用于计算间隔不等的连续时点序列的评价发展水平。A、算术平均数 B、几何平均数 C、加权平均数 D、调和平均数3 0 甲、乙两个投资项目的盼望报酬率不同,但甲项目的标准离差系数大于乙项目,则(C)A、甲项目的风险小于乙项目 B、甲项目的风险不大于乙项目 C、甲项目的风险大于乙项目I)、难以判断风险大小二、多选题1 一个成功的问卷设计应当具有的功能有(AB)。A、能将所要调查的问题明确地传达给被调查者B、设法取得对方合作,最终取得真实、准确的答案C、获取尽也许多的被调查者信息D、适合任何背景的人群
33、2 数据产生的重要来源有(ABCD)A、局域网 B、离线储存数据 C、互联网 D、物联网3 关于移动平均法说法对的的是(ABD)A、将每个观测值都给予了相同的权数 B、只要适合对平稳时间序列进行预测C、对于同一个时间序列,采用不同的移动步长,预测的准确性相同D、只使用最近期的数据,每次计算移动平均值时,移动的间隔均为K4 假如参与分类的变量是连续变量,则合用的聚类方法有(ABC)A、层次聚类法 B、K-均值聚类法 C、两步聚类法 D、混合聚类法5 离散趋势的判断指标涉及(BCD)A、自由度 B、极差 C、标准差 D、方差6 假如参与分类的变量较少时(比如小于100),可以选用的方法是(ABC)
34、A、层次聚类法 B、K-均值聚类法 C、两步聚类法 D、混合聚类法7 根据结构化水平,数据可分为(ACD)A、结构化数据 B、大数据 C、半结构化数据 D、非结构化数据8 访问法涉及(ABCD)A、小组访谈法 B、街头访问 C、公司调研 D、网上调查9 可采集到的网站访问数据涉及(ABCD)A、访问者属性 B、间 D、访问者浏览途径访问者访问网站的频率 C、每次访问停留的时10以下属于服务器日记的是(ABCD)oA、网页浏览日记 B、apache日记 C、JS0N日记 D、自定义格式输出日记11互联网生成的数据涉及(ABC)A、电子商务 B、移动互联网APP C、数据网络游戏 D、传感器12下
35、列可描述相关关系的图表类型有(AC)A、散点图 B、饼图 C、气泡图 I)、瀑布图13KAN0模型定义的顾客需求层次有:(ACD)A、兴奋型需求 B、爱慕型需求 C、基本型需求 D、盼望型需求1 4 估计量的评价标准有(A B C)A、无偏性 B、有效性 C、一致性 D、随机性1 5 数据库是一个(A B C D)数据集合A、长期存储在计算机内的 B、有组织的 C、可共享的 1)、统一管理的三、填空题1 用 S P S S 软件解决下列反复数据,完毕下列题目。需要给反复个案做标记,产生一个新标记变量的S P S S 操作是选定“数据”选项下的(标记反复个案)选项。(可填答案“标记异常个案”、“
36、标记反复个案”、“个案选择”标记反复个案新生成的变量用(0)标记反复个案。(可填答案为0 或 1)标记反复个案新生成的变量用(1)标记基本个案。(可填答案为0 或 1)删除反复数据时,需要选定数据-选择个案-选定假如条件满足框输入反复标记=1,输出框选择(删除未选定个案)。(可写答案:“过滤掉未选个案”、“将选定个案复制到新数据集”、“删除未选定个案”)2以下数据是百度2 0 2 3 年-2 0 2 3 年各季度的营业收入,试采用E X C E L 数据分析描述记录功能,对成绩进行分析汇总给出相关记录指标。求营业收入的均值(保存两位小数)(6 9.18)求营业收入的中位数(保存两位小数)(6
37、2.5 0)求营业收入的标准差(保存整数)(3 2)求营业收入的最大值(13 5.2)3下表是某单位年终奖金分派表,采用E X C E L 数据分析描述记录功能,求解该单位年终奖金分派中的最高金额、最低金额、平均金额、中间金额、众数金额等。求该单位年终奖金分派中的最高金额(5 0 0 0 0)求该单位年终奖金分派中的最低金额(6 0 0 0)求该单位年终奖金分派中的平均金额(2 2 7 5 0)求该单位年终奖金分派中的众数金额(15 0 0 0)4以下数据是2 0 个不同产品的两个参数,用 S P S S 软件按规定进行排序。排序依据为L 1,规定升序排列时,排在第六位的产品编号为(12)。排
38、序依据为L 2,规定降序排列时,排在第十位的产品编号为(9)o排序依据为L 1和 L 2,规定先按L 1升序排列,后按L 2 降序排列,排在第9位的产品编号 为(2)o排序依据为L 1和L2,规定先按L 1降序排列,后按L 2 升序排列,排在第6 位的产品编号 为(15),5某百货公司从19 9 5 年 到 2 0 2 3 年的季度收入情况如下:单位:百万美元用S P S S 进行时间序列季节分解预测注意:本案例预测时使用的时间序列的乘积模型如下:Y =T X S X I (即:长 期 趋 势 X 季 节 指 数 X 不规则因素)(1)计算出19 9 5 年第一季度的季节指数(0.9 12 6
39、)(保存四位小数)(2)计算出19 9 5 年第一季度的非季节变化收入(10 16 8.7 4 5 8)(保存四位小数)(3)第(4)个季节的季节指数最大.(答案填写阿拉伯数字“1,2,3”)(4)用趋势项对时间t 做线性回归,建立的回归方程中的常数项系数为(8 9 7 7.4 6 3)。(保存3位小数)四、判断题1聚类分析的对象只能是所观测的多个样本(X)2假如拒绝的是真的原假设,就也许犯第I类错误,一般犯这类错误的概率记为(3变异系数又称标准离差率,是一个相对指标,表达标准差偏离盼望值的限度。(J)4在多元回归检查中,F检查和T检查的作用是同样的,都是用来检查回归系数的显著性。(X)5极差
40、用来描述数据的离散趋势。(J)6提高价格透明度属于直接的短期刺激(X)7因子得分是各变量的线性组合(V)8采用JS标记获取网站数据时,当用户禁用JS功能时仍可获取数据。(X)9访问次数与唯一身份访问者的比率越高表达这段时间内访问者的回访次数越多。(V)10奢侈品、高消费品的价格弹性小(X)11市场定位是拟定目的市场的地理位置。(X)12一组数据的个数为奇数时,中位数为中间位置上的数。(J)13外部数据比内部数据可靠性更强。(X)1 4市场细分是指营销者通过市场调研,依据消费者的需要和欲望、购买行为和购买习惯等方面的差异,把某一产品的市场整体划分为若干消费者群的市场分类过程。(J)15对于简朴指
41、数平滑预测中的平滑系数a,当注重于近期的实际值时,宜选较大的a(V)一、单选1 .北京市记录局发布2 0 2 3 年度全市职工平均工资为7 7 5 6 0 元,月平均工资为6 4 6 3 元.众多网友直呼“被平均”,你认为下面哪种记录量测度平均工资会更被信服(D)A几何平均数B众数C极差D中位数2 .某公司2 0 2 3 年实现利润为2 0 0 万元,2 0 2 3 年为3 0 0 万元,则年平均增长速度为(D)A.5%B.1 1%C.1 0%D.8.4%3 .当一组数据属于左偏分布时,则(D)A.平均数、中位数与众数是合而为一的 B.众数在左边、平均数在右边C.众数的数值较小、平均数的数值较
42、大 D.众数在右边、平均数在左边4 .作为一家制造类公司,以下哪个图适合比较不同产品各年的销售变化情况(D)A .分组饼形图B.堆叠面积图C.堆叠柱形图D.分组柱形图5.横截面数据重要注意以下哪个数据问题(A)A .异方差B.不独立C.非正态分布D.不随机6.以下叙述对的的是(B)A.极差较少受异常值的影响B.四分位差较少受异常值的影响C.方差较少受异常值的影响D.标准差较少受异常值的影响7.某汽车品牌预测到未来不同型号汽车的利润率和销售量会发生变化,希望根据利润最大化得到最优产量,这属于哪类数据分析过程(C)A.预测型建模B.预报C.优化D.报警8.为研究某种减肥茶减肥效果是否显著,可以采用
43、(C)分析方法。A、单样本t 检查 B、两独立样本t 检 查 C,两配对样本t 检 查 D、方差分析9.中心极限定理的假设不涉及(D)A.样本互相独立B.样本具有相同分布C.样本足够大D.样本服从正态分布10.下列场合下,(C)适合用t 检查记录量A.样本为小样本,且总体方差已知B.样本为大样本,且总体方差已知C.样本为小样本,且总体方差未知D.样本为大样本,且总体方差未知1 1 .方差分析表表如下,值 20 应填在哪个位置上(B)方差来源离差平方和自由度均方差F 值组间1 4 24 5.8 334 7 4 8.6 1 2.1 6 组内A B C 总和D 231 2.某信用卡公司为了分析客户教
44、育限度对授信额度是否有显著性差异,已知教育限度分为5 种,每个教育限度取30 个客户,则因素的水平为(D)A 5 B 6 C 30 D 1 5 01 3.给出下列结论:(B)(1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.A.
45、1 B.2 C.3 1).41 4 .下列关系中,属于正相关关系的有(A)A.合理限度内,施肥量和平均单位产量之间的关系B.产品产量与单位产品成本之间的关系C.商品的流通费用与销售利润之间的关系D.流通费用率与商品销售量之间的关系1 5 .下 列 关 于S Q L的 说 法 错 误 的 是(C)A S Q L对大小写不敏感B S Q L为非过程化编程语言C不 同 的 数 据 库 的S Q L完全一致D一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统1 6 .要 查 询b o o k表 中 所 有 书 名 中 以“中国”开头的书籍的价格,可 用(D)语 句。(A)SE
46、L EC T p r i c e FRO M b o o k WH ERE b o o k _ n a m e中国*(B)SEL EC T p r i c e FRO M b o o k WH ERE b o o k _ n a m e L I K E,中国*,(C)SEL EC T p r i c e FRO M b o o k WH ERE b o o k _ n a m e=中国(D)SEL EC T p r i c e FRO M b o o k WH ERE b o o k _ n a m e L I K E中国1 7.为 名 为“z h a n g s a n”的 用 户 分 派
47、对 数 据 库“s t u d b”的“s t u i n fo”表查询和插入数据权 限 的 语 句 是(B)A.g r a n t s el ec t,i n s er t o n s t u d b.s t u i n fo fo r z h a n g s a n l o c a l h o s tB.g r a n t s el ec t,i n s er t o n s t u d b.s t u i n fo t o z h a n g s a n l o c a l h o s t?C.g r a n t z h a n g s a n l o c a l h o s tJ t
48、o s el ec t,i n s er t fo r s t u d b.s t u i n foD.g r a n t z h a n g s a n l o c a l h o s t?t o s t u d b.s t u i n fo o n s el ec t,i n s er t1 8.对于表TA (t el,n et,),其中t el 为手机号,n et 为订购的上网流量套餐,如 5 0M、1 00M等,若未订购则为空。为了分析客户上网对客户总费用的影响情况,下列哪种对空值的解决方式最合理的?(D)A将空缺观测所有删除B用所有客户上网套餐的中位数来替代C用所有客户上网套餐的众数
49、来替代D 单独作为一类或者填充为01 9.以下哪种方法不属于预测性(有监督学习)模型(C)A.决策树B.线性回归C.关联分析D.判别分析20.主成分分析计算分为根据相关系数和协方差矩阵两种方式,以下哪种情况适合用协方差矩阵计算(C)A.所有变量的量纲相同B.所有变量的方差相同C.所有变量的值域相同D.任何变量都可以21 .下面关于因子分析的说法对的的是(D)A因子分析就是主成分分析B因子之间互相关也可不相关C因子受量纲的影响D 可以对因子进行旋转,使其意义更明显22.以下哪种聚类方法需要实现指定聚类个数(B)A.层次聚类B.K 均值聚类C.基于密度的聚类D.基于网格的聚类23.对快速聚类说法错
50、误的是(B)A 占内存少、计算量小、解决速度快B可以样本聚类,也可以对变量聚类C适合大样本D 需要事先拟定多少个类别24.关于逻辑斯回归分析(l o g i s t i c r eg r s s i o n m o d l e)说法对的的是(B)A:逻辑斯回归的因变量为数值变量B:逻辑斯回归的因变量为定性变量C:逻辑斯回归的因变量只能有两种取值D:逻辑斯回归自变量只能是一个2 5.通过广告费分析销售收入,丙公司的销售经理根据3 6 个月销售收入和广告费用的关系开发了简朴线性回归模型。该模型如下所示,且给模型的鉴定系数为0.9 0。Y=2 0 0 0 元+2.5 0 X 其中,Y 代表销售收入,