《CPDA考试真题含答案12457.pdf》由会员分享,可在线阅读,更多相关《CPDA考试真题含答案12457.pdf(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品文档.一、判断题 1.样本容量是指从总体中抽取的个体。正确答案:2.品质数据既可以用整数值表示,也可以用连续值表示。正确答案:3.需求弹性大的产品价格与销售收入反向变化。正确答案:4.一般而言,定量预测方法在满足下列三个条件时才能使用:一是能够知道待测变量的过去值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。正确答案:5.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。正确答案:6.在一定时期和一定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变成本才与产品产销量的增减变化发生关系。正确答案:7.如果两个变量不独立,那这两者的
2、相关系数必然不等于 0。正确答案:8.数据库类型是按照数据存取的方法来划分的。正确答案:9.SQL 语言中,条件年龄 BETWEEN 15 AND 35,表示年龄在 15 至 35 之间,且包括 15 岁但不包括 35 岁。正确答案:10.资本成本就是资金的时间价值。正确答案:精品文档.11.一组数据排序后处于 25%和 75%位置上的值称为四分位数。正确答案:12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。正确答案:13.内部收益率考虑了资金时间价值,受折现率高低的影响。正确答案:14.边际收入是指每增加 1 单位销量所带来的总收入的增加额度。正确答案:15.分类预测时,准
3、确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影响,即 F1-Score。正确答案:二、单选题 1.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为()A、1 B、-1 C、+1 或-1 D、0 正确答案:C 2.表示职称为副教授、性别为男的表达式为()A、职称=副教授 OR 性别=男 B、职称=副教授 AND 性别=男 C、BETWEEN 副教授 AND 男 D、IN(副教授,男)正确答案:B 3.对于下列实验数据:1,108,11,8,5,6,8,8,7,11,描述其集中趋势用()最为适宜,其值是()。A、平均数,14.4 B、中位数,8.5 精品文档.C、众数,8
4、 D、以上都可以 正确答案:C 4.()是进行项目投资效益评价的最终依据。A、现金流量 B、盈亏平衡点 C、净现金流量 D、现金流入量 正确答案:C 5.有一组数据其均值是 20,对其中的每一个数据都加上 10,那么得到的这组新数据的均值是()。A、20 B、10 C、15 D、30 正确答案:D 6.分类变量使用以下哪个统计量进行缺失值填补较合适 A、均值 B、最大值 C、众数 D、中位数 正确答案:C 7.假设BCE为一频繁项目集(Frequent Itemset),则根据 Apriori Principle 以下何者不是子频繁项目?A、BC B、CE C、C D、CD 正确答案:D 8.
5、请问以下何者属于时间序列的问题?精品文档.A、信用卡发卡银行侦测潜在的卡奴 B、基金经理人针对个股做出未来价格预测 C、电信公司将人户区分为数个群体 D、以上均不是 正确答案:B 9.数据正规化(Data Normalization)是在知识发掘处理(Knowledge Discovery Process)中的哪一个阶段进行?A、数据清洗 B、数据选择 C、数据编码 D、数据扩充 正确答案:C 10.已知事件 A 的概率 P(A)0.6,U 为必然事件,则 P(A+U)1,P()_ A、0.4 B、0.6 C、0 D、1 正确答案:B 11.当时间序列数据点的一阶差分近似为一常数,可配合以下哪
6、种预测模型()A、直线 B、二次抛物线 C、三次抛物线 D、指数曲线 正确答案:A 12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响()A、方差分析 B、回归分析 C、聚类分析 D、主成分分析 正确答案:C 精品文档.13.若数据量较大,下面哪种方式比较适合()A、系统聚类 B、快速聚类(k-means)C、A 和 B 都可以 D、A 和 B 都不可以 正确答案:B 14.在建立线性回归(Linear Regression)之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?A、皮尔森相关系数 B、卡方检定 C、T-检定 D、Z-Score 正确答案:A 15.ROC 曲线凸
7、向哪个角,代表模型越理想?A、左上角 B、右上角 C、左下角 D、右下角 正确答案:A 16.决策树中的 Information Gain 的计算是用来?A、剪枝 B、使树成长 C、处理缺失值和异常值 D、砍树 正确答案:B 17.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?A、分类 B、聚类 C、关联分析 精品文档.D、隐马尔可夫链 正确答案:B 18.开始将个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次减少一类,直至所有的样品合并 为一类,此种聚
8、类方法是()A、means B、SOM 聚类 C、系统聚类 D、有序聚类 正确答案:C 19.关于回归分析,下列说法中错误的是()A、作回归分析的变量之间要有实际意义,不能把毫无关联的两种现象随意进行回归分析,要结合专业知识对 两事物之间是否存在因果关系作出合理解释和结论。B、在进行线性回归分析进行的数据准备的时候,要求因变量 y 和自变量 x 都是符合总体正态的随机变量。C、回归直线不要随意外延 D、所有非线性回归都可以转化为线性回归 正确答案:D 20.下列说明错误的是()A、性别=“男”=职业=“司机”,是布尔型关联规则 B、性别=“女”=avg(收入)=2300,是一个数值型关联规则
9、C、肝炎=ALT(丙氨酸转氨酶)升高,是一个单层关联规则 D、性别=“女”=职业=“秘书”,是多维关联规则 正确答案:C 21.在 ID3 算法中信息增益是指()A、信息的溢出程度 B、信息的增加效益 C、熵增加的程度最大 D、熵减少的程度最大 精品文档.正确答案:D 22.如下哪个不是最近邻分类器的特点()A、它使用具体的训练实例进行预测,不必维护源自数据的模型 B、分类一个测试样例开销很大 C、最近邻分类器基于全局信息进行预测 D、可以生产任意形状的决策边界 正确答案:C 23.关于混合模型聚类算法的优缺点,下面说法正确的是()A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能
10、很好地处理。B、混合模型比 K 均值或模糊 C 均值更一般,因为它可以使用各种类型的分布。C、混合模型很难发现不同大小和椭球形状的簇。D、混合模型在有噪声和离群点时不会存在问题。正确答案:B 24.关于 K 均值和 DBSCAN 的比较,以下说法不正确的是()A、K 均值丢弃被它识别为噪声的对象,而 DBSCAN 一般聚类所有对象。B、K 均值使用簇的基于原型的概念,而 DBSCAN 使用基于密度的概念。C、K 均值很难处理非球形的簇和不同大小的簇,DBSCAN 可以处理不同大小和不同形状的簇。D、K 均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是 DBSCAN 会合并有重叠的簇。
11、正确答案:A 25.检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测 A、统计方法 B、邻近度 C、密度 D、聚类技术 正确答案:A 26.倒传递神经网络(BP 神经网络)的训练顺序为何?(A:调整权重;B:计算误差值;C:利用随机的权重产生输出的结果)A、BCA 精品文档.B、CAB C、BAC D、CBA 正确答案:D 27.假设检验中,拒绝域的边界称为()A、临界值 B、临界点 C、置信水平 D、边际值 正确答案:A 28.在有关数据仓库测试,下列说法不正确的是()A、在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试 B、当数据仓
12、库的每个单独组件完成后,就需要对他们进行单元测试 C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试 D、在测试之前没必要制定详细的测试计划 正确答案:D 29.某项目预计运行 5 年后的净现值为 4500 万元,如折现率为 16,其终值应为()万元 (说明:结果保留两位小数)A、8045.86 B、6996.21 C、9451.54 D、7000.02 正确答案:C 30.迈克尔波特的“五力模型”中,五种竞争力量中不包括()A、新进入者 B、供应商议价能力 C、其他利益相关者力量 D、行业中现有竞争者 正确答案:C 精品文档.三、多选题 1.敏感性分析的计算指标有()A、
13、盈亏平衡点 B、敏感度系数 C、临界点 D、净现值 正确答案:BCD 2.在 Excel 中,要选定 A 到 E 列单元格,操作正确的是()A、用鼠标左键单击列号 A,然后向右拖动鼠标至列号 E,再释放鼠标左键 B、左键单击列号 A,再按下 shift 键不放并用鼠标左键单击列号 E,最后释放 shift 键 C、单击列号 A,然后先按下 Ctrl 键不放,再用鼠标单击 B,C,D,E 列号,最后释放 Ctrl 键 D、按 shift 键不放,用鼠标左键单击 A,B,C,D,E 的每个列号 正确答案:ABC 3.季节变动主要是由()引起的。A、自然灾害 B、政治事件 C、制度、法律、习俗 D、
14、自然界的季节变化 正确答案:CD 4.货币时间价值用相对值来表示时,在数量上应当理解为扣除()后的社会平均利润率。A、时间因素 B、通货膨胀因素 C、纯粹利率 D、风险因素 正确答案:BD 5.概率分析中,应计算出()表明该风险因素的风险程度。A、变异系数 B、期望值 C、方差 精品文档.D、标准差 正确答案:ABCD 6.定基发展速度与环比发展速度的关系有()。A、各环比发展速度之和等于相应的定基发展速度 B、各环比发展速度之积等于相应的定基发展速度 C、两个环比发展速度之商等于相应的定基发展速度 D、两个定基发展速度之商等于相应的环比发展速度 正确答案:BD 7.促销预算的方法主要有()。
15、A、量入为出法 B、竞争对等法 C、销售比例法 D、目标任务法 正确答案:ABCD 8.行业分析数据采集方法有()。A、一手资料 B、实地考察法 C、专家访谈法 D、收集媒体信息 正确答案:ABCD 9.决策树法分析问题的主要步骤包括()。A、结构化问题 B、设计可能结果发生的概率 C、设计结果的得益 D、分析问题 正确答案:ABCD 10.能消除时间序列中的不规则变动和季节变动的方法是()A、移动平均法 B、指数平滑法 精品文档.C、时间序列乘法模型 D、季节指数 正确答案:AD 11.确定一个投资方案可行的必要条件是()。A、净现值大于零 B、现值指数大于 1 C、投资回收期小于 1 年
16、D、内部报酬率较高 正确答案:AB 12.随机对比实验的调查方法的优点是()A、能够测算实验误差 B、可以提高实验结果的可靠性 C、可以节省分析过程和时间 D、费用开支小 正确答案:AB 13.下列说法中不正确的是()A、任何两个变量都具有相关关系 B、人的知识与其年龄具有相关关系 C、散点图中的各点是分散的没有规律 D、根据散点图求得的回归直线方程都是有意义的 正确答案:ACD 14.相关分析的任务有()A、判定现象之间有无关系 B、判定现象之间关系的方向 C、判定相关关系的紧密程度 D、说明现象之间联系的具体形式 正确答案:ABCD 15.在比较不同预测方法的精确度时,通常采用()等误差指
17、标来衡量预测误差的大小。A、绝对误差 精品文档.B、相对误差 C、平均误差 D、随机误差 正确答案:ABC 16.如果自变量有连续型变量,则适用的分类预测方法有()A、逻辑回归 B、神经网络 C、SVM 算法 D、C4.5 算法 正确答案:ABC 17.KANO 模型定义的顾客需求层次有()A、兴奋型需求 B、喜爱型需求 C、基本型需求 D、期望型需求 正确答案:ACD 18.下面有关 HAVING 子句的说法中正确的是()A、HAVING 子句必须与 GROUP BY 子句同时使用,不能单独使用 B、使用 HAVING 子句的同时不能使用 WHERE 子句 C、使用 HAVING 子句的同时
18、可以使用 WHERE 子句 D、使用 HAVING 子句的作用是限定分组的条件 正确答案:ACD 19.在有关数据仓库测试,下列说法中正确的是()A、在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试 B、当数据仓库的每个单独组件完成后,就需要对他们进行单元测试 C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试 D、在测试之前可以不制定详细的测试计划,测试过程中实时调整。正确答案:ABC 20.对于计算期不等的项目(方案)比选,可采纳的决策方法有()精品文档.A、最小公倍数法 B、内部收益率法 C、等年值法 D、获利指数法 正确答案:AC