深度学习基础知识题库大全.pdf

上传人:赵** 文档编号:89635167 上传时间:2023-05-07 格式:PDF 页数:15 大小:1.36MB
返回 下载 相关 举报
深度学习基础知识题库大全.pdf_第1页
第1页 / 共15页
深度学习基础知识题库大全.pdf_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《深度学习基础知识题库大全.pdf》由会员分享,可在线阅读,更多相关《深度学习基础知识题库大全.pdf(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、深度学习基础知识题库全1、梯度下降算法的正确步骤是什么?a.计算预测值和真实值之间的误差b.重复迭代,直得到络权重的最佳值c.把输传络,得到输出值d.随机值初始化权重和偏差e.对每个产误差的,调整相应的(权重)值以减误差A.abcde B.edcba C.cbaed D.dcaeb解析:正确答案D,考查知识点-。2、已知:-脑是有很多个叫做神经元的东西构成,神经络是对脑的简单的数学表达。-每个神经元都有输、处理函数和输出。-神经元组合起来形成了络,可以拟合任何函数。-为了得到最佳的神经络,我们法不断更新模型给定上述关于神经络的描述,什么情况下神经络模型被称为深度学习模型?A.加更多层,使神经络

2、的深度增加B.有维度更的数据C.当这是个图形识别的问题时D.以上都不正确解析:正确答案A,更多层意味着络更深。没有严格的定义多少层的模型才叫深度模型,前如果有超过2层的隐层,那么也可以及叫做深度模型。3、训练CNN时,可以对输进旋转、平移、缩放(增强数据)等预处理提模型泛化能。这么说是对,还是不对?A.对 B.不对解析:对。如寒sir所说,训练CNN时,可以进这些操作。当然也不定是必须的,只是data augmentation扩充数据后,模型有更多数据训练,泛化能可能会变强。4、下哪项操作能实现跟神经络中Dropout的类似效果?A.Boosting B.Bagging C.Stacking

3、D.Mapping解析:正确答案B。Dropout可以认为是种极端的Bagging,每个模型都在单独的数据上训练,同时,通过和其他模型对应参数的共享,从实现模型参数的度正则化。5、下列哪项在神经络中引了线性?A.随机梯度下降B.修正线性单元(ReLU)C.卷积函数D.以上都不正确解析:正确答案B。修正线性单元是线性的激活函数。深度学习基础知识题库大全-第1页深度学习基础知识题库大全-第1页6.深度学习是当前很热门的机器学习算法,在深度学习中,涉及到量的矩阵相乘,现在需要计算三个稠密矩阵 A,B,C 的乘积ABC,假设三个矩阵的尺分别为mn,np,pq,且m n p q,以下计算顺序效率最的是(

4、)A、(AB)CB、AC(B)C、A(BC)D、所以效率都相同正确答案是:A先,根据简单的矩阵知识,因为 A*B,A 的列数必须和 B 的数相等。因此,可以排除 B 选项,然后,再看 A、C 选项。在 A 选项中,m n 的矩阵 A 和np的矩阵 B 的乘积,得到 mp的矩阵 A*B,AB的每个元素需要 n 次乘法和 n-1 次加法,忽略加法,共需要 mnp次乘法运算。同样情况分析 A*B 之后再乘以 C 时的情况,共需要 m pq次乘法运算。因此,A 选项(AB)C 需要的乘法次数是 mnp+mpq。同理分析,C 选项 A(BC)需要的乘法次数是 n pq+mnq。7.输图为200200,依

5、次经过层卷积(kernel size 55,padding 1,stride 2),pooling(kernel size 33,padding0,stride 1),层卷积(kernel size 33,padding 1,stride 1)之后,输出特征图为A、95B、96C、97D、98正确答案是:C先我们应该知道卷积或者池化后的计算公式,其中,padding指的是向外扩展的边缘,stride则是步长,即每次移动的长度。这样来就容易多了,先长宽般,所以我们只需要计算个维度即可,这样,经过第次卷积后的为:本题(200-5+2*1)/2+1 为99.5,取99;经过第次池化后的为:(99-3

6、)/1+1 为97;经过第次卷积后的为:(97-3+2*1)/1+1 为978.神经络模型(Neural Network)因受类脑的启发得名神经络由许多神经元(Neuron)组成,每个神经元接受个输,对输进处理后给出个输出,如下图所。请问下列关于神经元的描述中,哪项是正确的?A、每个神经元可以有个输和个输出B、每个神经元可以有多个输和个输出C、每个神经元可以有个输和多个输出D、每个神经元可以有多个输和多个输出E、上述都正确正确答案是:E答案:(E)每个神经元可以有个或多个输,和个或多个输出。9.如果我们了个过的学习速率会发什么?A、神经络会收敛B、不好说C、都不对D、神经络不会收敛正确答案是:

7、D深度学习基础知识题库大全-第2页深度学习基础知识题库大全-第2页学习率过,会使得迭代时,越过最低点。10.在个神经络中,下哪种法可以来处理过拟合?A、DropoutB、分批归化(Batch Normalization)C、正则化(regularization)D、都可以正确答案是:D解析:都可以。对于选项C,分批归化处理过拟合的原理,是因为同个数据在不同批中被归化后的值会有差别,相当于做了dataaugmentatio。11.批规范化(Batch Normalization)的好处都有啥?A、让每层的输的范围都致固定B、它将权重的归化平均值和标准差C、它是种常有效的反向传播(BP)法D、这些

8、均不是正确答案是:A12.下列哪个神经络结构会发权重共享?A、卷积神经络B、循环神经络C、全连接神经络D、选项A和B正确答案是:D13.下列哪个函数不可以做激活函数?A、y=tanh(x)B、y=sin(x)C、y=max(x,0)D、y=2x正确答案是:D解析:线性函数不能作为激活函数。14.假设我们有个如下图所的隐藏层。隐藏层在这个络中起到了定的降纬作。假如现在我们另种维度下降的法,如说主成分分析法(PCA)来替代这个隐藏层。那么,这两者的输出效果是样的吗?A、是深度学习基础知识题库大全-第3页深度学习基础知识题库大全-第3页B、否正确答案是:B解析:PCA 提取的是数据分布差较的向,隐藏

9、层可以提取有预测能的特征15.下图显了训练过的3层卷积神经络准确度,与参数数量(特征核的数量)的关系。从图中趋势可见,如果增加神经络的宽度,精确度会增加到个特定阈值后,便开始降低。造成这现象的可能原因是什么?A、即使增加卷积核的数量,只有少部分的核会被作预测B、当卷积核数量增加时,神经络的预测能(Power)会降低C、当卷积核数量增加时,导致过拟合D、以上都不正确正确答案是:C解析:络规模过时,就可能学到数据中的噪声,导致过拟合16.假设你需要调整超参数来最化代价函数(cost function),会使下列哪项技术?A、穷举搜索B、随机搜索C、Bayesian优化D、都可以正确答案是:D 17

10、.在感知机中(Perceptron)的任务顺序是什么?1、随机初始化感知机的权重2、去到数据集的下批(batch)3、如果预测值和输出不致,则调整权重4、对个输样本,计算输出值A、1,2,3,4B、4,3,2,1C、3,1,2,4D、1,4,3,2正确答案是:D18.构建个神经络,将前层的输出和它作为输。深度学习基础知识题库大全-第4页深度学习基础知识题库大全-第4页下列哪种架构有反馈连接?A、循环神经络B、卷积神经络C、限制玻尔兹曼机D、都不是正确答案是:A19.如果增加多层感知机(Multilayer Perceptron)的隐藏层层数,分类误差便会减。这种陈述正确还是错误?A、正确B、错

11、误正确答案是:B解析:并不总是正确。层数增加可能导致过拟合,从可能引起错误增加。20.下列哪项关于模型能(model capacity)的描述是正确的?(指神经络模型能拟合复杂函数的能)A、隐藏层层数增加,模型能增加B、Dropout的例增加,模型能增加C、学习率增加,模型能增加D、都不正确正确答案是:A解析:A是对的,其它选项不确定21.在训练神经络时,损失函数(loss)在最初的个epochs时没有下降,可能的原因是?A、学习率(learning rate)太低B、正则参数太C、陷局部最值D、以上都有可能深度学习基础知识题库大全-第5页深度学习基础知识题库大全-第5页正确答案是:D22.深

12、度学习与机器学习算法之间的区别在于,后者过程中需进特征提取作,也就是说,我们建议在进深度学习过程之前要先完成特征提取的作。这种说法是:A、正确的B、错误的正确答案是:B解析:正好相反,深度学习可以完成特征提取过程机器学习需要来处理特征内容。23.下列哪项属于特征学习算法(representation learning algorithm)?A、K近邻算法B、随机森林C、神经络D、都不属于正确答案是:C解析:神经络会将数据转化为更适合解决标问题的形式,我们把这种过程叫做特征学习。24.提升卷积核(convolutional kernel)的会显著提升卷积神经络的性能,这种说法是A、正确的B、错误

13、的正确答案是:B解析:卷积核的是个超参数(hyperparameter),也就意味着改变它既有可能提亦有可能降低模型的表现。25.阅读以下字:假设我们拥有个已完成训练的、来解决车辆检测问题的深度神经络模型,训练所的数据集由汽车和卡车的照构成,训练标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使这个模型来解决另外个问题,问题数据集中仅包含种车(福特野马)标变为定位车辆在照中的位置。A、除去神经络中的最后层,冻结所有层然后重新训练B、对神经络中的最后层进微调,同时将最后层(分类层)更改为回归层C、使新的数据集重新训练模型D、所有答案均不对正确答案是:B26.假设你有5个为7x7、边界值为

14、0的卷积核,同时卷积神经络第层的深度为1。此时如果你向这层传个维度为224x224x3的数据,那么神经络下层所接收到的数据维度是多少?A、218x218x5B、217x217x8C、217x217x3深度学习基础知识题库大全-第6页深度学习基础知识题库大全-第6页D、220 x220 x5正确答案是:A27.假设我们有个使ReLU激活函数(ReLU activation function)的神经络,假如我们把ReLU激活替换为线性激活,那么这个神经络能够模拟出同或函数(XNOR function)吗?A、可以B、不好说C、不定D、不能正确答案是:D解析:使ReLU激活函数的神经络是能够模拟出同

15、或函数的。但如果ReLU激活函数被线性函数所替代之后,神经络将失去模拟线性函数的能。28.下列的哪种法可以来降低深度学习模型的过拟合问题?1 增加更多的数据2 使数据扩增技术(data augmentation)3 使归纳性更好的架构4 正规化数据5 降低架构的复杂度A、1 4 5B、1 2 3C、1 3 4 5D、所有项都有正确答案是:D解析:上所有的技术都会对降低过拟合有所帮助29.下图是个利sigmoid函数作为激活函数的含四个隐藏层的神经络训练的梯度下降图。这个神经络遇到了梯度消失的问题。下哪个叙述是正确的?A、第隐藏层对应D,第隐藏层对应C,第三隐藏层对应B,第四隐藏层对应AB、第隐

16、藏层对应A,第隐藏层对应C,第三隐藏层对应B,第四隐藏层对应D深度学习基础知识题库大全-第7页深度学习基础知识题库大全-第7页C、第隐藏层对应A,第隐藏层对应B,第三隐藏层对应C,第四隐藏层对应DD、第隐藏层对应B,第隐藏层对应D,第三隐藏层对应C,第四隐藏层对应A正确答案是:A解析:由于反向传播算法进起始层,学习能降低,这就是梯度消失。换之,梯度消失是梯度在前向传播中逐渐减为0,按照图标题所说,四条曲线是4个隐藏层的学习曲线,那么第层梯度最(损失函数曲线下降明显),最后层梯度乎为零(损失函数曲线变成平直线).所以D是第层,A是最后层。30.考虑某个具体问题时,你可能只有少量数据来解决这个问题

17、。不过幸运的是你有个类似问题已经预先训练好的神经络。可以下哪种法来利这个预先训练好的络?A、把除了最后层外所有的层都冻结,重新训练最后层B、对新数据重新训练整个模型C、只对最后层进调参(fine tune)D、对每层模型进评估,选择其中的少数来正确答案是:C解析:如果有个预先训练好的神经络,就相当于络各参数有个很靠谱的先验代替随机初始化.若新的少量数据来于先前训练数据(或者先前训练数据量很好地描述了数据分布,新数据采样完全相同的分布),则冻结前所有层重新训练最后层即可;但般情况下,新数据分布跟先前训练集分布有所偏差,所以先验络不以完全拟合新数据时,可以冻结部分前层络,只对最后层进训练调参(这也

18、称之为finetune)。31.在选择神经络的深度时,下哪些参数需要考虑?1 神经络的类型(如MLP,CNN)2 输数据3 计算能(硬件和软件能决定)4 学习速率5 映射的输出函数A、1,2,4,5B、2,3,4,5C、都需要考虑D、1,3,4,5正确答案是:C解析:所有上述因素对于选择神经络模型的深度都是重要的。特征抽取所需分层越多,输数据维度越,映射的输出函数线性越复杂,所需深度就越深.另外为了达到最佳效果,增加深度所带来的参数量增加,也需要考虑硬件计算能和学习速率以设计合理的训练时间。32.当数据过以于法在RAM中同时处理时,哪种梯度下降法更加有效?A、随机梯度下降法(Stochasti

19、c Gradient Descent)B、不知道深度学习基础知识题库大全-第8页深度学习基础知识题库大全-第8页C、整批梯度下降法(Full Batch Gradient Descent)D、都不是正确答案是:A解析:梯度下降法分随机梯度下降(每次个样本)、批量梯度下降法(每次批样本算出总损失,因反向传播的梯度折中)、全批量梯度下降法则次性使全部样本。这三个法,对于全体样本的损失函数曲来说,梯度指向个个准确.但是在程应中,受到内存/磁盘IO的吞吐性能制约,若要最化梯度下降的实际运算时间,需要在梯度向准确性和数据传输性能之间取得最好的平衡.所以,对于数据过以于法在RAM中同时处理时,RAM每次只

20、能装个样本,那么只能选随机梯度下降法。33.当在卷积神经络中加RAM(pooling layer)时,变换的不变性会被保留,是吗?A、不知道B、看情况C、是D、否正确答案是:C解析:池化算法如取最值/取平均值等,都是输数据旋转后结果不变,所以多层叠加后也有这种不变性。34、基于次准则函数的H-K算法较之于感知器算法的优点是()?A、计算量B、可以判别问题是否线性可分C、其解完全适于线性可分的情况正确答案是:B解析:HK算法思想很朴实,就是在最均误差准则下求得权量.他相对于感知器算法的优点在于,他适于线性可分和线性可分得情况,对于线性可分的情况,给出最优权量,对于线性可分得情况,能够判别出来,以

21、退出迭代过程。35、在个神经络中,知道每个神经元的权重和偏差是最重要的步。如果知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的权重和偏移呢?A、搜索每个可能的权重和偏差组合,直到得到最佳值B、赋予个初始值,然后检查跟最佳值的差值,不断迭代调整权重C、随机赋值,听天由命D、以上都不正确的正确答案是:B解析:答案:(B)选项B是对梯度下降的描述。36、神经络模型(Neural Network)因受类脑的启发得名深度学习基础知识题库大全-第9页深度学习基础知识题库大全-第9页神经络由许多神经元(Neuron)组成,每个神经元接受个输,对输进处理后给出个输出,如下图所。请问下列关

22、于神经元的描述中,哪项是正确的?37.下图所的络于训练识别字符H和T,如下所A、B、C、D、可能是A或B,取决于神经络的权重设置正确答案是:D解析:不知道神经络的权重和偏差是什么,则法判定它将会给出什么样的输出。深度学习基础知识题库大全-第10页深度学习基础知识题库大全-第10页38.在下哪种情况下,阶梯度下降不定正确作(可能会卡住)?A、B、C、正确答案是:B解析:39.混沌度(Perplexity)是种常见的应在使深度学习处理NLP问题过程中的评估技术,关于混沌度,哪种说法是正确的?A、混沌度没什么影响B、混沌度越低越好C、混沌度越越好D、混沌度对于结果的影响不定正确答案是:B40.线性程

23、(y=mx+c)可以说是种神经元吗?A可奉告B 否C 是D 派胡深度学习基础知识题库大全-第11页深度学习基础知识题库大全-第11页正确答案是:C41.使两个简单的输h1和h2,最终的等式是A.(h1 AND NOT h2)OR(NOT h1 AND h2)B.(h1 OR NOT h2)AND(NOT h1 OR h2)C.(h1 AND h2)OR(h1 OR h2)D.None of these答案:(A)42.卷积神经络可以对个输完成不同种类的变换(旋转或缩放),这个表述正确吗?A正确 B错误答案:(B)数据预处理(也就是旋转、缩放)步骤在把数据传神经络之前是必要的,神经络不能完成这些

24、变换。43.训练神经络过程中,损失函数在些时期(Epoch)不再减,原因可能是:1.学习率(Learning rate)太低2.正则参数太3.卡在了局部最值哪些是可能的原因?A.1 and 2 B.2 and 3 C.1 and 3 D.都不是答案:(D)以上原因都可能造成这个结果。44.训练好的三层卷积神经络的精确度(Accuracy)vs 参数数量(如特征核的数量)的图如下;从图中趋势可见,如果增加神经络的宽度,精确度会增加到个阈值,然后开始降低。这现象的可能是什么原因是造成的?A即便核数量(number of kernels)增加,只有部分核被于预测B当核数量增加,神经络的预测功效(Po

25、wer)降低C当核数量增加,其相关性增加,导致过拟合D以上都不正确答案:(C)如C选项指出的那样,可能的原因是核之间的相关性。45.使降维技术的络与隐层络总是有相同的输出吗?A.是 B.否答案:(B)因为PCA于相关特征隐层于有预测能的特征46.可以神经络对函数(y=1/x)建模吗?A.是B.否答案:(A)选项A是正确的,因为激活函数可以是互反函数47.我们不是想要绝对零误差,是设置个称为贝叶斯(bayes)误差(我们希望实现的误差)的度量。使贝叶斯(bayes)误差的原因是什么?A.输变量可能不包含有关输出变量的完整信息B.系统(创建输-输出映射)可以是随机的C.有限的训练数据D.所有 答案

26、:(D)想在现实中实现准确的预测,是个神话,所以我们的希望应该放在实现个“可实现的结果”上。48.在监督学习任务中,输出层中的神经元的数量应该与类的数量(其中类的数量于2)匹配。对或错?A.正确B.错误 答案:(B)它取决于输出编码。如果是独热编码(one-hot encoding)则正确。但是你可以有两个输出囊括四个类,并进制值表出来(00,01,10,11)。49.Y=ax2+bx+c(次多项式)这个程可以具有线性阈值的单个隐层的神经络表吗?A.是B.否 答案:(B)答案为否。因为简单来说,有个线性阈值限制神经络就会使它成为个相应的线性变换函数。深度学习基础知识题库大全-第12页深度学习基

27、础知识题库大全-第12页50神经络中的死神经元(dead unit)是什么?A.在训练任何其它相邻单元时,不会更新的单元B.没有完全响应任何训练模式的单元C.产最平误差的单元D.以上均不符合 答案:(A)51.假设在ImageNet数据集(对象识别数据集)上训练卷积神经络。然后给这个训练模型个完全的图像作为输。这个输的输出概率对于所有类都是相等的。对或错?A.正确B.错误答案:(B)将存在些不为像素激活的神经元作为输,所以类不会相等。52.当数据太不能同时在RAM中处理时,哪种梯度技术更有优势?A.全批量梯度下降(Full Batch Gradient Descent)B.随机梯度下降(Sto

28、chastic Gradient Descent)答案:(B)53.从上往下ABCD,下列哪项正确?A.隐藏层1对应于D,隐藏层2对应于C,隐藏层3对应于B,隐藏层4对应于AB.隐藏层1对应于A,隐藏层2对应于B,隐藏层3对应于C,隐藏层4对应于D答案:(A)这是对消失梯度描述的问题。由于反向传播算法进起始层,学习能降低。54.对于分类任务,我们不是将神经络中的随机权重初始化,是将所有权重设为零。下列哪项是正确的?A.没有任何问题,神经络模型将正常训练B.神经络模型可以训练,但所有的神经元最终将识别同样的事情C.神经络模型不会进训练,因为没有净梯度变化D.这些均不会发 答案:(B)55.开始时

29、有个停滞期,这是因为神经络在进全局最值之前陷局部最值。为了避免这种情况,下的哪个策略有效?A.增加参数的数量,因为络不会卡在局部最值处B.在开始时把学习率降低10倍,然后使梯度下降加速算(momentum)C.抖动学习速率,即改变个时期的学习速率D.以上均不是答案:(C)选项C可以将陷于局部最值的神经络提取出来。56.假设在训练时,你遇到这个问题。在次迭代后,错误突然增加。您确定数据定有问题。您将数据描绘出来,找到了原始数据有点偏离,这可能是导致出现问题的地。你将如何应对这个挑战?A.归化B.应PCA然后归化C.对数据进对数变换D.以上这些都不符合答案:(B)先您将相关的数据去掉,然后将其置零

30、。57.影响神经络的深度选择的因素:深度学习基础知识题库大全-第13页深度学习基础知识题库大全-第13页神经络的类型,例如:多层感知机(Multi-Layer Perceptrons,MLP),卷积神经络(Convolutional Neural Networks,CNN)。输数据。计算能,即硬件和软件能。学习率。输出函数映射。深度学习基础知识题库大全-第14页深度学习基础知识题库大全-第14页31增加卷积核的对于改进卷积神经络的效果是必要的吗?否(要考虑数据集)32.感知机的正确顺序1.随机初始化感知机权重2.进下批数据集3.如果预测与输出不符,则调整权重4.对于采样输,计算输出怎样的顺序是正确的?1,4,3,232、下哪个描述可以最好的描述early stopping?AA在每个训练epoch后在测试集上模拟络,当归化误差(generalization error)减时停训练B 种更快的后向传播式,像是Quickprop算法C 在权重值更新时上加个动量项(momentum term),使训练能够更快地收敛D 训练络知道误差函数出现个局部最值深度学习基础知识题库大全-第15页深度学习基础知识题库大全-第15页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁