《深度学习与计算机视觉实战-习题数据和答案.docx》由会员分享,可在线阅读,更多相关《深度学习与计算机视觉实战-习题数据和答案.docx(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、深度学习与计算机视觉实战-习题数据和答案第一章一、选择题1、ABC2、ACD3、AB4、ABD5、 ABCD6、C二、填空题1、图像增强、图像恢复、图像压缩2、图像处理、模式识别3、特征能力强、识别精度高、鲁棒性好4、Keras三、简答题1、计算机视觉研究的目标是赋予机器自然视觉的能力。2、在分布式训练中,TensorFlow和PyTorch的一个主要差异特点是数 据并行化,用TensorFlow时,使用者必须手动编写代码,并微调要在 特定设备上运行的每个操作,以实现分布式训练;而PyTorch则是利 用异步执行的本地支持来实现的,其自身在分布式训练是比较欠缺的。 在可视化方面,TensorF
2、low内置的TensorBoard库非常强大,能够显 示模型图,绘制标量变量,实现图像、嵌入可视化,甚至是播放音频 等功能;反观PyTorch的可视化情况,则显得有点差强人意,开发者 可以使用Visdom,但是Visdom提供的功能很简单且有限,可视化效 果远远比不上TensorBoardo在生产部署方面,TensorFlow可以直接通过TensorFlow Serving部署 模型,而PyTorch没有提供任何用于在网络上直接部署模型的框架, 需要使用Flask或者另一种替代方法来基于模型编写一个APIo第二章一、选择题1、C2、B3、B4、C5、AC6、C7、D8、B9、CD10、BC二、
3、填空题1、高频信息、低频信息2、几何3、椒盐4、色调、饱和度、亮度第三章一、选择题1、A2、B3、B4、A5、A6、BC7、BCD8、D9、C10、ACD二、填空题1、旋转、平移、缩放2、平均池化、最大池化 3、RPN4、卷积、转置卷积5、生成器网络、判别器网络第四章一、选择题1、ABD2、A3、B4、AD5、ACD6、D7、AB8、AC9、AB10、C二、填空题1、知识规则、模板匹配、统计模型2、梯度方向直方图、局部二值模式3、P-Net、R-Net O-Net4、人脸检测、人脸对齐、人脸特征提取、特征匹配5、高聚合性、低耦合性三、简答题1、P-Net的作用是快速排除图像中不含人脸的部分;R
4、-Net的作用是 进一步排除不含人脸的部分,并估计人脸框的位置;O-Net的作用是 确定人脸的位置,重叠的候选框用NMS除去,并且最终标记人脸的 眼睛、鼻尖、嘴角共5个位置。2、原因:自然场景下得到的人脸框不一定是正脸状态,人脸角度的 偏移容易导致人脸识别出错,因此在进行人脸识别之前需要进行人脸 对齐操作。方法:利用MTCNN输出的5个人脸关键点的精准坐标,使用简单的 仿射变换方法将人脸旋转一定角度。3、人脸特征匹配实际上就是计算人脸识别图像的特征向量与人脸图 像特征库中每个特征向量的距离,通常采用欧氏距离或余弦距离计算, 两者距离越近表明两个人脸特征属于同一个人的可能性越大。第五章一、选择题
5、1、ACD2、AB3、D4、B5、 ABCD 6、BD7、C 8、ABD9、AB10、C二、填空题1、特征提取、RPN网络、边界框分类回归网络2、筛选出待识别的目标区域、进行再次分类和回归3、偏移4、TP/(TP+FP)5、侯选框、先验锚框、真知边界框三、简答题1、目标检测算法通常会在输入图像中使用预设边框采样大量的区域, 然后判断区域中是否包含需要检测的目标,在FasterR-CNN中,以每 个像素为中心生成多个大小和宽高比不同的预设边框,这些预设边框 即先验锚框。2、RPN的目的是区分一张图像的前景和背景,即区分先验框中的内 容是目标还是背景,目标的标签为1,背景的标签为0,是一个二分 类
6、的任务,因此使用的是二分类损失。3、ROI Pooling 是针对 R0I 的 Pooling 层,R0I 在 Faster RCNN 中指的是 RPN的输出,是一堆矩形候选框。先把R0I中的坐标映射到feature map 上,得到了 feature map上的box坐标后,使用Pooling得到尺寸固定 的输出。弟八章一、选择题1、 ABCD2、C3、AC4、D5、C6、D7、C8、C9、B10、AC二、填空题1、编码层和解码层、编码层、解码层2、FCN、数据增强3、堆叠、融合4、不平衡、小目标三、简答题1、因为语义分割是对图像中所有像素进行分类,使用Sigmoid函数 可以得到像素值所属
7、类别的概率,从而确定类别。2、从Dice Loss的计算公式中可以看出,该损失是一个区域相关的损 失,区域相关的意思就是,当前像素的loss不光和当前像素的预测值 相关,和其他点的值也相关。Dice Loss的求交的形式可以理解为mask 掩码操作,因此不管图片有多大,固定大小的正样本的区域计算的loss 是一样的,对网络起到的监督贡献不会随着图片的大小而变化。3、在图像领域,语义指的是图像的内容,对图片意思的理解,例如 城市道路图像中的行人、建筑、汽车等;分割的意思是从像素的角度 分割出图片中的不同对象,对原图中的每个像素都进行标记。第七章一、选择题1、ACD2、AB3、B4、BC5、A6、
8、AD7、C8、D9、B 10、D 二、填空题1、越高、丰富2、模糊、失真3、低分率图像、生成器模型4、BCE/二元交叉燧、反欺诈5、判别器损失/d_loss、判别器识别正确率/ d_acc、生成器对抗损失 /g_loss生成器特征损失/feature_los三、简答题1、随着判别器鉴别能力逐渐增强,生成器产生的损失增大,使得生 成器需要生成更真实的高分辨率图像,令判别器难以判断图像是否为 真实图像。随着生成器生成的图像质量逐渐提高,反过来导致判别器 的损失增大,使得判别器需要增强鉴别能力,令生成器生成的图像能 够更准确地被检测出。迭代直至判别器无法分辨输入的图像是由生成器生成还是真实的图 像,则认为两者达到了纳什均衡,即任何一方的改进都不会导致总体 的收益增加。2、内容损失由真实高分辨率图像和生成的高分辨率图像,在使用相 同的网络提取特征后,对特征图去均方根误差获得,表示了生成图像 和真实图像间的相似程度,减小内容损失可以使生成的图像更真实。 3、可以,因为VGG19网络的目的是提取图像的特征,所以可以更换 其他的特征提取网络,例如ResNeto