《神经网络与深度学习》-精品文档资料整理.docx-淘文阁

资源描述

《《神经网络与深度学习》-精品文档资料整理.docx》由会员分享，可在线阅读，更多相关《《神经网络与深度学习》-精品文档资料整理.docx（13页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、神经网络与深度学习一个人在不接触对方的情况下通过一种特殊的方式以及对方进展一系列的问答。假如在相当长时间内他无法根据这些问题判断对方是人还是计算机那么就可以认为这个计算机是智能的。图灵测试 2.人工智能的研究领域 1.感悟模拟人的感悟才能语音信息处理、计算机视觉 2.学习模拟人的学习才能监视学习、无监视学习、强化学习等。 3.认知模拟人的认知才能知识表示、自然语言处理、推理、规划、决策。 3.人工智能的开展史 1.推理期 1956-60年度代末基于逻辑以及事实规那么出现了几何定理证明器、语言翻译器等。 2.知识期 70年度代初-80年度代中期意识到知识对于人工智能

2、系统的重要性构建专家知识库出现专家系统 3.学习期 90年度代至今让计算机自动从数据中分析并获取规律然后进展预测出现机器学习 machine learning 伴随着计算机运算才能的进步神经网络重新兴起并促进了深度学习的开展 4.人工智能的流派 1.符号主义用符号抽象世界中的事物用逻辑抽象世界中的规那么。 2.连接主义模拟人类大脑神经网络 3.行为主义控制论模拟人的行为形式感悟-动作 1.2 机器学习 1.机器学习是什么机器学习是人工智能的一个分支致力于从有限的观测数据中学习出一般性的规律并在将来进展预测。 2.机器学习的步骤浅层学习不涉及特征学习机器学习的

3、特征主要通过人工方法或特征转换来抽取。特征处理是机器学习中的重点工作对模型输入的特征的优劣直接影响模型的性能因此很多机器学习问题演变成了特征工程特征工程需要人类智能。 1.数据预处理去除噪声 2.特征提取从原始数据中提取有效特征 3.特征转换对特征升维以及降维降维的方式主要有特征抽取 Feature Extration 以及特征选择 Feature Selection 。特征选择以及特征抽取有着些许的相似点这两者到达的效果是一样的就是试图去减少特征数据集中的属性(或称为特征)的数目但是两者所采用的方式方法却不同特征抽取的方法主要是通过属性间的关系如组合不同的属性得新的

4、属性这样就改变了原来的特征空间而特征选择的方法是从原始特征数据集中选择出子集是一种包含的关系没有更改原始的特征空间。特征抽取的方法主要包括主成分分析 PCA 以及线性判别分析 LDA 特征选择的方法有Filter方法、Wrapper方法、Embedded方法。 4.预测学习一个函数分类、回归 1.3 表示学习 1.表示学习是什么表示学习是机器学习经过中针对数据特征的一种技术手段。为了进步机器学习的准确率就需要获取数据更有效地特征假如使用人工进展抽取工作量太大。假如有一种算法可以自动的学习出有效的特征并最终进步机器学习模型的性能这种学习就被称作表示学习。 2.表示学习的关

5、键是什么表示学习的关键是解决语义鸿沟在某种程度上反响数据的高层语义信息。语义鸿沟是指底层特征原始数据特征以及高层语义信息差异大。比方两个汽车的图片像素数据差异很大而在语义信息上却是相似的。 3.什么是一个好的表示 1 应该具有很强的表示才能一样长度的向量表示更多的信息 2 使后续的学习任务变得简单即表示出更高层的语义信息 3 具有一般性可以迁移到其他的任务上 4.表示学习的两种方法 1 部分表示以表示颜色为例对人类来讲有多少种不同的颜色就可以有多少种不同的符号来表示比方天蓝色、海蓝色、咖啡色、土黄色.但是计算机识别不了符号因此就用向量来表示比方目前已知的颜色有1000

6、种那么计算机就用一个1000维的向量来表示颜色向量的每一个分量都代表不同的颜色对于每一个颜色其对应的向量中只有一个分量为1 其余均为0。一旦出现一种新的颜色向量的维度就要加1。部分表示在特征空间中的表达所有的数据对象都是不同坐标轴上的点。 2 分布式表示分布式表示选择数据对象共有的特征组成特征向量并根据数据对象是否具有某个特征来判断该对象的类型。比方颜色共有的特征是RGB 因此分布式表示方法表示颜色仅需要一个3维向量即可表示出所有的颜色。分布式表示在特征空间中的表达低维空间中分散的点部分表示分布式表示 A 1 0 0 0 0.25 0.5 B 0 1 0 0 0.2

7、0.9 C 0 0 1 0 0.8 0.2 D 0 0 0 1 0.9 0.1 部分表示可解释性强但是维度太高并且无法计算数据对象之间的相似度。部分表示可以通过神经网络转化为分布 5.表示学习以及传统的特征转换的区别传统的特征转换如PCA、LDA等方法一般是使用人为设计的规那么并且特征学习以及最终的模型的学习是分开的因此学习到的特征并不一定能提升模型的性能。 1.4 深度学习 1.深度学习是什么深度学习是表示学习的学习经过加上预测经过。深度指的是学习特征要分为多步如先学习底层特征再学习中层特征、再学习高层特征。学习指的是表示学习的经过。 2.深度学习以及人工神经网络的关系人工

8、神经网络是深度学习的工具用于解决深度学习中奉献度分配的问题选择更有效地特征。详细方法有梯度下降反向传播算法。 3.端到端的学习以及传统的机器学习、传统的机器学习往往将任务分解为多个子模块分别独立的进展优化。各个子模块的优化目的不能以及总体目的保持一致因此效果差。而端到端的学习不必拆分子模块整个学习经过也无须人工干预只需要将输入-输出数据对输入到神经网络中即可自行学习。 1.5 人工神经网络 1.6本书知识体系第二章机器学习概述 2.1 机器学习的根本概念 1.特征选定的待识别目的的特征如预测芒果的甜度时选取芒果的大小、产地、品种、颜色作为特征。 2.标签挑选

9、10000个芒果作为训练数据标注每个芒果的特征值和测得的甜度甜度就是每个芒果的标签但是标签值可以是连续的可以以是不连续的如预测芒果是好果还是坏果时标签值就是二值的 0或者1 。 3.样本(实例) 一个芒果就是一个样本样本特征值标签值 : 一个样本可看作二维数组 7.样本的独立同分布机器学习就是要从已知的历史数据中学习到固有的规律进而进展预测。但是在大数据时代历史数据太过庞大。假如使用全部的数据进展学习效率太低。因此就要在原有数据的根底上进展采样用更少的数据即采样数据代表总体。我们假设采样得到的数据全部都是独立同分布的。同分布是指样本数据知足一个隐含的分布这个隐含

10、的分布固然是未知的但却是真实存在的即全体历史数据知足的分布。独立是指样本之间是互相独立的样本1对样本2不会产生影响。知足了独立同分布以后便可以用样本数据代替总体数据进展学习。 5.数据集所有的样本放在一起就是数据集一个数据集可以看成三维数组 6.训练集以及测试集训练集用于训练模型测试集用于测试学习到的模型 7.机器学习流程 2.2 机器学习三要素 1.模型对于一个学习任务我们首先要确定其输入空间以及输出空间输入空间就是特征向量的长度输出空间就是标签的取值范围可以是离散的可以以是连续的。确定了输入输出空间以后我们根本就可以学习输入以及输出之间的特定联络了这种联络可

11、以是一个映射函数y g(x)或是一个概率分布 p(y|x) 。假设如今要学习的参数是映射函数y g(x),我们并不能确定这个函数详细多少但是我们可以假设它的类型线性or非线性多项式or三角函数并在学习经过中不断地优化参数使其可以接近真实的映射函数。例如要预测曼哈顿楼价以及位置、楼层、面积之间的关系我们可以假设它们之间的关系是根据的不同取值可以得到无穷多个函数这些函数同属于一个函数族这个函数族就构成了我们的假设空间而形成这个假设空间的模板函数就是模型. 常见假设空间分为线性假设空间以及非线性假设空间对应的模型分别是线性模型以及非线性模型。线性模型为向量非线性模型为函

12、数向量假如本身为可学习的基函数即将看作模型能由其他的基函数生成可套娃 ,那么可看作神经网络模型。 2.学习准那么学习准那么调整参数的原那么预测函数通过学习准那么不断地调整参数使得整个预测函数不断地向真实函数拟合。 A.损失函数损失函数用于计算预测值以及真实值之间的误差常见的有0-1损失函数、平方损失函数、绝对损失函数、对数损失函数。通过损失函数我们只能知道预测函数f(X)对于单个样本点的预测才能借用损失函数L(Y,f(x) 损失函数越小讲明模型对于该样本预测越准确但是无法得知预测函数在整个训练集上的表现。这就引入了经历风险的概念。 B.经历风险经历风险就是把训练集

13、中的所有样本的损失函数值加起来再除以样本总数。但是假如模型按照经历风险进展计算的话训练出的模型只能是在训练集上有较好的表现再其他数据上的表现可能不好因此就引出期望风险。 C.期望风险计算预测函数对所有样本点的损失函数值的期望但是不现实。P(x,y)是结合概率分布。 D.构造风险既然期望风险无法计算因此只能用经历风险代替期望风险即用部分最优代替全局最优当训练数据集无限大时经历风险也就无限接近期望风险但是由于训练数据集在实际中只是总体数据的一个子集因此训练集并不能完美的反映总体数据再训练集上将经历风险最小化就容易出现过拟合的问题即在训练集上表现很好而在测试集上表现很差。为了防止过拟合就引入了构造风险。构造风险用于对参数个数进展限制及减小参数空间。以学习多项式函数为例变量个数越多等都看作是不同的变量而不是同一变量的不同次幂函数越复杂就越容易过拟合。是的L2范数也是参数空间的大小。 L1范数以及L2范数的正那么化

展开阅读全文