《梯度下降法优质ppt课件.ppt》由会员分享,可在线阅读,更多相关《梯度下降法优质ppt课件.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分梯度下降法2017.6.13变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分1. 引言梯度下降(GD)是最小化风险函数、损失函数的一种常用方法。在应用机器学习算法时,通常采用梯度下降法来对采用的算法进行训练。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分梯度下降法包含三种不同形式:批量
2、梯度下降BGDBGD(Batch Gradient Descent )随机梯度下降SGDSGD(Stochastic Gradient Descent ) 小批量梯度下降法MBGDMBGD (Mini-Batch Gradient Descent )下文将以线性回归算法为例来对三种梯度下降法进行比较变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分2. 先导知识一元线性回归(拟合曲线)假设这里存在m=6组数据(x, y)变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电
3、站的主接线是电力系统接线组成中一个重要组成部分从图上可以看出,大致数据的大致走势是可以用线性模型y=kx+by=kx+b来表示的,为此我们建立一维线性回归模型。假设一维线性模型表达式如下:变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分其中:h h(x)(x)是假设函数,即要拟合的函数为待求解参数,即要迭代求解的值, 求解出来了那最终要拟合的函数h(x)就确定了。n表示输入特征数,为方便计算,所有的样本都加入了x x0 0=1=1这个特征,所以维数为n+1n+1维维。变电站电气主接线是指变电站的变压器、输电
4、线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分对应的损失损失/ /误差函数误差函数,即估计值与真实值之间的差距,这里用2-范数表示为:其中:mm是训练集的样本个数样本个数1/2是为了后面求导计算方便变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分一个二维参数( 0 , 1 )组对应能量函数(描述整个系统的优化程度,随着网络的变化而减小,最终网络稳定时能量达到最小网络稳定时能量达到最小)的可视化图变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接
5、,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分3. 批量梯度下降法BGD更新算法的目的:误差函数尽可能小误差函数尽可能小,即求解参数使误差函数尽可能小。主要思想:首先,随机初始化参数随机初始化参数;然后,不断反复的更新参数不断反复的更新参数使得误差函数减小,使得误差函数减小,直到满足要求时停止。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分梯度下降算法,利用初始化的参数并且反复更新参数:代表学习率代表学习率,表示每次向着函数每次向着函数J J最陡峭最陡峭的方向迈步的大小(步长?)
6、的方向迈步的大小(步长?)变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分(1 1)将)将J( J() )对对求偏导,得到求偏导,得到每个每个对应的对应的的梯度的梯度当当m=1m=1时,即只有一个样本数据(时,即只有一个样本数据(x, yx, y),),J J对第对第j j个参数个参数j的偏导数是:的偏导数是:变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分对所有mm个样本数据个样本数据,上述损失函数的偏导(累和)为:变
7、电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分(2)由于是要最小化风险函数最小化风险函数,所以按每个参数的梯度负方向梯度负方向,来更新每个j(j=0, 1, 2, , n)变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分上例中,利用BGD求得变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分由更新公式可知,批量梯度下降得到的是一个全局最
8、优解全局最优解,每一次的参数更新都用到了每一次的参数更新都用到了所有的训练数据所有的训练数据,如果训练数据非常多的话,执行效率较低。批量梯度下降法的收敛图(迭代的次数相对迭代的次数相对较少较少):变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分4. 随机梯度下降法随机梯度下降法SGDSGD由于批梯度下降每更新一个参数的时候,要用到所有样本所有样本,所以训练速度会随着样本数量的增加而变得非常缓慢。随机梯度下降正是为了解决这个办法而提出的。它是利用单个样本单个样本的损失函数对求偏导得到对应的梯度,来更新。变电站
9、电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分上例中,利用SGD求得变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分随机梯度下降是通过每个样本每个样本来迭代更新一次,如果样本量很大的情况(例如几十万),那么可能只用其中几万条或者几千条的样本,就已经将参数迭代到最优解。对比上面的批量梯度下降,迭代一次需要用到十几万训练样本,一次迭代不可能最优,如果迭代10次的话就需要遍历训练样本10次。SGD的问题是噪音噪音较BGD要多,使得
10、SGD并不是每次迭代都向着整体最优化方向。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分随机梯度下降收敛图(SGD迭代的次数较多,在解空间的搜索过程看起来很盲目。但是但是大体上是往着最优值方向移动大体上是往着最优值方向移动。)变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分5. 小批量梯度下降法小批量梯度下降法MBGDMBGD为综合解决BGD的训练速度慢,以及SGD的准确性低的问题,提出MBGD它是利用部分样本的损失函
11、数对求偏导得到对应的梯度,来更新。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分6. 总结方法优点缺点BGD最小化所有训练样本的损失函数,使得最终求解的是全局的最优解如果样本值很大的话,更新速度会很慢。SGD最小化每个样本的损失函数,大大加快更新速度,最终的结果在全局最优解附近。训练数据的噪声较多,导致不是每次迭代得到的损失函数都向着全局最优方向。 MBGD训练速度快,参数准确性高 不同的问题需要设置不同的小批量值。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分参考文献https:/ Network感谢观看!感谢观看!文章内容来源于网络,如有侵权请联系我们删除。文章内容来源于网络,如有侵权请联系我们删除。