深度学习中所有的优化器的详细介绍与列表化对比分析

目录

1. 逐个介绍优化器:

2. 不同优化器方法的宏观对比分析

2.1 在分析中的参数命名

​ 2.2 不同优化器的列表对比分析

2.3 不同优化器的可视化对比分析


之前对各个优化器理解的不是特别清晰,最近通过分析,列出一个表格来对比他们之间的异同点。

首先通过列表的方式逐个介绍每个优化器,并做出评价。然后再汇总所有优化器,进行宏观上的比较。

因为公式较多,所以我在word上先编辑好,然后截图过来。

以下文件的下载路径: 深度学习优化算法介绍汇总与对比分析.rar 或  优化算法汇总与对比分析.rar。两者内容一致,前者包含pdf,excel,word, 后者仅仅包含pdf文件。

1. 逐个介绍优化器:

文中的符号表示与优化器原论文中不同,主要为了保持本综述的符号一致性。而且,个人认为,更便于接受。

其中,Adabound我还没有进行仔细分析。以下是该算法流程的放大图:

2. 不同优化器方法的宏观对比分析

2.1 在分析中的参数命名

2.2 不同优化器的列表对比分析

先表达最终结论:

所有优化器都可以看作是对最基本的SGD的优化,优化的思路主要有三个:

  • a)用梯度的一阶动量代替梯度作为增量的基量,提升优化算法的速度与鲁棒性。
  • b)用梯度的二阶动量或∞范数动量对学习率进行自适应化,使不同参数有不同的学习率。
  • c)用增量的二阶动量代替学习率基量,取消对学习率超参数的依赖,并使学习率大小与当前参数的大小量级匹配。

具体汇总分析如下:

 

2.3 不同优化器的可视化对比分析

1. 不同优化器的优化速度比较。SGD最慢,Adadelta最快,动量法会走一些弯路。

 

 2. 遇到鞍点时不同优化器的反应。SGD会被困于鞍点,动量法会在鞍点耽误较长时间。Adadelta脱离速度最快,优化也最快。Rmsprop次之。

 

 

3. 动量对梯度下降的影响

 

注:后面的动画引用自: https://ruder.io/optimizing-gradient-descent/ 

wzg2016
关注 关注
  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
各种优化器介绍
liupc的学习笔记
04-23 1039
点击此处返回总目录 //这篇文章讲的这些优化器的原理,有可能不对。 这节课来介绍一...
深度学习,各类优化器优缺点总结。
08-09
深度学习,各类优化器优缺点总结,包括:标准梯度下降法,随机梯度下降法,批量梯度下降法等11种方法。。。
【机器学习】【深度学习优化器(Optimizer)
最新发布
SmallBamboo的博客
06-08 1502
优化器(Optimizer)是深度学习的一个核心的概念,用于更新神经网络的权重,以减少或最小损失函数(loss function)的值。损失函数衡量了模型的预测值与真实值之间的差异,而优化器的目标是通过调整网络参数来最小这个差异,从而提高模型的准确性和性能。在神经网络训练过程优化器在反向传播过程起着至关重要的作用。反向传播计算了损失函数相当于模型参数的梯度(即损失函数的导数),优化器则使用这些梯度来更新模型的参数。
深度学习优化器的对比
qq_41004007的博客
09-05 2343
转载:https://blog.csdn.net/winycg/article/details/79363169 梯度下降框架 给定优的模型参数θ∈Rdθ∈Rd和目标函数J(θ)J(θ)后,算法沿着梯度∇θJ(θ)∇θJ(θ)的相反方向更新θθ最小J(θ)J(θ)。学习率ηη决定了每一时刻的更新步长。对某一步,可以用下述步骤描述梯度下降流程:  1.计算目标函数的梯度  gt=∇θJ(θ...
深度学习笔记-14.各种优化器Optimizer的总结与比较
12-27 1874
转载自:机器学习:各种优化器Optimizer的总结与比较,我觉得单纯的看印象可能不太深,所以采用边看边手动记录一遍的方式以加深印象!里面的公式自己又手动敲了一遍。 目录 一、优化器的作用: 二、各种优化器介绍 2.1 梯度下降法(Gradient Descent) 2.1.1标准梯度下降法(GD) 2.1.2.批量梯度下降法(BGD) 2.1.3随机梯度下降法(SGD) ...
函数 分析对比
m0_45290027的博客
11-01 105
函数的分析
人工智能机器学习深度学习神经网络优化器大全
bigcindy的博客
07-05 194
SGD RMSprop Adam Adadelta Adagrad Adamax Nadam Ftrl
基于深度学习的物流配送路径优算法的研究.pdf
08-19
3. 路径优算法在物流配送的应用:本文比较了基于深度学习的物流配送路径优算法与禁忌搜索物流配送路径优算法,结果表明基于深度学习的算法在实际配送的配送速度、物流成本与经济效益明显优于禁忌搜索路径...
深度学习对比散度算法的有偏性分析.pdf
08-19
深度学习对比散度算法的有偏性分析深度学习领域的一项重要研究课题,对比散度算法是深度学习的一种常见的优算法,但是在实际应用该算法存在一定的偏性问题。本文通过对对比散度算法的理论分析,揭示了该...
深度学习与骨骼影像自动处理.pdf
08-18
深度学习是一种基于神经网络的机器学习算法,它能对数据进行表征学习,尤其在图像、语音、文字和视频的智能分析展现出了强大的潜力。在医学影像领域,深度学习的应用已经成为一个热门研究方向,如在皮肤癌分类、...
算法汇总与对比分析.rar
09-10
本资料"优算法汇总与对比分析.rar"提供了一个全面的视角,详细介绍了多种常用的深度学习算法,并进行了深入的对比分析。这些优化器不仅在理论上各有特色,而且在实际应用表现出不同的性能。下面,我们将深入...
基于改进粒子群算法的深度学习超参数优方法.pdf
08-18
基于改进粒子群算法的深度学习超参数优方法 ...本文的贡献在于提出了一种基于改进粒子群算法的深度学习超参数优方法,该方法可以有效地解决深度学习模型的超参数优问题,并且具有较好的收敛和优效果。
tensorflow2 5种优化器 SGD,SGDM,ADAGRAD,RMSPROP,ADAM 在鸢尾花数据集的对比
qq_40575024的博客
05-01 1630
5种优化器的对比 在(lr=0.1 epoch=500 batch=32)和(lr=0.1 epoch=100 batch=32)两种情况下,SGD,SGDM,ADAGRAD,RMSPROP,ADAM 在鸢尾花数据集的loss,acc,训练耗时对比。 1. 在(lr=0.1 epoch=500 batch=32)的情况下: 在 lr=0.1 ,epoch=50...
PyTorch四种常用优化器测试
weixin_50918736的博客
11-20 1460
PyTorch四种常用优化器测试SGD、SGD(Momentum)、RMSprop、Adam import os os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE' import torch import torch.utils.data as Data import torch.nn.functional as F import matplotlib.pyplot as plt #超参数 LR =0.001 Batch_Size = 32 Epochs = 12
tensorflow 三种优化器及其区别
VictorHan01的博客
08-07 1136
在搭建神经网络的过程,tensorflow提供了3种优化器,分别是: import tensorflow as tf tf.train.GradientDescentOptimizer(learning_rate).minimize(loss) 该优化器使用梯度下降法进行优,其learning_rate 是学习率,loss代表损失函数 利用梯度下降算法,使参数沿着损失函数梯度的反方向...
Pytorch学习——常用优化器区别和优缺点
weixin_44737266的博客
07-18 1355
使用 import torch.optim as optim optimizer = optim.Adam(net.parameters(), lr=eval(LR_G)) 典型的梯度下降法GD(gradient descent) 介绍:梯度下降法(gradient descent)是求解无约束最优问题的一种常用方法,有实现简单的优点。梯度下降法是迭代算法,每一步需要求解目标函数的梯度向量。 特点:标准下降时在权值更新前汇总所有样例得到的标准梯度,随机下降则是通过考察每次训练实例来更新。 批量梯度下
机器学习/深度学习入门:优化器原理与比较
M_Z_G_Y的博客
04-16 1099
梯度下降法(Gradient Descent) 梯度下降法是最基本的一类优化器,目前主要分为三种梯度下降法:标准梯度下降法(GD, Gradient Descent),随机梯度下降法(SGD, Stochastic Gradient Descent)及批量梯度下降法(BGD, Batch Gradient Descent)。 1. 标准梯度下降法(GD) 假设要学习训练的模型参数为W,代价函...
#深入探究# Adam和SGDM优化器的对比
lch551218的博客
06-07 1万+
1. Adma 和 MSGD Adam和MSGD作为当今最优秀的两种深度学习优化器,分别在效率和精度上有着各自的优势,下面我们将分析两种优化器各自优势的原因,两边的两张图分别是 几种常见的优化器在猫狗分类数据集上的分类准确率曲线,第一个是训练集,第二个是测试集 以下两张图是某个NLP任务,几种模型的准确率和困惑度指标变换曲线 通过上边两幅图片可知: Adma在训练集上的准确率较高,MSGD在测试集上的准确率较高 Adma的速度更快,但MSGD能够得到好的效果 第一个结论可以用下边这个图来解释:
Pytorch优化器全总结(四)常用优化器性能对比 含代码
热门推荐
xian0710830114的专栏
01-16 1万+
常用的优化器我已经用三篇文章介绍完了,现在我将对比一下这些优化器的收敛速度。 下面我将简单介绍一下要对比的优化器,每种我只用一到两句话介绍详细介绍请跳转上面的链接,每种优化器详细介绍过。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • SCI投稿中的简写(ADM,AE,EIC等)与状态解读 132696
  • python 读取并显示图片,用plt 同时显示多幅图像 112182
  • Latex公式编号: 多行公式多编号,多行公式单编号 87810
  • 关于Decision in process状态时间变化的解释 61154
  • win10 查看GPU型号,驱动版本,CUDA版本 58532

分类专栏

  • 镜像搭建 4篇
  • 常用轮子 6篇
  • 论文写作 2篇
  • 文献阅读记录
  • 读书笔记
  • CSDN
  • git 1篇
  • deep-learning-cv-basefunction
  • tensorflow 43篇
  • Python 30篇
  • 调试错误 8篇
  • 疑问 1篇
  • 待学习
  • ubuntu 15篇
  • pytorch 26篇
  • matplotlib 2篇
  • numpy 5篇
  • pycharm 3篇
  • LaTex 7篇

最新评论

  • Latex公式编号: 多行公式多编号,多行公式单编号

    fok waijyun: LSTM公式中的向量要用粗体,\bm{}

  • 在搜索引擎中屏蔽csdn

    Alaxeesss: 哈哈我也学会了

  • Ubuntu 20.04中安装CLion并创建桌面快捷方式

    雪尽看花开: 为什么我重新进去之后 又要重新激活

  • pytorch convLSTM实现

    说汉语讲人话: 是从github搬运的哪个吗

  • 搭建自己的pypi镜像库

    龙潜月七: 下载所有包需要多少流量啊?

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • visual studio 2017下载并离线安装扩展
  • 在windows上执行GIT的时候报错 “Could not open ‘***.VC.opendb‘”
  • 一步一步在 Windows 10 用 visual studio 2019 编译 zmqpp 4.2.0 版(转)
2024年16篇
2023年71篇
2022年121篇
2021年157篇
2020年108篇
2019年75篇
2018年85篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

PHP网站源码大芬优化丹竹头网站关键词优化大鹏建网站大鹏关键词按天收费惠州网站推广大运seo网站推广双龙SEO按天计费福永网站改版松岗网站优化排名荷坳SEO按天计费南澳网络营销福田网络广告推广横岗关键词按天计费福永百姓网标王推广西乡SEO按效果付费塘坑网站制作设计坑梓外贸网站建设观澜网站设计模板观澜百度关键词包年推广松岗百搜标王龙岗优秀网站设计罗湖企业网站设计罗湖网站推广工具平湖网站改版西乡网站优化推广爱联网络广告推广大芬网站推广系统沙井百度标王民治网站优化按天收费爱联网页制作歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化