深度学习中所有的优化器的详细介绍与列表化对比分析

最新推荐文章于 2024-06-08 09:29:07 发布

wzg2016

最新推荐文章于 2024-06-08 09:29:07 发布

阅读量1k

收藏 11

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/Strive_For_Future/article/details/108473033

版权

目录

1. 逐个介绍优化器：

2. 不同优化器方法的宏观对比分析

2.1 在分析中的参数命名

2.2 不同优化器的列表对比分析

2.3 不同优化器的可视化对比分析

之前对各个优化器理解的不是特别清晰，最近通过分析，列出一个表格来对比他们之间的异同点。

首先通过列表的方式逐个介绍每个优化器，并做出评价。然后再汇总所有优化器，进行宏观上的比较。

因为公式较多，所以我在word上先编辑好，然后截图过来。

以下文件的下载路径：深度学习优化算法介绍汇总与对比分析.rar 或优化算法汇总与对比分析.rar。两者内容一致，前者包含pdf,excel,word, 后者仅仅包含pdf文件。

1. 逐个介绍优化器：

文中的符号表示与优化器原论文中不同，主要为了保持本综述的符号一致性。而且，个人认为，更便于接受。

其中，Adabound我还没有进行仔细分析。以下是该算法流程的放大图：

2. 不同优化器方法的宏观对比分析

2.1 在分析中的参数命名

2.2 不同优化器的列表对比分析

先表达最终结论：

所有优化器都可以看作是对最基本的SGD的优化，优化的思路主要有三个：

a)用梯度的一阶动量代替梯度作为增量的基量，提升优化算法的速度与鲁棒性。
b)用梯度的二阶动量或∞范数动量对学习率进行自适应化，使不同参数有不同的学习率。
c)用增量的二阶动量代替学习率基量，取消对学习率超参数的依赖，并使学习率大小与当前参数的大小量级匹配。

具体汇总分析如下：

2.3 不同优化器的可视化对比分析

1. 不同优化器的优化速度比较。SGD最慢，Adadelta最快，动量法会走一些弯路。

2. 遇到鞍点时不同优化器的反应。SGD会被困于鞍点，动量法会在鞍点耽误较长时间。Adadelta脱离速度最快，优化也最快。Rmsprop次之。

3. 动量对梯度下降的影响

注：后面的动画引用自： https://ruder.io/optimizing-gradient-descent/

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
深度学习中所有的优化器的详细介绍与列表化对比分析

之前对各个优化器理解的不是特别清晰，最近通过分析，列出一个表格来对比他们之间的异同点。如果对大家有帮助，还希望点个赞。如下：
复制链接

扫一扫

wzg2016 CSDN认证博客专家 CSDN认证企业博客

460: 原创

2万+: 周排名

2074: 总排名

305万+: 访问

: 等级

1万+: 积分

436: 粉丝

2385: 获赞

436: 评论

7738: 收藏

写文章

热门文章

SCI投稿中的简写（ADM，AE，EIC等）与状态解读 132696
python 读取并显示图片，用plt 同时显示多幅图像 112182
Latex公式编号: 多行公式多编号，多行公式单编号 87810
关于Decision in process状态时间变化的解释 61154
win10 查看GPU型号，驱动版本，CUDA版本 58532

分类专栏

镜像搭建 4篇
常用轮子 6篇
论文写作 2篇
文献阅读记录
读书笔记
CSDN
git 1篇
deep-learning-cv-basefunction
tensorflow 43篇
Python 30篇
调试错误 8篇
疑问 1篇
待学习
ubuntu 15篇
pytorch 26篇
matplotlib 2篇
numpy 5篇
pycharm 3篇
LaTex 7篇

最新评论

Latex公式编号: 多行公式多编号，多行公式单编号
fok waijyun: LSTM公式中的向量要用粗体，\bm{}
在搜索引擎中屏蔽csdn
Alaxeesss: 哈哈我也学会了
Ubuntu 20.04中安装CLion并创建桌面快捷方式
雪尽看花开: 为什么我重新进去之后又要重新激活
pytorch convLSTM实现
说汉语讲人话: 是从github搬运的哪个吗
搭建自己的pypi镜像库
龙潜月七: 下载所有包需要多少流量啊？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

最新文章

visual studio 2017下载并离线安装扩展
在windows上执行GIT的时候报错 “Could not open ‘***.VC.opendb‘”
一步一步在 Windows 10 用 visual studio 2019 编译 zmqpp 4.2.0 版（转）

目录

目录

分类专栏

镜像搭建 4篇

常用轮子 6篇

论文写作 2篇

文献阅读记录

deep-learning-cv-basefunction

tensorflow 43篇

调试错误 8篇

matplotlib 2篇

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

PHP网站源码大芬优化丹竹头网站关键词优化大鹏建网站大鹏关键词按天收费惠州网站推广大运seo网站推广双龙SEO按天计费福永网站改版松岗网站优化排名荷坳SEO按天计费南澳网络营销福田网络广告推广横岗关键词按天计费福永百姓网标王推广西乡SEO按效果付费塘坑网站制作设计坑梓外贸网站建设观澜网站设计模板观澜百度关键词包年推广松岗百搜标王龙岗优秀网站设计罗湖企业网站设计罗湖网站推广工具平湖网站改版西乡网站优化推广爱联网络广告推广大芬网站推广系统沙井百度标王民治网站优化按天收费爱联网页制作歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发春山在望成都发生巨响当地回应 60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警 #春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅：唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子 19岁小伙救下5人后溺亡多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人？开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头 315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU 恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化