一种基于注意力机制的特征提取方法与流程

文档序号:18555105发布日期:2019-08-30 22:29阅读:7679来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种基于注意力机制的特征提取方法与流程

本发明属于计算机视觉技术领域,尤其涉及到一些卷积神经网络图像处理、卷积层特征提取、图像语义分割方法、注意力机制等。



背景技术:

近年来,随着深度学习的发展,尤其是卷积神经网络(convolutionalneuralnetworks,cnn)已经成为图像处理的标准技术。如何从图像中提取出最有效的特征,用于后续的分类、分割,成为了当前研究的热点,现有很多网络把注意力机制的思想引入到特征提取中去,一方面是这种卷积网络可以通过注意力机制的方法,自主学习并突出强特征,另一方面,是注意力机制模仿的是人的视觉行为,能够找到一个图像的焦点区域。近几年来,注意力机制主要在自然语言领域广泛应用,在计算机视觉领域的应用相对较少,主要是利用注意力机制的思想,提升有效特征图中的有效通道,抑制对当前任务影响较小的特征通道。本专利提出一种基于注意力机制的特征提取模块,可以嵌入到任何网络的中的卷积层中,并在空间、通道两个维度引入注意力机制,可以从空间的角度上对焦点区域进行重点学习。

2017年,国内自动驾驶公司momenta提出了senet(squeeze-and-excitationnetworks),并同年获得了imagenet图像分类任务的冠军。它可以无缝集成到任何cnn模型中,通过显式地建模特征通道之间的相互依赖关系,即采用了一种全新的“特征重标定”策略,其本质是在通道之间引入注意力机制。具体来说,就是通过学习的方式来自动获取到每个特征通道的重要程度,然后依照这个重要程度去提升有用的特征并抑制对当前任务影响较小的特征。se模块主要包括squeeze(挤压)和excitation(激发)两个操作过程。但是,se模块只是在通道角度引入注意力机制,并没有考虑到空间角度。因此,它容易忽略图像在空间方面的信息特征。2018年,abhiji.g.r等人在se模块的基础上,提出了三种se模块的变体:cse模块、sse模块、scse模块。其中,cse模块和se模块并无太大区别,都是激发图像在通道方向的特征。sse模块是在通道方向挤压,并从空间方向激发。而scse模块则是结合cse模块和sse模块,分别从通道和空间方向重新标定特征图,然后合并输出,使得特征图在空间和通道方面更具信息性。在神经网络领域,这是首次提出空间挤压与激发,也是在f-cnns中首次实现挤压与激发的集成。这在许多医学应用中起到了更加精准的结果。尽管这几类se模块的变体模块引用注意力机制时在空间角度和通道角度都考虑到了,但是它却没有考虑到在单个空间上的单个子空间即单个像素使用注意力机制。它没有达到像素级的特征标定,缺乏从单个空间域每个像素单位产生注意力再生成权重的思想。



技术实现要素:

本发明要解决的技术问题是,提出一种基于se模块的变体模块的技术。提出了一种新的变体模块:一种基于注意力机制的特征提取模块:单像素特征提取模块:spe模块(singlepixelfeatureextractionblock,speblock)。它具有和之前的se模块及它的变体模块具有不同的特征重标定方式,即从每个特征图的每个像素单位当中产生注意力并生成的权重单独拿出来再重新赋值给每个特征图的每个像素特征。使得以尽可能的学习到图像中的信息,以此可以高效、准确地实现对图像的语义分割任务。

为个实现上述目的,本发明采用以下技术方案:

输入一张特征图u,u∈rh×w×c(其中,r表示特征图维度,h表示特征图空间方向的高度,w表示特征图空间方向的宽度,c表示特征图通道数),通过1*1卷积实现空间挤压操作,将u降维生成q,q∈rh×w。qi,j对应于q在空间位置(i,j)的子空间,其中i∈{1,2,...,h}并且j∈{1,2,...,w}。qi,j=wsq*ui,j的权重为wsq∈r1*1*c*1(wsq为图像的每个子空间特征通过注意力机制学习到的权重,ui,j表示特征图u在每个子空间的特征值)。然后再经过一个全连接层,将通道维度变成和原来一样大小。最后再经过一个sigmoid函数激活,通过使用sigmoid层σ(·)在空间方向上重新标定或激发u将特征重新缩放为[0,1]。最后将得到的激活值(qi,j)与u原先的子空间特征值ui,j在空间位置(i,j)和通道位置k对应相乘:

每个值σ(qi,j,k)对应于给定特征图的空间单位像素信息在空间(i,j,k)位置的相对重要性。这种重标定给予相关的空间像素位置更多权重,对于不相关的空间像素位置则减少其权重。和sse模块不同的是,spe模块在整个过程中,对应于去获得特征图在通道方向每个子空间特征的权重值,而不是获取特征图在整个通道方向的权重值。从一定程度上说,它不仅能从全局的感受野捕获图像特征,也能从局部感受野捕获图像特征。

实现此方法包括以下步骤:

步骤1、输入特征图u,空间大小为h*w,特征通道数为c。

步骤2、squzee(挤压)操作。

步骤3、excitation(激活)操作。

步骤4、reweight(特征重标定)操作。

步骤5、输出特征图空间大小为h*w,特征通道数为c。

作为优选,步骤2具体包括以下步骤:

步骤2.1、将特征图u使用1*1卷积对u的特征通道进行挤压,特征图u对应的通道大小为c,特征图u的每个子空间可以表示为ui,j∈r1×1×c,对应于每个通道上的空间位置(i,j),其中i∈{1,2,...,h}并且j∈{1,2,...,w}。挤压过程中,使用空间大小为1*1、通道大小为1的卷积核,将特征图u挤压成空间大小仍然为h*w,但通道大小变为1的特征图

步骤2.2、取的每一个子空间像素,并且通过实现操作qi,j=wsq*ui,j。权重为wsq∈r1×1×c×1,产生投影张量q∈rh×w。投影的每个qi,j表示空间位置(i,j)的所有通道c的线性组合表示。

作为优选,步骤3具体包括以下步骤:

步骤3.1、在1*1卷积层之后添加一个sigmoid层σ(·)。

步骤3.2、将挤压操作后的特征图放到一个sigmoid层σ(·)把每个像素特征归一到(0,1)

步骤3.3、每个像素都有一个像素特征值,通过sigmoid()

将像素特征值映射到0,1之间,生成激活值。

步骤3.4、经过一个全连接层,将特征图通道维度变为c,即和原先通道大小相同。

步骤3.5、经过一个sigmoid层σ(·)把每个像素特征重新归一到(0,1)之间。

作为优选,步骤4具体包括以下步骤:

步骤4.1、特征重标定先是从前面的层得到在压缩操作得到的单位像素的特征值qi,j,k以及

步骤4.2、将得到的单位像素的特征值σ(qi,j,k)与原特征图的每个单位像素逐通道、逐空间对应相乘,即σ(qi,j,k)*ui,j,k

步骤4.3、与原特征图u相乘,生成

与现有技术相对,本发明具有以下明显优势:

spe模块是从单个特征图当中的单个像素中产生注意力并生成的权重值提取出来再重新赋值给每个特征图的每个像素,从而达到像素级的权值重标定。与其他se模块相比,spe模块它是对整个空间域的学习,因为在空间域的每个像素值所携带的信息特征的重要性是不同的,因此在特征重标定过程中,经过sigmoid函数,使得不重要的信息特征值越来越小,而重要的信息则基本不会损失掉。而且由于是像素级的特征值标定策略,这就使得大多数的边缘信息不会丢失掉,更加还原图像本身所表达的意义。因此,spe模块在学习到图像中的关键信息的同时,也不会损失掉图像的一些边缘关键信息,也以此可以高效、准确地实现对图像的语义分割任务。

附图说明:

图1模型流程图;

图2spe模块原理图;

图3sigmoid函数;

图4spe模块流程图;

图5特征提取操作;

具体实施方式

以下结合具体网络模型实例,并参照附图,对本发明进一步详细说明。

本发明所用到的硬件设备有pc机1台、1080显卡1个;

将本发明提供的模块放到具体的网络模型里运行,其流程图如图1所示,具体包括以下步骤:

步骤1,获取数据集,并将数据集进行数据增强处理。然后进行数据分布,分组处理。

步骤2,选择网络模型,选择两种f-cnn架构作为比较:resnext-50,senet-50。而spe模块采用的网络模型是我们自己搭建的spenet-50。

步骤3,搭建spenet-50的网络模型。

步骤3.1,输入层为112*112的特征图,采用7*7大小的卷积核,数量为64,步长为2。

步骤3.2,上一层输出为56*56的特征图,然后加入3*3层的网络层当中:第一层卷积核大小为1*1,数量为128。第二层加入spe模块(spe模块原理图如图2所示),数目为256。第三层卷积核大小为1*1,数量为512。

步骤3.3,上一层输出为28*28的特征图,然后加入4*3层的网络层当中:第一层卷积核大小为1*1,数量为128。第二层加入spe模块,数目为512。第三层卷积核大小为1*1,数量为1024。

步骤3.4,上一层输出为14*14的特征图,然后加入6*3层的网络层当中:第一层卷积核大小为1*1,数量为512。第二层加入spe模块,数目为512。第三层卷积核大小为1*1,数量为1024。

步骤3.5,上一层输出为7*7的特征图,然后加入3*3层的网络层当中:第一层卷积核大小为1*1,数量为1024。第二层加入spe模块,数目为1024。第三层卷积核大小为1*1,数量为2048。

步骤3.6,上一层输出为1*1的特征图,然后加入一个7*7的全局平均池化层以及一个1000-d的全连接层,最后再经过一个softmax层。

步骤4,将处理好的训练集放到搭建好的网络模型上进行训练,然后再用验证集验证模型的准确性,通过与其他网络模型的实验结果比较,得出最终结论。

步骤4.1,优化算法使用的是同步sgd优化算法,momentum为0.9,采取的minibatch大小为1024。初始学习率设定为0.6,每30次迭代后下降10倍。所有网络模型采用权值初始化策略从0开始训练100次。

步骤4.2,训练此网络模型,直到验证损失收敛为止,使用的损失函数为交叉熵损失函数(crossentropyloss)。

步骤4.3,将这几种网络模型的实验结果进行对比,得出结论。

如图2所示,spenet-50的spe-block结构原理图。spe-block从每个特征图当中的每个像素特征生成的权重单独拿出来再重新赋值给每个特征图的单位像素。使得以尽可能的学习到图像中的信息,以此可以高效、准确地实现对图像的语义分割任务。

以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 信息处理方法及装置、电子设备...
  • 基于分布表示和分布度量的小样...
  • 一种卷积神经网络的卷积核及其...
  • 用于数据处理的模型超参数的搜...
  • 一种基于I-PGA算法的We...
  • 一种电子标签复合设备的制作方...
  • 一种碳纤维新材料做为卡基的卡...
  • 一种微信小程序开发用信息储存...
  • 带有可变信息的RFID胶帽及...
  • 一种环境质量监测采样标签的自...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
注意力机制相关技术
  • 有源配电网环境下带触发机制的变模型变参数优化方法
  • 一种视觉注意力驱动的通信连接建立方法
  • 一种基于视觉注意机制的视频水印方法
  • 基于立体视觉注意力机制和结构相似度的3d绘制图像的客观质量评价方法
  • 像素域内基于层次选择性视觉注意力机制的图像jnd阈值计算方法
  • Dct域内基于视觉注意力机制的图像jnd阈值计算方法
  • 一种基于视网膜视觉机制的彩色图像颜色恒常方法
  • 一种基于互联网事件驱动机制编程模型的建立方法
  • 基于视觉注意力模型的广告标志插入和变换方法及系统的制作方法
  • 基于视觉潜在注意力目标区域的jpeg2000图像编解码方法

PHP网站源码自贡高端网站设计平凉网站优化推广价格模板制作报价汕尾网站seo优化哪家好孝感网络广告推广报价承德百姓网标王报价丽水百度标王哪家好金华网站优化按天扣费衢州网站推广工具多少钱驻马店SEO按效果付费阳江企业网站设计哪家好嘉兴设计网站价格海西SEO按天扣费公司丹竹头网站排名优化哪家好天门网站优化按天收费报价龙岗如何制作网站价格沈阳关键词排名包年推广公司湛江设计公司网站价格漳州网页制作多少钱吉林模板制作推荐塔城关键词按天扣费多少钱宣城关键词按天扣费推荐贵阳品牌网站设计价格黄石关键词按天收费推荐鹰潭网站优化价格珠海SEO按天扣费推荐广东关键词按天计费十堰营销网站公司伊春关键词排名包年推广多少钱和田百姓网标王推广报价歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化