通过无监督域适应训练目标域分类模型的方法与流程

文档序号:20082874发布日期:2020-03-13 05:51阅读:2148来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
通过无监督域适应训练目标域分类模型的方法与流程

本发明涉及图像分类技术领域,尤其涉及一种通过无监督域适应训练目标域分类模型的方法。



背景技术:

无监督域适应能利用现有的源域带标签数据和网络模型以及相关的目标域无标签数据学习得到适用于目标域数据分类的网络模型。

传统的无监督域适应方法通常利用相关距离度量等措施去对齐深层网络输出的源域和目标域的数据分布。近年来许多对抗性域适应的方法也被提出,并取得了较为显著的成果,这些方法大多是基于生成对抗网络。主要做法是训练鉴别器鉴别采样特征是来自于源域还是目标域,同时训练特征提取器欺骗鉴别器,以此使得源域和目标域特征分布对齐,无法区分。

这些方法大多侧重于测量域级别上的域差异,而不区分来自两个域的样本是否根据所属的类别进行对齐。即便全局域统计数据完全混淆,源域和目标域之间的差距也不一定被减少,甚至还会将不同类别的样本混合到一起,因此,分类效果还有待提高。



技术实现要素:

本发明的目的是提供一种通过无监督域适应训练目标域分类模型的方法,具有很好的泛化性,且训练好的分类模型分类准确较高。

本发明的目的是通过以下技术方案实现的:

一种通过无监督域适应训练目标域分类模型的方法,包括:

对于源域和目标域输入的批图像数据,通过标准卷积网络来提取图像特征,然后结合初始化设定的质心特征构建对应于源域和目标域的实例图;将实例图中的节点矩阵依次通过源域分类器与图卷积网络后,更新对应于源域和目标域的类别质心特征;

使用类别质心特征对齐机制,约束图卷积网络每层中来自不同域的类别质心特征,使不同域的类别质心特征随着迭代训练而逐渐靠近;

并且,使用质心指导的对抗性对齐机制,利用所有类别自动生成的质心特征作为域全局统计信息指导每批图像数据参与对抗训练;

通过迭代训练最终得到在目标域有效的分类模型。

由上述本发明提供的技术方案可以看出,能通过端到端的方式训练网络自动学习到类别的质心而不依赖特定人类先验知识,因此具有更好的泛化性;该方法在多个数据集上得到了平均1~2%的分类准确率的提升,且模型分类准确率收敛速度更快。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种通过无监督域适应训练目标域分类模型的方法的框架图。

具体实施方式

下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。

本发明实施例提供一种通过无监督域适应训练目标域分类模型的方法,该方法所涉及的无监督域适应是基于图卷积类别感知结构建模,如图1所示,为相关方法的整体框架,训练过程主要包括如下几个部分:

1、类别质心特征自动生成。

对于源域和目标域输入的批图像数据,通过标准卷积网络来提取图像特征,然后结合初始化设定的类别质心特征构建对应于源域和目标域的实例图;实例图包含了由一系列特征节点构成的节点矩阵及相应的邻接矩阵,节点矩阵依次通过源域分类器与图卷积网络后,更新对应于源域和目标域的类别质心特征。

本发明实施例中,所述源域和目标域输入的批图像数据包括:有标签的源域数据与无标签目标域数据。

通过标准卷积网络提取图像特征,然后结合初始化设定的质心特征构建对应于源域和目标域的节点矩阵表示为:

上式中,alexnet(xbatch)表示利用alexnet标准卷积网络提取批图像数据xbatch的特征;c表示初始化设定的类别质心特征;表示特征串联;*=s,t,分别对应于源域和目标域,即对应于源域的节点矩阵,对应于目标域的节点矩阵。

如图1所示,其中的xs、xt为提取到的源域和目标域图像的特征。

利用源域分类器预测节点矩阵中各特征节点的软标签从而根据特征节点间相似性来构建相应特征节点离连边的权重,相应的邻接矩阵表示为:

上式中,*=s.t,分别为源域的节点矩阵对应的邻接矩阵、源域特征节点的软标签;分别为目标域的节点矩阵对应的邻接矩阵、目标域特征节点的软标签。

通过以上方式得到的节点矩阵与对应的邻接矩阵,构成了完整的实例图。

之后,源域和目标域的节点矩阵各自通过一个图卷积网络,相关操作表示为:

上式中,对应的表示图卷积网络第l层、l+1层的输出结果;表示度矩阵,度矩阵第i行第i列元素为邻接矩阵第i行第j列元素,类似的,*=s,t分别对应于源域和目标域,w(l+1)表示图卷积第l+1层可学习参数,源域和目标域对应的图卷积网络中的参数共享,σ表示激活函数。

利用特征节点间关系传播特征信息,更新节点特征,自动生成了新的类别质心特征并更新原来的类别质心特征。同时后文所介绍的两个针对类别质心特征的对齐机制将会约束特征是富有语义的。

本发明实施例中,因为图像样本最终要被准确分类,那么对应每个类别,所有图像样本的特征在特征空间上会存在一个类别质心特征来代表这个类别的所有图像样本。类别质心特征实际并不存在,在以往的方法中使用同类样本特征求均值来代表质心特征,本发明实施例中则利用图卷积网络来自动学习类别质心特征,如图1所示,左侧右侧所示的cs和ct都代表源域和目标域生成的类别质心特征,区别在于,左侧是更新前的类别质心特征,右侧为更新后的类别质心特征。本领域技术人员可以理解,更新前的类别质心特征是指始化设定的类别质心特征,或者是上一次操作后得到的类别质心特征。

2、类别质心特征对齐机制。

在实践中,以往的方法侧重于对类级信息进行建模,取得了令人印象深刻的效果,进一步强调了类级信息的重要性。为了确保来自不同域的相同类的特征被映射到邻近的位置,本发明实施例中,设计类别质心特征对齐机制对无监督域适应的类别信息建模,通过约束图卷积网络每层中来自不同域的类别质心特征,使不同域的类别质心特征随着迭代训练而逐渐靠近,以这样的方式将类别信息编码所学习的特征。因此,属于同类别的样本就可以嵌入到特征空间的附近位置。

类别质心特征对齐机制的损失函数为:

其中,k代表类别数量,φ代表距离度量函数,k为类别序号,cs和ct分别代表源域和目标域的类别质心特征。

3、质心指导的对抗性对齐机制。

本发明实施例中,使用质心指导的对抗性对齐机制,利用所有类别自动生成的质心特征作为域全局统计信息指导每批图像数据参与对抗训练,以缓解批样本输入带来的局部信息干扰鉴别器对域全局分布判断的影响。类别质心特征的参与可以提高训练效率和适应性能。

质心指导的对抗性对齐机制的损失函数为:

其中,χs={x|x∈ds},χt={x|x∈dt}分别表示源域和目标域图像,cs和ct分别代表源域和目标域的类别质心特征,d代表鉴别器,g代表特征提取器,代表特征串联。

如图1所示,特征提取器是由标准卷积网络alexnet以及图卷积网络共同构成。

如图1所示,分类器f是针对域适应目标,随着训练更新的任务特定分类器(简称训练分类器f),分类模型训练完毕后,将利用训练分类器f对目标域图片进行分类,输出分类得分。鉴别器d用于训练阶段,其主要作用是根据输入的特征与类别质心特征来判断图像来自源域还是目标域,可以表示为:d(concat([xs,cs],axis=0)),d(concat([xt,ct],axis=0)),concat表示拼接操作,axis=0表示在第0维上进行concat。

本发明实施例上述方案所设计的对抗性对齐机制有类别质心特征的参与,从而会帮助类别质心特征的对齐。反过来,类别质心特征对齐机制约束了学习更具语义的类别质心特征也会帮助指导对抗性对齐机制。因此两机制可以相互强化,使得的分类模型也可以在不依赖人类先验的情况下,以端到端的方式训练。

通过以上方式,结合定义的损失函数不断的迭代训练,最终可以得到在目标域有效的分类模型。训练得到的分类模型可以对输入的目标域图像进行有效分类,分类准确度也较高。在测试阶段,将目标域图像χt输入训练好的分类模型,通过特征提取器g,也即经过alexnet提取特征,再结合训练得到的目标域质心特征通过gcn得到进一步提取的特征g(χt),即将最后提取的特征g(χt)输入至训练分类器f得到类别结果。

本发明实施例上述方案,可以应用于大数据规模无标签图像的预分类。在实施上,可以以软件的方式安装于工作电脑上进行实时的小批图像数据的分类展示,也可以安装于大型服务器对大批图像数据进行处理。

上述方案与现有方法相比,主要获得如下技术效果:

能通过端到端的方式训练网络自动学习到类别质心特征而不依赖特定人类先验知识,因此具有更好的泛化性;该方法在多个数据集上得到了平均1~2%的分类准确率的提升,且模型分类准确率收敛速度更快。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

完整全部详细技术资料下载
当前第1页 1  2  3 
相关技术
  • 一种基于新型损失函数的卷积神...
  • 一种基于最优网络结构的网络社...
  • 图像风格迁移方法、装置、设备...
  • 一种基于模糊C均值的分布式集...
  • 数据处理方法、装置、计算机设...
  • 识别文本的方法及装置与流程
  • 多侦察平台脉间捷变雷达辐射源...
  • 影像切割方法、装置及其非暂态...
  • 基于卷积神经网络的视觉SLA...
  • 现场大数据动态调整方法与流程
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

PHP网站源码阿坝网站改版塘坑网站搭建哪家好抚州外贸网站制作安康设计公司网站多少钱延安设计网站多少钱安康网站制作价格永湖seo排名价格衢州模板制作哪家好信阳外贸网站设计公司光明网站优化推广推荐鹤壁网站开发推荐合肥网站seo优化报价宝安如何制作网站哪家好泸州网站改版哪家好黔南百度爱采购张北企业网站改版推荐漯河设计公司网站西安百度标王哪家好坪山网站优化推广哪家好坪山建站价格驻马店关键词排名多少钱宣城关键词按天收费随州设计网站价格上饶网站设计模板报价临沂网站制作推荐呼和浩特SEO按天收费哪家好吉安百姓网标王推广哪家好淄博网站建设江门关键词按天计费公司海西网站设计推荐歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化