华东师范大学学报(自然科学版) ›› 2021, Vol. 2021 ›› Issue (5): 24-36.doi: 10.3969/j.issn.1000-5641.2021.05.003

• 金融知识图谱 • 上一篇     下一篇

面向领域知识图谱的实体关系联合抽取

付瑞, 李剑宇, 王笳辉, 岳昆*( ), 胡矿   

  1. 云南大学 信息学院,昆明 650500
  • 收稿日期:2021-08-05 出版日期:2021-09-25 发布日期:2021-09-28
  • 通讯作者: 岳昆 E-mail:kyue@ynu.edu.cn
  • 基金资助:
    国家自然科学基金(U1802271); 云南省重大科技专项(202002AD080002-1-B); 云南省青年拔尖人才计划(C6193032); 云南省教育厅科研基金(2020J0004)

Joint extraction of entities and relations for domain knowledge graph

Rui FU, Jianyu LI, Jiahui WANG, Kun YUE*(), Kuang HU   

  1. School of Information Science and Engineering, Yunnan University, Kunming 650500, China
  • Received:2021-08-05 Online:2021-09-25 Published:2021-09-28
  • Contact: Kun YUE E-mail:kyue@ynu.edu.cn

摘要:

文本数据中的实体和关系抽取是领域知识图谱构建和更新的来源. 针对金融科技领域中文本数据存在重叠关系、训练数据缺乏标注样本等问题, 提出一种融合主动学习思想的实体关系联合抽取方法. 首先, 基于主动学习, 以增量的方式筛选出富有信息量的样本作为训练数据; 其次, 采用面向主实体的标注策略将实体关系联合抽取问题转化为序列标注问题; 最后, 基于改进的BERT-BiGRU-CRF模型实现领域实体与关系的联合抽取, 为知识图谱构建提供支撑技术, 有助于金融从业者根据领域知识进行分析、投资、交易等操作, 从而降低投资风险. 针对金融领域文本数据进行实验测试, 实验结果表明, 本文所提出的方法有效, 验证了该方法后续可用于金融知识图谱的构建.

关键词: 领域文本, 领域知识图谱, 实体关系联合抽取, 主动学习, 序列标注

Abstract:

Extraction of entities and relationships from text data is used to construct and update domain knowledge graphs. In this paper, we propose a method to jointly extract entities and relations by incorporating the concept of active learning; the proposed method addresses problems related to the overlap of vertical domain data and the lack of labeled samples in financial technology domain text data using the traditional approach. First, we select informative samples incrementally as training data sets. Next, we transform the exercise of joint extraction of entities and relations into a sequence labeling problem by labelling the main entities. Finally, we fulfill the joint extraction using the improved BERT-BiGRU-CRF model for construction of a knowledge graph, and thus facilitate financial analysis, investment, and transaction operations based on domain knowledge, thereby reducing investment risks. Experimental results with finance text data shows the effectiveness of our proposed method and verifies that the method can be successfully used to construct financial knowledge graphs.

Key words: domain text, domain knowledge graph, joint extration of entities and relations, active learning, sequence labeling

中图分类号: 

  • TP391

PHP网站源码光明网站优化按天计费南山建站爱联百度seo松岗网站优化软件大运网页制作吉祥模板推广福永网站优化按天收费大运百度网站优化排名民治seo优化荷坳网站推广工具罗湖网站改版深圳网络推广龙岗设计公司网站深圳设计网站宝安百度爱采购坪山网站推广方案大芬阿里店铺运营惠州SEO按天扣费丹竹头百搜词包光明英文网站建设龙华阿里店铺托管宝安设计网站爱联网站设计模板观澜模板网站建设丹竹头关键词排名包年推广塘坑营销网站双龙网站优化排名盐田关键词排名包年推广平湖至尊标王石岩推广网站歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化