一种基于深度学习BERT--CNN的主观题评分模型及评分方法与流程

文档序号:18834859发布日期:2019-10-09 04:52阅读:3931来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种基于深度学习BERT--CNN的主观题评分模型及评分方法与流程

本发明涉及一种主观题评分模型及评分方法,具体涉及一种基于深度学习bert--cnn的主观题评分模型及评分方法,属于人工智能领域。



背景技术:

目前,仅仅依靠关键词的匹配对主观题进行评分,也就是通过提取参考答案与考生答案中关键词的方法,然后将参考答案中的关键词与考生答案中关键词进行匹配,若匹配率高,则得分高,否则得分低或不得分。

该技术虽然能提取到关键词,但往往会忽略词义或语义,以及词与词之间的关系所隐藏了大量的语义信息,基于关键词的匹配会导致这一部分信息丢失,导致评分结果不准确。



技术实现要素:

为了克服现有技术的不足,本发明的目的之一在于提供了一种基于深度学习bert--cnn的主观题评分模型,通过该模型对主观题进行评分,以解决现有人工评分中人力、财力的浪费及评分结构不合理的问题。

一种基于深度学习bert--cnn的主观题评分模型,包括bert转换词向量矩阵模块、cnn语义特征提取模块、相似度计算模块、评分模块,其中bert转换词向量矩阵模块,用于将所述答案文本转换为词向量矩阵,然后将各答案的词向量矩阵传至cnn语义特征提取模块,cnn语义特征提取模块用于获取所述答案文本的语义特征向量,包括卷积层和池化层,将所述答案文本映射矩阵输入到cnn卷积层,得到部分或所有隐含层的输出,得到各答案文本语义特征矩阵,然后将答案文本语义特征矩阵进行池化运算,获得各答案文本语义特征向量,并将其输送到相似度计算模块,计算出各答案文本语义特征向量之间的相似度值,然后将相似度值输送到评分模块,用于确定答案文本的得分。

本发明的目的之二提供一种基于深度学习bert--cnn的主观题评分模型进行评分的方法,具体步骤如下:

步骤(1):利用bert对主观题的参考答案文本中每个词进行向量化表示,获取参考答案文本的语义特征,并构建参考答案文本映射矩阵,采用cnn卷积神经网络对参考答案文本映射矩阵进行卷积运算,获取所有或部分隐含层的输出,得到参考答案文本的语义特征矩阵,利用池化算法对参考答案的语义特征矩阵进行降维得到参考答案文本的语义特征向量;

步骤(2):利用bert对主观题的考生答案文本中每个词进行向量化表示,获取考生答案文本的语义特征,并构建考生答案文本映射矩阵,采用cnn卷积神经网络对考生答案文本映射矩阵进行卷积运算,获取所有或部分隐含层的输出,得到考生答案文本的语义特征矩阵,利用池化算法对考生答案的语义特征矩阵进行降维得到考生答案文本的语义特征向量;

步骤(3):将步骤(1)得到的参考答案文本的语义特征向量和步骤(2)得到的考生答案文本的语义特征向量进行余弦相似度计算,得到两个语义特征向量的相似度值;

步骤(4):将所述相似度值代入计算得分模型中,计算最终得分。

步骤(4)中的计算得分模型为:最终得分=相似度*本题分值。

步骤(3)中相似度计算公式为:

其中,similarity表示相似度,a为答案文本的语义特征向量,b为考生答案文本的语义特征向量,θ表示a、b两个向量的夹角,ai表示a向量的各分向量,bi表示b向量的各分向量,n表示分向量总数。

所述步骤(1)、步骤(2)中的池化算法为最大池化法、最小池化法或平均池化法。

所述参考答案文本的语义特征向量和考生答案文本的语义特征向量均包含词义信息、语义信息、词语与文本语义之间的关联信息。

bert是一种预训练语言表示(languagerepresentations)的方法,在一个大型文本语料库(比如维基百科)上训练一个通用的“语言理解”模型,然后将这个模型用于下游nlp任务(比如问题回答)。bert优于以前的方法,因为它是第一个用于预训练nlp的无监督、深度双向的系统。

本发明的有益效果是:

(1)本发明根据bert分别从参考答案和考生答案文本中自动学习语义特征,将主观题自动评分问题转化为了依据文本语义进行评分问题。

(2)本发明首次将bert--cnn应用到中文主观题自动评分方法中,是在主观题自动评分中的新应用,具有较高的评分准确率,能适用于不同学科的主观题,例如地理、政治、历史、语文、生物等。

(3)本发明利用谷歌训练好的bert模型,获取答案文本中的语义信息,有效的解决了由于多义词的歧义问题,和未能考虑上下文信息的问题,有效挖掘了上下文中的词序特征。

(4)本发明通过cnn提取答案文本的语义特征,有效挖掘答案文本中的语义信息与词语之间的关联信息,改善了文本的语义敏感性问题,提高了主观题自动评分的性能。

(5)本发明通过自定义的计算得分模型,来计算出最终得分,应用于主观题评分中,可以有效降低人力成本,且可以克服人工评分中仅仅进行关键词匹配所造成的评分结果不准确、评分不公平的问题。

附图说明

图1是本发明的评分方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

实施例1:本基于深度学习bert--cnn的主观题评分模型,包括bert转换词向量矩阵模块、cnn语义特征提取模块、相似度计算模块、评分模块,其中bert转换词向量矩阵模块,用于将所述答案文本转换为词向量矩阵,然后将各答案的词向量矩阵传至cnn语义特征提取模块,cnn语义特征提取模块用于获取所述答案文本的语义特征向量,包括卷积层和池化层,获得各答案文本语义特征向量,并将其输送到相似度计算模块,计算出各答案文本语义特征向量之间的相似度值,然后将相似度值输送到评分模块,用于确定答案文本的得分。

利用本基于深度学习bert--cnn的主观题评分模型进行评分的方法,首先获取一个通用的“语言理解”模型,利用谷歌训练好的bert模型,获取答案文本中的语义信息,即bert模型,然后如图1所示,进行以下步骤:

步骤(1):利用bert对主观题的参考答案文本中每个词进行向量化表示,获取参考答案文本的语义特征,并构建参考答案文本映射矩阵,采用cnn卷积神经网络对参考答案文本映射矩阵进行卷积运算,获取所有或部分隐含层的输出,得到参考答案文本的语义特征矩阵,利用池化算法对参考答案的语义特征矩阵进行降维得到参考答案文本的语义特征向量,参考答案文本的语义特征向量包含词义信息、语义信息、词语与文本语义之间的关联信息;

步骤(2):利用bert对主观题的考生答案文本中每个词进行向量化表示,获取考生答案文本的语义特征,并构建考生答案文本映射矩阵,采用cnn卷积神经网络对考生答案文本映射矩阵进行卷积运算,获取所有或部分隐含层的输出,得到考生答案文本的语义特征矩阵,利用池化算法对考生答案的语义特征矩阵进行降维得到考生答案文本的语义特征向量,考生答案文本的语义特征向量包含词义信息、语义信息、词语与文本语义之间的关联信息;

步骤(3):将步骤(1)得到的参考答案文本的语义特征向量和步骤(2)得到的考生答案文本的语义特征向量进行余弦相似度计算,得到两个语义特征向量的相似度值,相似度计算公式为:

其中,similarity表示相似度,a为答案文本的语义特征向量,b为考生答案文本的语义特征向量,θ表示a、b两个向量的夹角,ai表示a向量的各分向量,bi表示b向量的各分向量,n表示分向量总数。

步骤(4):将所述相似度值代入计算得分模型中,计算最终得分。

最终得分=相似度*本题分值。

所述步骤(1)、步骤(2)中的池化算法均为最大池化法。

实施例2:本实施例方法同实施例1相同,不同之处在于,步骤(1)、步骤(2)中的池化算法均为最小池化法。

实施例3:本实施例方法同实施例1相同,不同之处在于,步骤(1)、步骤(2)中的池化算法均为平均池化法。

上面结合附图对本发明的具体实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 用于复杂系统生命周期管理的预...
  • 交叉引用方法与装置与流程
  • 一种文本标注方法、系统及计算...
  • 用于生成审查报告的装置及在线...
  • 基于参数生成审查报告的实现方...
  • 一种在线签署协议的PDF文件...
  • 数据汇总方法、电子装置及计算...
  • 用于适配表单的方法和系统与流...
  • 基于页面端同步编辑文档的方法...
  • 征信报告数据处理方法、装置、...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

PHP网站源码大鹏关键词排名福永网站优化按天扣费横岗百姓网标王推广荷坳百姓网标王推广塘坑至尊标王坑梓关键词按天收费福田网站优化按天计费龙华网站改版横岗百姓网标王木棉湾至尊标王南联外贸网站制作大运网站优化排名永湖百度竞价深圳百度标王福永网站推广工具南联网站优化排名松岗百度关键词包年推广布吉英文网站建设福田网站改版荷坳企业网站改版爱联高端网站设计广州企业网站改版大运网页设计布吉网站优化软件深圳百姓网标王推广大鹏网页设计同乐网站推广系统永湖百度竞价包年推广双龙企业网站设计民治模板网站建设歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化