一种替换关键词的稿件生成方法及系统与流程

文档序号:19947710发布日期:2020-02-18 09:43阅读:579来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种替换关键词的稿件生成方法及系统与流程

本发明涉及文本处理领域,具体涉及一种替换关键词的稿件生成方法及系统。



背景技术:

目前市面上有一些稿件生成方法,是通过人工来定义一些固定的文章模板,进行主体替换来形成稿件,这类稿件只能应用在那些稿件结构比较规范的行业。例如体育行业的比赛报道,在后台制作几个比赛报道稿件的模板,把旧的参赛者、时间、地点、参赛队伍、比分等换成新的信息,就能形成一篇新的比赛报道。

现有的稿件生成方法的缺点在于,套用固定模板生成的稿件,风格统一,比较机械,没有太多的感情,也没有深入的观点阐述,生成的稿件比较死板,一般只能适用于体育、财经、体育等特定行业,不能满足真实的稿件灵活多变的需求。



技术实现要素:

针对上述技术问题,本发明提供一种替换关键词的稿件生成方法及系统。

本发明解决上述技术问题的技术方案如下:一种替换关键词的稿件生成方法,包括:

接收用户输入的稿件主旨;

从所述稿件主旨中去掉目标主体关键词,得到待匹配稿件;

根据所述待匹配稿件匹配多篇相似稿件;

选择所述多篇相似稿件中的一篇作为模板稿件;

将所述模板稿件中的每个句子分别替换为从所述多篇相似稿件中除所述模板稿件外的稿件中匹配到的相似句子,得到待替换稿件;

将所述待替换稿件中的待替换主体关键词替换为所述目标主体关键词。

本发明的有益效果是:打破了固定模板的局限,不需要人工来设置固定的稿件模板,可以自学习每篇稿件的撰稿风格,通过替换关键词的方式生成各式各样的稿件,内容丰富,可读性强,跟人类正常的撰稿风格相近,而不是看起来就像是机器生成的稿件,可以不断自主学习各类稿件风格,在各行各业都能广泛应用,并且,通过使用该方法,降低了稿件撰写的难度,让普通人也能写出各行各业的专业稿件。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,所述从所述稿件主旨中去掉目标主体关键词,具体包括:

通过语义分析从所述稿件主旨中识别目标主体关键词;

去掉所述目标主体关键词。

进一步,所述根据所述待匹配稿件匹配多篇相似稿件,具体包括:

根据所述待匹配稿件,将利用网络爬虫技术从网络爬取的网络数据中匹配多篇相似稿件。

进一步,所述选择所述多篇相似稿件中的一篇作为模板稿件,具体包括:

选择所述多篇相似稿件中与所述待匹配稿件的相似度最高的一篇作为模板稿件。

进一步,所述将所述待替换稿件中的待替换主体关键词替换为所述目标主体关键词,具体包括:

通过语义分析从所述稿件主旨中识别待替换主体关键词;

将所述待替换主体关键词替换为空格;

接收用户在空格处录入的目标主体关键词。

为实现上述发明目的,本发明还提供一种替换关键词的稿件生成系统,包括:

接收模块,用于接收用户输入的稿件主旨;

删除模块,用于从所述稿件主旨中去掉目标主体关键词,得到待匹配稿件;

匹配模块,用于根据所述待匹配稿件匹配多篇相似稿件;

选择模块,用于选择所述多篇相似稿件中的一篇作为模板稿件;

第一替换模块,用于将所述模板稿件中的每个句子分别替换为从所述多篇相似稿件中除所述模板稿件外的稿件中匹配到的相似句子,得到待替换稿件;

第二替换模块,用于将所述待替换稿件中的待替换主体关键词替换为所述目标主体关键词。

进一步,所述删除模块,具体包括:

第一识别单元,用于通过语义分析从所述稿件主旨中识别目标主体关键词;

删除单元,用于去掉所述目标主体关键词。

进一步,所述匹配模块,具体用于:

根据所述待匹配稿件,将利用网络爬虫技术从网络爬取的网络数据中匹配多篇相似稿件。

进一步,所述选择模块,具体用于:

选择所述多篇相似稿件中与所述待匹配稿件的相似度最高的一篇作为模板稿件。

进一步,所述第二替换模块,具体包括:

第二识别单元,用于通过语义分析从所述稿件主旨中识别待替换主体关键词;

替换单元,用于将所述待替换主体关键词替换为空格;

接收单元,用于接收用户在空格处录入的目标主体关键词。

附图说明

图1为本发明实施例提供的一种替换关键词的稿件生成方法的流程图;

图2为本发明实施例提供的一种替换关键词的稿件生成系统的结构框图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

图1为本发明实施例提供的一种替换关键词的稿件生成方法的流程图,如图1所示,该方法包括:

s1、接收用户输入的稿件主旨;

s2、从所述稿件主旨中去掉目标主体关键词,得到待匹配稿件;

s3、根据所述待匹配稿件匹配多篇相似稿件;

s4、选择所述多篇相似稿件中的一篇作为模板稿件;

s5、将所述模板稿件中的每个句子分别替换为从所述多篇相似稿件中除所述模板稿件外的稿件中匹配到的相似句子,得到待替换稿件;

s6、将所述待替换稿件中的待替换主体关键词替换为所述目标主体关键词。

具体的,在用户输入一段要写的稿件主旨后,首先通过语义分析从所述稿件主旨中识别并去掉品牌、产品、人名等目标主体关键词,得到待匹配稿件,然后根据待匹配稿件匹配多篇相似稿件,也就是会通过主旨里面的动词、形容词从网络爬取的的海量稿件里找到主体不一致、事件相似的历史文章。

找到这批相似事件的稿件后,在保留这些文章的前后顺序和逻辑结构不变的情况下,选择所述多篇相似稿件中与所述待匹配稿件的相似度最高的一篇作为模板稿件,把该模版稿件的每个句子都去匹配相似的句子,相当于每一句话都换一个类似的表达,意思不变,说法改变。更换相似句子后的稿件,再把里面的主体关键词去掉变成空格。空格部分就是撰稿人员来填空,撰稿人员根据稿件主旨,把要写的稿件中的主体关键词录入到空格里,形成一篇全新的稿件。

本发明实施例提供的一种替换关键词的稿件生成方法,综合利用了语义分析、自然语言处理技术、相似度匹配算法、以及网络爬虫技术、大数据处理技术,打破了固定模板的局限,不需要人工来设置固定的稿件模板,可以自学习每篇稿件的撰稿风格,通过替换关键词的方式生成各式各样的稿件,内容丰富,可读性强,跟人类正常的撰稿风格相近,而不是看起来就像是机器生成的稿件,可以不断自主学习各类稿件风格,在各行各业都能广泛应用,并且,通过使用该方法,降低了稿件撰写的难度,让普通人也能写出各行各业的专业稿件。

图2为本发明实施例提供的一种替换关键词的稿件生成系统的结构框图,如图2所示,该系统包括:

接收模块,用于接收用户输入的稿件主旨;

删除模块,用于从所述稿件主旨中去掉目标主体关键词,得到待匹配稿件;

匹配模块,用于根据所述待匹配稿件匹配多篇相似稿件;

选择模块,用于选择所述多篇相似稿件中的一篇作为模板稿件;

第一替换模块,用于将所述模板稿件中的每个句子分别替换为从所述多篇相似稿件中除所述模板稿件外的稿件中匹配到的相似句子,得到待替换稿件;

第二替换模块,用于将所述待替换稿件中的待替换主体关键词替换为所述目标主体关键词。

可选地,在该实施例中,所述删除模块,具体包括:

第一识别单元,用于通过语义分析从所述稿件主旨中识别目标主体关键词;

删除单元,用于去掉所述目标主体关键词。

可选地,在该实施例中,所述匹配模块,具体用于:

根据所述待匹配稿件,将利用网络爬虫技术从网络爬取的网络数据中匹配多篇相似稿件。

可选地,在该实施例中,所述选择模块,具体用于:

选择所述多篇相似稿件中与所述待匹配稿件的相似度最高的一篇作为模板稿件。

可选地,在该实施例中,所述第二替换模块,具体包括:

第二识别单元,用于通过语义分析从所述稿件主旨中识别待替换主体关键词;

替换单元,用于将所述待替换主体关键词替换为空格;

接收单元,用于接收用户在空格处录入的目标主体关键词。

基于本发明的一个具体实施例如下:

例如写一篇vivo手机的新机发布稿件,首先通过主旨关键词新机、发布等词找到模板稿件如下:

在大多数制造商致力于增加屏占比和缩小屏幕上方“刘海”的时代,vivo巧妙地创造了一个弹出式自拍相机,实现了利用内置摄像头呈现完整屏幕,保证了全屏体验。

遗憾的是,目前只有nex2的泄露图,我们并没有太多关于规格的可靠信息。然而,最初的vivonex配有6.59英寸superamoled屏幕,搭载骁龙845处理器和配备8gb内存,外媒表示很希望在下一代手机上看到相同的配置或者更佳的配置。

然后把模板稿件进行句子更换,把里面的主体关键词扣除,如下:

首先就是屏幕,____此次既没有采用____,也没有采用____全面屏,而是推出了一款外观____、屏占比更高的____,屏占比高达____%,同时手机的颜值也有大的提升。

____在其发布之初,以____无边框技术使手机拥有____英寸屏幕的视觉体验和____英寸手机相同的握感,同时在当时搭载____处理器,标配____gb内存,有____和____两种存储规格可选,最高配备了____大内存。

然后把要写的稿件主旨内容填写进去,形成一篇新的稿件,如下:

首先就是屏幕,荣耀此次既没有采用刘海屏,也没有采用水滴全面屏,而是推出了一款外观抢眼、屏占比更高的魅眼全视屏,屏占比高达91.28%,同时手机的颜值也有大的提升。

荣耀v20在其发布之初,以超广无边框技术使手机拥有6.4英寸屏幕的视觉体验,同时在当时搭载麒麟980处理器,标配64gb内存,有64g和128g两种存储规格可选,最高配备了256g大内存。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

完整全部详细技术资料下载
当前第1页 1  2  3 
相关技术
  • 一种表格导出方法、装置及设备...
  • 一种文档编辑的方法、装置、计...
  • 文档协同编辑方法及装置、终端...
  • 一种文档编辑的方法、装置、计...
  • 一种图像处理的方法、装置、电...
  • 一种基于典型主接线方式的变电...
  • 一种对标记信息进行处理的方法...
  • 一种基于PDF的幻灯片放映方...
  • 一种机车动车变流柜用电气原理...
  • 集成电路时钟树综合优化方法与...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

PHP网站源码荷坳网站优化按天计费同乐网站推广双龙网站优化按天计费深圳百度竞价吉祥外贸网站建设沙井SEO按天扣费民治标王光明百度网站优化排名松岗百度标王南联SEO按天收费爱联seo网站推广平湖网站推广系统福永外贸网站设计同乐网络广告推广同乐阿里店铺运营荷坳网站排名优化观澜高端网站设计木棉湾百姓网标王坪地英文网站建设丹竹头网页设计松岗优秀网站设计光明模板推广爱联网站制作大芬外贸网站建设吉祥网站建设设计福永推广网站龙岗百度seo东莞品牌网站设计双龙网站优化按天扣费南山百度网站优化排名歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化