人机交互中基于标准问创建扩展问的方法和装置与流程

文档序号:16668785发布日期:2019-01-18 23:26阅读:405来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
人机交互中基于标准问创建扩展问的方法和装置与流程

本发明涉及知识库的编辑与扩展,尤其涉及人机交互中基于标准问创建扩展问的方法和装置。



背景技术:

人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。

为了能够理解人类语言,人工智能语义识别系统需要一套知识库。海量异构数据通过知识学习体系整理成知识,并融入到已有的知识体系中来。不同企业会生成各自的“专属知识”;同领域企业的知识中可以总结出“领域语义库”,如图中的“电信领域语义库”;多个行业的知识还可以总结成“通用语义库和知识库”。

知识库的编辑与扩展对于人工智能语义识别系统尤其重要。



技术实现要素:

以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。

根据上面目的,本发明实施例提供一种人机交互中基于标准问创建扩展问的方法,标准问和扩展问用于人工智能语义识别系统中,包括:

基于所述标准问所属的数据范围从所述人工智能语义识别系统的内部数据源或外部数据源采集数据;

以所采集数据为对象执行与所述标准问的问句相似度计算以获得相似问句集;以及

对所述相似问句集执行主语修改以获得所述标准问的扩展问;

所述基于所述标准问所属的数据范围从内部数据源或外部数据源采集数据包括:若所述标准问属于内部数据,则从所述内部数据源调用所有内部数据,以及若所述标准问属于外部数据,则通过所述外部数据源进行搜索爬取;

对通过所述外部数据源爬取到的所采集数据进行整理以过滤无用数据,所述执行问句相似度计算是以整理后的所采集数据为对象来执行的。

在一个实施例中,若所述标准问所属领域的词库在所述人工智能语义识别系统的知识库中已存在,则所属标准问为内部数据,否则为外部数据。

在一个实施例中,所述内部数据源为所述人工智能语义识别系统的知识库中已存在的关于所述标准问的所属领域的词库,以及所述外部数据源包括与所述标准问的所属领域相关的第三方数据库。

在一个实施例中,所述问句相似度计算是基于文本聚类分析、lda分析、或序列分析中的任一者来执行的。

在一个实施例中,所述相似问句集是与所述标准问的相似度超过预定阈值的问句的集合。

在一个实施例中,所述方法还包括至少部分地基于人工选择对所述相似问句集执行筛选以过滤无用数据,所述问句主语修改是对调整后的所述相似问句集来执行的。

在一个实施例中,对所述相似问句集执行主语修改是至少部分地基于人工选择来执行的。

根据上面目的,本发明实施例还提供了一种人机交互中基于标准问创建扩展问的装置,标准问和扩展问用于人工智能语义识别系统中,包括:

数据采集单元,用于基于标准问所属的数据范围从所述人工智能语义识别系统的内部数据源或外部数据源采集数据;

问句相似度计算单元,用于以所采集数据为对象执行与所述标准问的问句相似度计算以获得相似问句集;以及

主语修改单元,用于对所述相似问句集执行主语修改以获得所述标准问的扩展问;所述数据采集单元包括:

调用单元,以用于响应于所述标准问属于内部数据,从所述内部数据源调用所有内部数据;以及

爬取单元,以用于响应于所述标准问属于外部数据,通过所述外部数据源进行搜索爬取;

整理单元,以用于对通过所述外部数据源爬取到的所采集数据进行整理以过滤无用数据。

在一个实施例中,所述内部数据源为所述人工智能语义识别系统的知识库中已存在的关于所述标准问的所属领域的词库,以及所述外部数据源包括与所述标准问的所属领域相关的第三方数据库。

在一个实施例中,所述主语修改单元至少部分地基于人工选择对所述相似问句集执行主语修改。

附图说明

在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。

图1是示出了根据本发明的一方面的创建扩展问的方法的流程图;

图2是示出了根据本发明的一方面的创建扩展问的装置的框图。

具体实施方式

以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。

知识库中的基本知识点最原始和最简单的形式就是平时常用的faq,一般的形式是“问-答”对。在本发明中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。

用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。然而,用户往往并非使用的是标准问,而是标准问的一些变形的形式。例如,若对于收音机的电台切换的标准问形式是“换一个电台”,那么用户可能使用的命令是“切换一个电台”,机器也需要能够识别用户表达的是同一个意思。

因此,对于智能语义识别而言,知识库里需要有标准问的扩展问,该扩展问与标准问表达形式有略微差异,但是表达相同的含义。传统上,往往依赖人工“想”的形式,想出一个标准问尽可能多的扩展问,但是非常耗费人力,而且“漏想”的概率很高。

在本发明中,通过大数据分析聚合的方式,最大的利用了已有产品的日志数据与外部数据。快速定位到了语义扩展问的内容,将原来的“想”扩展问,改成了判定其内容准确性。

图1是示出了根据本发明的一方面的创建扩展问的方法100的流程图。如图1所示,首先提供一标准问,作为扩展的基础。例如,该标准问可为“换一个扫地模式”。

在步骤101,可对该标准问的数据范围进行判定。一般而言,数据范围可以分为内部数据和外部数据。这里的内部数据和外部数据是相对于人工智能语义识别系统的知识库而言的。例如,若该标准问是该知识库内已有的数据,则为内部数据,否则为外部数据。

更具体地,若该标准问所属的语义领域是知识库中已有的领域,则为内部数据,否则为外部数据。以上述“换一个扫地模式”为例,该标准问用于扫地机器人,属于家电智能领域,若系统的知识库内已经有关于家电智能领域的词库,则该标准问为内部数据,否则该标准问为外部数据。

在步骤102,为该标准问添加属性标签,用以指示该标准问的数据范围。

在步骤103,根据标准问的属性标签判断该标准问的数据范围。

如上所述,该数据范围包括内部数据和外部数据。不同的数据范围对应不同的处理。

若该标准问为内部数据,则执行步骤104,即内部数据调用。

较优地,该内部数据可以是该标准问所属的语义领域的所有内部数据。例如,该若该标准问属于家电智能领域,则可以调用内部关于家电智能领域的所有已有数据。若该标准问属于金融领域,且知识库内有关于金融领域的词库,则,该标准问属于内部数据,并且此时调用系统内关于金融领域的所有内部数据。

此特征有助于利用人工智能系统现有的日志数据。例如,若该人工智能语义识别系统长期用于家电智能领域,则内部采集建立了大量与该领域相关的内部数据,这些数据对于建立家电智能领域的标准问的扩展问显然是非常高效率的。

若该标准问属于外部数据,则执行步骤105,即外部数据爬取。即,通过爬取技术对外部数据源进行搜索爬取。

这里的外部数据源可以是任何系统外的第三方数据源,例如百度、搜搜等。这些数据源上积累了海量数据。

较优地,可以爬取与该标准问所属领域相关的第三方数据库。例如,若该标准问属于医药领域,则可以爬取医院网站、药品销售网站的日志数据。这些数据与标准问的相关性可能更高,从而提高效率。

由于外部数据的噪声较大,可以在步骤106对数据进行整理,以过滤无用的数据。

此后,在步骤107,可以执行这些数据与该标准问的问句相似度计算。此举的目的是从这些海量数据中筛选出与标准问比较相似的那些句子。

一般地,可以采用任何合适的相似度计算算法,例如文本聚类分析、lda分析、序列分析(templatemaker)等等。

在步骤108,可以获得相似问句的聚合结果,即相似问句集。这里的相似问句集可包括与标准问的相似度高于预定阈值的那些句子。该阈值可以根据需要人为调节。

在步骤109,可对相似问句集进行初步筛选,以剔除无用数据。

在步骤110,可对相似问句的主语进行修改。这里的主语是指问句里的主体内容。以“换一个扫地模式”为例,这里的“扫地模式”为该标准问的主语。此调整。

修改主语后,可以得到最初该标准问的扩展问。

尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。

上述步骤103、104、105、106、107、108可以看作是大数据处理部分。通过大数据分析聚合的方式,最大地利用了已有产品的日志数据和外部数据。

步骤101、102、109、110可以有人工地参与,例如响应于人工的选择进行筛选、主语修改,这可以增加精确度。当然,这些步骤也可以全自动地来执行。

以下表1示出了标准问、大数据聚合结果、最终扩展问结果的示例。

表1

图2是示出了根据本发明的创建扩展问的装置200的框图。

如图2所示,装置200可包括数据采集单元210。数据采集单元210用于基于标准问所属的数据范围从人工智能语义识别系统的内部数据源或外部数据源采集数据。

如图所示,数据采集单元210可包括调用单元211和爬取单元212。调用单元210可响应于标准问属于内部数据,从内部数据源调用所有内部数据,而爬取单元212可响应于标准问属于外部数据,通过外部数据源进行搜索爬取。

若在人工智能语义识别系统的知识库中已经有了该标准问所属领域的词库,则该标准问可被视为内部数据,否则为外部数据。相应地,该内部数据源可以是人工智能语义识别系统的知识库中已存在的关于该标准问的所属领域的词库。另一方面,该外部数据源可包括与该标准问的所属领域相关的第三方数据库。

尽管图中未示出,装置200还可包括整理单元,以用于对通过外部数据源爬取到的所采集数据进行整理以过滤无用数据。

另外,装置200还可包括问句相似度计算单元220,用于以所采集数据为对象执行与该标准问的问句相似度计算以获得相似问句集。较优地,装置200还可包括筛选单元230,以用于对相似问句集进行筛选以过滤无用数据。在一些实例中,筛选过程可有人工参与,例如筛选单元230可至少部分地基于人工选择来执行筛选。

最后,装置200可包括主语修改单元240。主语修改单元240可对相似问句集执行主语修改以获得该标准问的扩展问。在一些实例中,主语修改可有人工参与,例如主语修改单元240可至少部分地基于用户的选择来修改主语。

通过大数据分析聚合的方式,最大的利用了已有产品的日志数据与外部数据。快速定位到了语义扩展问的内容,将原来的“想”扩展问,改成了判定其内容准确性。大幅提高了语义扩展的效率,并降低了“漏想”的概率。同时,定位的扩展问内容来自产品实际使用数据,更加贴合用户的实际使用习惯。

本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。

软件应当被宽泛地解释成意味着指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行件、执行的线程、规程、函数等,无论其是用软件、固件、中间件、微代码、硬件描述语言、还是其它术语来述及皆是如此。

结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如dsp与微处理器的组合、多个微处理器、与dsp核心协作的一个或多个微处理器、或任何其他此类配置。

结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。

提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 一种面向多轮查询的领域识别方...
  • 一种大数据统计分析系统及其工...
  • 基于关键词生成回复语句的方法...
  • 一种帕金森对话式问诊系统的制...
  • 基于ER模型的自然语言查询方...
  • 一种应用税务领域的深度学习智...
  • 一种基于知识图谱的智慧问答系...
  • 对话处理方法、装置、计算机设...
  • 一种基于深度学习的意图识别方...
  • 一种应用于机器人的语料采集方...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
人机交互专业相关技术
  • 虚拟现实终端的人机交互方法及装置及其终端的制作方法
  • 人机交互方法及装置的制造方法
  • 基于ar或vr系统的人机交互方法和装置的制造方法
  • 一种嵌入式人机交互机床信息采集处理装置的制造方法
  • 一种人机交互装置和方法
  • 一种单手握姿操作的人机交互器按键布局方法
  • 一种人机交互操作的方法和装置的制造方法
  • 基于移动终端的多人人机交互方法
  • 基于车辆中控台的人机交互控制方法和装置、车辆的制作方法
  • 一种防止人机交互界面劫持的方法及装置的制造方法
人机交互界面相关技术
  • 一种数字通信方法及系统与流程
  • 一种智能手机作为控制中心人形机器人的制造方法与工艺
  • 一种采用指纹识别和触摸按键技术的停车设备操作盒的制造方法与工艺
  • 一种无线互联网技术的公共场合大型立体车库控制器的制造方法与工艺
  • 一种铁路行车安全控制系统的制造方法与工艺
  • 一种不同计算模型间的界面数据传递与插值方法与制造工艺
  • 移动终端人机交互方法及人机交互模块与制造工艺
  • 人机交互的方法及装置与制造工艺
  • 一种文字处理方法及系统与制造工艺
  • 一种计算机领域中用于人机交互的指尖佩戴式操作终端的制造方法与工艺
人机交互设计相关技术
  • 一种hmi人机交互大屏显示设计方法
  • 一种有随动座面的自行车鞍座的制作方法
  • 一种有随动座面的自行车鞍座的制作方法
  • 衣物的智能清洗方法和装置的制造方法
  • 一种多通道系统中的多机交互方法
  • 一种触摸屏手机锁屏状态下的人机交互方法
  • 建立数据交互通道的方法和系统、智能卡、服务器的制作方法
  • 建立数据交互通道的方法和系统、智能卡、服务器的制作方法
  • 手机终端中菜单动态变化的实现方法
  • 串行接口多led人机交互模块的制作方法
智能人机交互系统相关技术
  • 基于人机交互设备的手势识别的控制系统及其控制方法
  • 一种智能交互电梯系统的制作方法
  • 一种3d车载终端人机交互系统及交互方法
  • 车载系统与智能移动终端自建频道的信息交互系统及方法
  • 一种智能交互方法和系统的制作方法
  • 一种智能终端的安全交互方法及系统的制作方法
  • 人机交互系统及方法
  • 可穿戴设备与智能家居交互控制方法、系统及可穿戴设备的制造方法
  • 基于汽车智能交互系统的汽车定位寻车方法
  • 一种基于人机交互的智能助眠装置的制造方法
人机交互系统相关技术
  • 基于正视的人机交互方法与系统与流程
  • 一种基于二维码的人机交互系统的制造方法与工艺
  • 基于改进D‑P算法与多模板匹配的手势识别方法与流程
  • 用于调节控制VR眼镜的智能指环的制造方法与工艺
  • 一种实时3D远程人机交互系统的制造方法与工艺
  • 基于体感传感器的机械臂人机交互系统的制造方法与工艺
  • 一种网络虚拟现实技术与实拍结合影视制作系统的制造方法与工艺
  • 联合信息交互系统的制造方法与工艺
  • 采用红外边框作为触控源的人机交互系统的制造方法与工艺
  • 体感车骑行三维仿真装置的制造方法

PHP网站源码铜川外贸网站建设哪家好汕头设计公司网站公司威海网站优化按天收费价格宁波外贸网站设计报价承德优化推荐泰州网站推广工具推荐永新网站seo优化永湖企业网站设计哪家好莱芜关键词排名推荐爱联关键词按天扣费公司乐山企业网站建设推荐福田seo网站优化多少钱大丰seo优化公司漳州网站制作设计杭州网站优化排名梅州seo排名报价三明百度爱采购报价枣庄英文网站建设公司安庆网站改版延安百度竞价包年推广推荐眉山设计网站哪家好新余营销型网站建设推荐咸阳品牌网站设计公司延安阿里店铺运营报价中山网站建设多少钱玉树seo网站优化多少钱防城港网络营销辽阳优化报价长沙高端网站设计公司丹竹头网站建设设计歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化