科大讯飞必读3:智能语音产业发展趋势及热点

发布于: 修改于:雪球转发:15回复:5喜欢:7
作者: 安徽科大讯飞科技有限公司副总裁   胡郁
$科大讯飞(SZ002230)$

注:如果你觉得这篇文章很有用,可以捐赠一点比特币BTC给我玩玩,[大笑]
账号地址:19fJnPC4vsvXFkx77TB95GFLnMVKoTo45v

一、智能语音技术简介

(一)智能语音交互技术概述

语音是人类沟通最自然便捷的方式,是文化的基础、民族的象征。语音技术在汉语国际推广、民族双语教学、信息安全等国家核心价值领域都具有重要的战略意义。智能语音交互技术是指使信息时代的各种信息机器像人一样“能听会说”的技术,为人机交互方式带来了根本性变革,具有广阔的产业化前景。智能语音交互技术主要包括以下四个方面:

1.   语音合成技术——可以将任意的文字信息转化为自然流畅的语音,相当于给机器装上了人工嘴巴;
2.   语音识别技术——可以将语音中内容、说话人、语种等信息识别出来,相当于给机器装上了人工耳朵;
3.   自然语言理解——可以对自然语言进行语义理解给出适合的指令集合,相当于给机器赋予人工的大脑;
4.   语音评测技术——可以进行发音标准评价和错误反馈指导,相当于把机器变成语音评测老师;

(二)国内外智能语音交互技术发展态势

作为战略性和前瞻性的重要新兴产业,智能语音交互技术及应用一直是国内外科学界和产业界关注的焦点,世界各国都力争取得关键技术突破,占据产业先机。美国设立的DARPA高科技研究计划、日本设立的“第五代计算机”技术攻关计划、欧洲尤里卡计划中对该方向均设立了专项予以重点支持。IBM、微软、Motorola、Nuance等国外著名的IT厂商2000年前就纷纷在中国设立了语音研究机构,使我国语音产业一度完全掌握在国外公司手中,形势非常严峻。

目前,伴随着3G时代的到来和云计算的出现,移动互联网时代语音技术正面临着全新的发展机遇。而苹果和谷歌等新巨头的加入,也进一步加剧了产业竞争的程度,新一轮的竞争将更加激烈。特别是Siri的出现,让人们对语音技术的关注达到了新的高度。

我国长期以来高度重视语音技术,国家工业和信息化部、科技部、发改委等部委长期以来通过各种方式支持语音技术和产业发展。工业和信息化部多年来通过电子发展基金给予语音产业大力支持,并积极推进行业标准制定;科技部在90年代末期就专门设立了智能语音方向的国家863计划成果产业化基地,加大对该领域的技术和产业支持;国家发改委于2009年设立了语音技术国家级企业技术中心,2011年又专门设立了语音及语言信息处理国家工程实验室。



全球智能语音技术发展态势

二、我国智能语音产业发展现状

(一)智能语音交互技术日趋成熟

1.   语音合成技术

随着人们认知水平和需求的提高,语音合成技术经历了从参数合成到拼接合成,再到两者的逐步结合的发展过程。目前,我国语音合成技术已经达到了以下水平:

1)   在中英文取得国际领先水平基础上,多语种合成正在逐步实现世界语言全覆盖;

2)   基于发音模拟技术,可以实现虚拟主持人和针对任意人员的个性化合成服务;

3)   在语音合成技术基础上,结合音乐信号处理技术,推出了全新歌唱合成系统。

语音合成技术原理

2.   语音识别技术

我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上有自己的特点与优势,并达到国际先进水平。目前我国中文大词汇量连续语音识别技术国际领先,在语音输入搜索交互领域突破实用门槛,说话人识别和语种识别技术荣获NIST测试冠军,并在信息安全应用中屡获战果。

语音识别技术原理

3.   语义理解技术

自然语言理解从20世纪60年代初开始研究,由于N.乔姆斯基在语言学理论上的突破和此后各家理论的发展,以及计算机功能的不断提高,已经取得了一定的成果,分为语音理解和书面理解两个方面。在人机对话当中,语义理解是关键技术,将人类的自然语言输入进行分析生成计算机可理解的、统一的结构化表达过程是难度最大的技术环节。目前,我国已经掌握了基于识别合成的语言处理算法,研发出完善的人机交互语义词典和语义理解算法体系;在面向移动互联语音应用方面,率先完成首个达到实用、覆盖衣食住行的中文语义理解系统。


人机对话中涉及的自然语言处理

4.   语音评测技术

语音评测技术是指通过机器自动对语音进行发音水平评价、检错,并给出纠正指导的技术,语音评测中涉及人工智能领域的部分,一直是业界的难点。不限说话内容、说话人以及说话环境的高性能语音识别技术需要巨大的计算量,目前只有通过大量服务器并行处理才能完成。我国语音评测技术发展迅速,已经接近国际先进水平。

目前,我们已经在语音识别技术体系的基础上,建立了完善的语音评测技术框架。特别是音乐评测方面,是唯一精确反应音准、节奏和歌词的演唱准确程度的技术。科大讯飞具有独家实用的中文口语评测技术。科大讯飞口语评测技术是唯一通过国家语委鉴定达到实用水平的口语评测技术,目前已经广泛应用于普通话口语评测、中高考口语考试等多个重要领域。

语音评测技术原理

(二)移动互联网带领我们走入“语时代”

1.   移动互联网时代到来

近年来,随着移动智能终端的普及,移动互联网时代已经来临。摩根士丹利发布的《移动互联网报告》认为移动互联网周期是50年来的第5个新技术周期,手机上网的增长势头将超过电脑上网。《报告》认为移动互联网用户的增长速度超过了桌面互联网,并将在未来5年超过电脑上网用户。3G技术、社交网络、视频、IP电话以及移动设备这五项基于IP的产品和服务正在增长和融合,并将支撑移动互联网迅猛增长。


移动互联网时代来临
数据来源:摩根士丹利

2.   扑面而来的“语时代”

移动互联网时代的到来为智能语音交互带来了新的发展契机,语音应用爆发需要的条件已经逐步成熟,主要体现在:

1)   关键技术持续进步,达到实用门槛;

2)   智能终端、无线网络、云计算平台等环境条件基本完备;

3.   “语时代”语音产业特点

1)   “云+端”方式最大限度地利用资源的组合优势,形成应用能力的突破;

2)   国际产业巨头借助软硬件一体化优势意图实现垄断,形成巨大竞争压力。谷歌发布基于Android系统的Nexus手机和平板,苹果发布基于iOS的iPhone,微软的Windows Phone;

3)   国内产业突破需要借助产业集群的整体创新,依靠产业链集体智慧对抗垄断;

4)   语音交互的无处不在以及云计算提供方式使移动互联语音信息安全问题突显。

随着语时代的到来,越来越多的厂商纷纷推出语音产品抢占产业发展制高点,语音交互的终端和应用不断涌现。苹果的Siri自推出以后,收到了用户的高度关注;微软的新版Tellme将实现人机语音交互,用于Windows8及下一代Windows Phone系统中;一直以来致力于占领Android的谷歌也推出在iOS上运行的Google Search,和苹果开始正面竞争;科大讯飞“语音云”自2010年10月发布以来用户已经达到10000万。

三、语音产业发展热点

随着越来越多的厂商开始关注智能语音交互技术,语音产业发展前景广阔。展望未来,语音产业发展将重点集中在以下几个方向:

(一)汽车电子方向

包括以语音应用为亮点的“能听会说”的车载导航、车载多媒体等终端产品。预计到2017年新增的车载导航及汽车多媒体设备都有语音需求,按40%的中高端车型标配预计,将有1200万台需求;后装导航设备到2017年销量将达800万台;总市场规模达600亿元。

(二)智能电视方向

主要是指以语音应用为亮点的智能电视。目前如TCL、海信、长虹、康佳、创维、海尔等均已开始采用智能语音交互技术作为智能电视主要交互手段。预计到2017年中国电视销量将达6000万台,其中智能电视比例超过4000万台,而智能语音电视的比例可达50%以上,总市场规模达1000亿元。

(三)智能语音家电方向

主要是指以语音应用为亮点的智能语音家电。目前,格兰仕、美的、格力、海尔、海信等均开始采用智能语音技术。预计到2017年国内微波炉年销量3000万台,配置语音功能的900万台;空调年销量8000万台,配置语音功能的1600万台。

(四)智能语音手机方向

目前,联想、华为、中兴、金立、步步高等都推出了智能语音手机。预计到2017年智能手机将达到2亿部,国产手机销量达8000万台,市场规模将达到800亿元;其中老人及少年儿童手机约占15%左右,年需求量接近3000万台。

(五)呼叫中心行业应用方向

特指呼叫中心客户服务、业务受理、电话营销等应用及服务外包。目前该技术已在电信、金融、政府等行业成功应用,华为、Avaya、Genesys等业界主流平台厂商纷纷采用智能语音技术。2011年中国呼叫中心市场投资达到701亿元,年复合增长率16%左右,预计到2017年市场投资将达到1708亿元。

(六)教育与文化方向

主要是指采用智能语音技术的课堂教学、考试及个人学习产品,以及文化、动漫类产品。采用智能语音技术的考试已在全国普通话等级考试、江苏中考和广东高考英语口语考试中成功应用,并正向全国推广。目前全国有269万个班级,1.5亿学生,面向中小学的教学产品和面向个人的考试及学习产品,市场总规模超过400亿元。

(七)移动互联网方向

主要指移动互联网语音交互信息入口及基于智能语音技术的各种移动互联网特色应用。目前,多家厂商开始提供语音云服务,各种接入语音应用的APP接近一万家。预计到2017年移动语音入口服务市场规模超过100亿元,与语音交互相关的游戏娱乐类、移动社交类、生活服务及电子商务类产品的市场规模超过300亿元。

(八)智能语音玩具方向

包括各类使用语音技术的智能玩具。目前,群兴玩具、奥飞动漫、星辉车模、美业玩具、锋源玩具等全部推出智能语音玩具,在玩具销量降低的大背景下智能语音玩具逆势上扬。目前我国玩具消费正以每年30%~40%的速度增长,预计到2017年玩具市场规模达2000亿元,按20%的比例估算,至2017年带语音功能的玩具市场规模可达400亿。

(九)信息安全等其他方向

智能语音技术在国家安全、机器翻译、机器人、智能建筑和家居等其他诸多领域具有广阔的应用前景。目前已广泛应用于机器翻译、机器人等方向。在机器翻译、自然语言理解等领域已有一些成熟技术,需要与应用需求相结合,以实现规模产业化。

(安徽科大讯飞科技有限公司副总裁   胡郁)

其他系列文章:
科大讯飞必读1:我国智能语音产业发展概况分析
网页链接

科大讯飞必读2:我国智能语音市场竞争格局分析
网页链接

科大讯飞必读4:关于智能语音产业若干问题的思考
网页链接

科大讯飞必读5:中美两大对手科大讯飞与Nuance对标分析
网页链接

科大讯飞必读6:语音产业专利的分析与思考
网页链接

科大讯飞必读7:智能语音人机交互产业链及关键技术分析
网页链接

全部讨论

suifengfu
2014-02-08 21:31

学习

一夜疾行
2014-01-30 00:01

讯飞研究3

女神1512
2013-12-15 17:06

语音时代到来了!

Dartagnan有为
2013-11-22 14:03

胡郁副总这么强调语音带动的产业产值,那讯飞的语音在实际过程中可以收益多少呢? 2000万台智能电视,1000亿产值,讯飞能捞多少,这是个问题啊

PHP网站源码南山网站优化按天收费松岗高端网站设计西乡网页制作平湖网页制作双龙百度标王龙岗网络营销深圳设计公司网站木棉湾网站优化推广广州建站爱联百度seo大浪SEO按天计费松岗网站改版观澜网站制作设计坪山百姓网标王南山seo网站优化南山网站推广工具坂田seo吉祥企业网站设计东莞网站优化推广石岩网站优化按天收费惠州企业网站制作塘坑营销网站龙华网站建设设计福永标王坂田网站推广工具横岗优秀网站设计布吉企业网站建设盐田外贸网站制作布吉设计网站大运网站搭建歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化