导航| 欢迎访问商讯网
软件与服务
当前位置: 商讯网 > 软件与服务 >

捷通华声智能语音 灵云“云+端”服务全中国


投稿: admin  2013-10-18 08:33:20  来源: 论坛 我要评论(0 ) 访问次数 

  <编者按>: 云计算、 大数据、 移动互联网、人机交互……短短一两年时间内,IT产业像经历了一场大洗牌,创新一词已显老旧,跨界、颠覆成为流行词。国内以BAT为代表的传统 互联网巨头开始猛攻移动互联网,并购、兼并层出不穷,相互疆域犬牙交错,进攻防守犹如一场“军阀混战”。电子市场的重心也迅速由PC端迅速转移到智能移动终端,移动互联网已成兵家必争之地。如此让产业兴奋又让产业颤抖的时代,智 能人机交互(HCI)技术也终于迎来了有史以来最好的阶段,而该HCI领域中的语音交互技术则迎来竞争最激烈的发展时期!

  纵观国内外移动互联网发展态势,各项炒得火热的技术中,大数据、智能人机交互技术(简称HCI)并列前茅!从 苹果Siri的语音交互技术到 谷歌眼镜的图像识别技术,从 智能手机大战延伸至智能电视,无一不在说明在移动互联网时代,IT整个行业都在发生由量到“智”的聚变,语音交互、图像识别、语义理解、 生物识别……HCI技术风靡全球!

  两年前,苹果的Siri一鸣惊人,带动智能语音产业进入发展最快的时期。十几年来一直控制国内中文语音合成技术市场的捷通华声、科大讯飞发力语音识别技术; 百度、搜狗、 腾讯为守住入口,凭借天然优势,重金砸出最高水平的语音识别技术;中科信利、云知声等老牌、新秀语音 企业,迎来难得发展机遇期。国内语音识别技术力量集体爆发,让美国本来在语音识别技术上领先的Nuance、 Google、 微软风光不在,语音识别技术群雄割据的时代已然来临,鹿死谁手好像尚不得而知。

  “语音识别、合成”双剑合璧,智能语音展露锋芒

  其实语音识别这个技术很早就有,虽然并不成熟。上世纪90年代末, IBM推出的“Viavoice”就号称能“解放双手”,帮助让人们实现文字录入语音化。然而,伴随全民汉字输入能力的提高,“Viavoice”因语音识别率不高,加上口音、噪音的影响,黯然离场。

  近年来,互联网、移动互联网的迅猛发展,带动大数据量的形成;国内外潜心研究的一代代科学家攻克了无数技术上的难题,大数据又为其提供了丰富的训练语料;开源技术更是促进了技术跨越国境的交流共享,大大降低语音识别技术门槛;智能移动终端功能、性能的超常规提升,为对硬件环境要求高的语音识别技术创造了“运转”的硬件环境;所有的变化汇集一处,让人们梦寐以求的“自由说”语音识别技术成为现实。

  如果说语音识别技术是“说”,那么语音合成技术就是“听”,“能说会听”形成了语音交互—智能语音的完整概念。也许是巧合,语音交互技术的发展,如同人都是“先学会听,才学会说”的进步过程,语音合成早在十年前就完成了商品化进程,人们也早已经生活在语音合成—“机器说话”服务无处不在世界里;

  应该说,苹果的Siri的适时出现,为智能语音产业发展做出了巨大贡献,其贡献在于打开了智能语音应用市场的畅想“天窗”;虽然,当CNN公布Siri的配音者是演技派“大妈”时,导致“调 戏”过Siri的众网友“泪流满面”,却也让大众全方位感受到智能语音交互的魅力与力量。正如同两把利剑,语音识别技术的进步,使得语音合成、识别双剑合璧,为产业、大众打开了智能语音服务的新世界。也让越来越多的设备、软件厂商看到了智能语音应用的 广阔前景,智能语音交互技术终于在移动互联网时代展露锋芒。

  2013年,互联网搜索巨头百度,尽管已拥有了最先进语音识别技术,但正是深刻理解把握了智能语音应用的真谛,果断投资捷通华声,在其发展移动互联网进程中以最快的速度摆脱智能语音曾经的束缚,放手在移动互联网天地开疆破土,攻城拔寨!

  捷通华声灵云演绎完美智能语音 人机交互前景明朗

  中国智能语音的产业化进程起步于世纪之初,捷通华声、科大讯飞、NUANCE一直是中国最主要的语音技术供应商。十几年来,不同于喜欢“高打高唱”的科大讯飞,也不同于“习惯骄傲”的Nuance,由清华大学毕业的几位同学创办的捷通华声似拥有“清华遗风”,一直保持务实低调的风格。尽管捷通华声公司因过于低调不为大众所详知,但捷通华声的语音技术务实却从不“低调”,十几年的专注与技术积累,让捷通华声语音合成技术可谓“炉火纯青”,语音播报服务从纵贯中国的高铁到各大飞机场;从各个医院语音叫号到各地长途汽车站;从各大银行声讯服务到各领域企业呼叫服务中心……自2000年到今天,捷通之声已“高调”服务中国十三亿大众十三年之久。

  这两年来,语音界老牌新秀企业、国内国外企业、跨界巨头集体猛攻语音识别,一时间智能语音概念铺天盖地,语音产业则风起云涌,捷通华声表面不为所动,而是以“老虎打盹你以为我是病猫”的沉着与强大实力,悄然在2011年,推出全球第一个全方位智能人机交互能力云服务平台—灵云(hcicloud.com),从HCI产业高度,将语音云服务等各种单一HCI技术能力云服务轻松纳入灵云体系。

  灵云-hcicloud已从一个简单 域名概述了灵云的设计与发展理念。灵云的构建不再局限于语音云服务等某一单一HCI技术,而是一种可以用语音、手写、拍照,手势,将来甚至脑波识别等智能手段来操作、感知 手机、计算机等数字设备的网络云服务。捷通华声期望从更宽广的角度促进HCI技术产业发展,从更完整的视野推动智能语音的服务与产业应用。智能语音交互是最重要的人机交互手段,但正如同每一个人与其他人沟通,都不是只是靠说话完成交流,文字书写、图像、情感表达都是交流的组成部分,伴随HCI技术的全面发展,人们会根据场景的变化去选择最合适的HCI技术实现人与机器的自然交流。

  其实,捷通华声“低调“的本质是尊重合作伙伴,捷通华声多年来始终坚持让合作伙伴的产品出名而从不“喧宾夺主”,灵云则承继这一传统并将这一理念通过与合作伙伴的技术融合推向更加完 美的境界。百度语音识别与灵云语音合成完美结合,助力百度地图、百度导航掀起导航革命;搜狗语音识别与灵云语音合成更是精心设计,支持搜狗地图在导航领域独占一方霸主地位;独树一帜与拥有独特发展理念的导航犬,全面应用灵云语音识别、语音合成、语义理解、语音唤醒等功能,双方开发团队如同一个企业,日夜奋战在一起,为数以千万的用户推出一项项精心设计的导航犬经典服务。

  灵云如同天空之云,静悄悄融入中国IT产业的生态环境,“低调”完美演绎智能语音等HCI技术能力服务,“高调”为所有合作企业的经典产品与市场进步而喝彩!

  阐述智能语音概念,灵云首创“云+端”人机交互服务模式

  站在产业中企业的角度,每个企业的设备不同、性能不同、应用网络环境不同,应用HCI技术创新“智”造过程中,如有更多的选择,就能更好的满足大众用户;站在用户的角度,每个人都希望全面享受智能语音等HCI技术最好的服务,却不希望受到网络环境等因素及付出“高昂”费用。为顺应并满足企业与用户需求,灵云“舍弃”云端服务可以获取所谓宝贵数据资源与用户资源等利益,率先推出灵云“云+端”服务模式。合作企业可根据设备与应用网络环境自由选择或让用户自由选择,保证每一个产品都有与众不同的特色,从而让数以亿记的大众轻松享受智能语音等HCI技术能力的服务。

  智能语音很热,应用也很广,灵云凭借捷通华声十几年的功底,语音合成“端”播放已轻松自然,并可让合作伙伴选择适合与自身应用的多种声音;而语音识别因其对硬件资源的特殊要求,实现“端”识别对技术提出更高的要求,灵云离线式“端”识别以识别率高,定制简单等多种方式,与灵云语音合成一起为用户提供完整的智能语音“云+端”服务。

  智能语音的目标是完成完整的语音交互,针对不同的噪音环境,其实还需要一项技术来让机器更好“读懂”用户的意图,确保语音识别率。这个技术就是语义理解,灵云语义理解可对输入语音的语义进行分析,保证识别率的同时,也确保语音合成播报使用者需要获得的准确信息。捷通华声灵云在此基础上,近期又推出“语音唤醒”功能,并成功应用于各种APP,导航犬应用灵云智能语音各项技术,可以在终端待机状态瞬间唤醒导航软件,并且以智能自然发声应答用户提问,全程无需保持开机状态,各种环境下语音识别精度达到96%以上,旅途中的用户与开车中的司机想去什么地方动动嘴就行,轻松省心又方便。

  灵云“云+端”自推出以来,迅速为产业所接纳,不仅在导航领域,百度语音助手、搜狗语音助手、聚熵360、南京米果、虫洞语音助手等系列语音助手软件;天行输入法、百度输入法、触宝输入法、也包括“汉字英雄”、汉字书写大赛更是将智能语音、智能图象“云+端”及其合作模式,超乎想象地完美应用,服务智能手机用户已达数亿之众。

  灵云愿景支持企业共同服务亿万大众,HCI回归纯朴自然

  智能人机交互技术(HCI)帮助人们更方便地与机器进行交流,包括语音交互、图像识别、生物识别等,几十年来,因HCI技术的难度大,一直呈现螺旋式进步发展趋势;但大众对方便、高效的追求与渴望,及在凡事都要快的移动互联网时代成为推动HCI技术进步的巨大力量。

  移动互联网时代,智能语音、智能图像、智能客服、包括生物识别等技术产业蓬勃发展,而推动HCI技术迎来发展的巨大机遇的真正力量依然是来自IT产业发展与全社会的进步。如今,智能语音概念如日中天,各种“互联网入口说、关卡壁垒说、大数据说、资本说”等各种说法风靡IT产业。冷静地想:如果智能语音是互联网入口,那么 手写识别、拼音录入是不是入口?如果说智能语音技术高不可攀,那么百度、腾讯、搜狗等十几家非专业语音公司1-2年“轻松”拿下语音识别技术,哪里还有什么技术壁垒?如果说资本市场会爆发,美国Nuance公司十几年兼并了几乎除中国企业外所有的语音技术公司,拥有几乎全世界所有国家的多语种智能语音交互技术,资本说在纳斯达克也跟着期盼了快二十年。如果说那家声音数据采集多,那么谁家的语音数据又能够超过腾讯的微信、三大运营商的语音数据?

  其实不管怎么说,还应增加一个概念就是“工具说”,因为无论什么时候,智能语音最主要的核心功能还是一个声音录入与输出的工具。无论今天还是未来发展,就像生活中没有任何一种力量不让大家说话交流一样,智能语音在充分满足了大众的好奇之后,依然会象无数为语音技术发展进步做出巨大贡献的科学家、学者、工程师一样,安心提高语音识别准确率、语音合成自然度,回归到自然与纯朴。

  相信未来发展,HCI技术依然会呈现螺旋式进步趋势,无论智能语音、还是智能图像,只有更好,没有最好!合作共赢将成为HCI产业融入中国乃至世界IT产业的主 旋律。捷通华声灵云已开始为产业界提供语音识别、语音合成、手写识别、OCR、语义理解、机器翻译等多项HCI技术能力。未来发展中,灵云将在发挥自身多项HCI技术优势的基础上,不断与学术界、产业界合作,推出更多的HCI技术能力,灵云的目标永远是助力中国信息产业,让人机交互像人与人沟通一样的简单自然,一起智创中国梦,慧及全球心!

  更多详情请登陆,灵云智能人机交互技术免费试用入口:http://www.hcicloud.com

分类: 软件与服务   关键词多媒体
分享到:  
20.9K
栏目导航
热门标签
图片推荐