使用以下方式,将便于您了解更多

售前咨询: 400-0731-177

k8凯发的售后服务: 400-0731-777
                   0731-82848888

行政总机: 0731-82735268

百度免费开放语音识别技术 构建便捷开发生态 -k8凯发

打印    字体大小
时间:2013年09月10日

2013年8月22日百度世界大会上,百度宣布语音识别技术及能力全面开放。此举为开发者提供了多层次的语音接口,将催生这一领域的蓬勃发展。在百度的引领下,围绕语音识别的全新体系和大数据生态将在不久的未来初露峥嵘。

过去的一年时间里,语音交互类应用并未像触控、手势识别等一样得到广泛的普及和应用,根本的原因有两个:一是语音识别准确率有待提升,尤其是技术对不同语言的支持,存在较大的差别;二是语音识别技术门槛较高,有一定的授权费用,阻碍了技术在应用端的落地。种种难题使得国内开发者在语音识别领域步履维艰,只有百度、腾讯等巨头互联网公司在相关的研发方面有所建树。

近一年来,百度在语音识别领域不断取得突破性进展,早已确立了其行业领先的地位,2013年百度世界大会上语音识别技术及能力的开放,更是实现了百度从“行业领跑者”到“生态构建者”的转型。

突破语音识别的瓶颈

百度云语音技术负责人贾磊在百度世界大会上表示,百度语音识别技术、引擎在识别准确率上获得了突破性进展,运用深度神经网络(dnn:deep neural network)技术和自然语言处理技术nlp,使语音技术准确率提升了25%,用户体验得到大幅度优化。除了降低了错误率,百度语音助手在速度上也有大幅提升。不考虑网络环境,识别和响应速度提高了30%。

 

百度语音助手团队获得2013年百度summer party

目前,dnn技术已成为新一代语音识别的“主导者”。正因为这一点,百度语音助手开发团队在今年的角逐中脱颖而出,打破了该奖项始终被商业营销产品“垄断”的惯例。

三个层次,全面开放

与同类语音识别技术以授权费方式获取收入的传统方式不同,百度将面向开发者无条件开放整个语音生态系统。

而语音生态系统的开放包括三个层次,一是底层的语音识别技术api的开放,囊括了合成技术、理解技术、认证技术、指纹技术等,开发者可以调用api接口实现语音识别功能;二是百度语音助手sdk,提供开发工具包,实际上是对语音识别标准化服务进行封装,识别结果做关键词抽取,搜索结果进行结构化数据返回,对接服务和应用。这一点是对应用开发者具诱惑力的;第三点则是面向能力弱的开发者,百度语音助手直接安装在硬件上即可。

底层语音识别api,只有实力强的开发者具备。相比,第二层所释放的能量会更大,因为涵盖的范围更广泛,周边信息分类查询和导航功能,公交路线查询和导航,到站提醒、自动报站、盲人步行路线自定义、管理和导航,以及外部的旅游、餐饮、购物等几乎能想象到的场景,都可以封装成模块、组件,让开发者轻松调取,百度语音技术开放的原则,也从一个技术、工具真正过渡到包罗万象的语音识别应用生态,未来会接入更多的第三方应用,实现能够容纳从衣食住行到人的生活方方面面真正的助手。

全国服务热线(免长途费):400 0731 177

立即免费人工咨询

您的电话:

温馨提醒:
手机请直接输入:如1358888****
座机前请加区号:如0731-8833****
我们已对本次通话全程加密,您的通话费用我们已经帮您支付,请放心接听!
网站地图