百度免费开放语音识别技术 构建便捷开发生态 -k8凯发
打印 字体大小
时间:2013年09月10日
2013年8月22日百度世界大会上,百度宣布语音识别技术及能力全面开放。此举为开发者提供了多层次的语音接口,将催生这一领域的蓬勃发展。在百度的引领下,围绕语音识别的全新体系和大数据生态将在不久的未来初露峥嵘。
过去的一年时间里,语音交互类应用并未像触控、手势识别等一样得到广泛的普及和应用,根本的原因有两个:一是语音识别准确率有待提升,尤其是技术对不同语言的支持,存在较大的差别;二是语音识别技术门槛较高,有一定的授权费用,阻碍了技术在应用端的落地。种种难题使得国内开发者在语音识别领域步履维艰,只有百度、腾讯等巨头互联网公司在相关的研发方面有所建树。
近一年来,百度在语音识别领域不断取得突破性进展,早已确立了其行业领先的地位,2013年百度世界大会上语音识别技术及能力的开放,更是实现了百度从“行业领跑者”到“生态构建者”的转型。
突破语音识别的瓶颈
百度云语音技术负责人贾磊在百度世界大会上表示,百度语音识别技术、引擎在识别准确率上获得了突破性进展,运用深度神经网络(dnn:deep neural network)技术和自然语言处理技术nlp,使语音技术准确率提升了25%,用户体验得到大幅度优化。除了降低了错误率,百度语音助手在速度上也有大幅提升。不考虑网络环境,识别和响应速度提高了30%。
百度语音助手团队获得2013年百度summer party
目前,dnn技术已成为新一代语音识别的“主导者”。正因为这一点,百度语音助手开发团队在今年的角逐中脱颖而出,打破了该奖项始终被商业营销产品“垄断”的惯例。
三个层次,全面开放
与同类语音识别技术以授权费方式获取收入的传统方式不同,百度将面向开发者无条件开放整个语音生态系统。
而语音生态系统的开放包括三个层次,一是底层的语音识别技术api的开放,囊括了合成技术、理解技术、认证技术、指纹技术等,开发者可以调用api接口实现语音识别功能;二是百度语音助手sdk,提供开发工具包,实际上是对语音识别标准化服务进行封装,识别结果做关键词抽取,搜索结果进行结构化数据返回,对接服务和应用。这一点是对应用开发者具诱惑力的;第三点则是面向能力弱的开发者,百度语音助手直接安装在硬件上即可。
底层语音识别api,只有实力强的开发者具备。相比,第二层所释放的能量会更大,因为涵盖的范围更广泛,周边信息分类查询和导航功能,公交路线查询和导航,到站提醒、自动报站、盲人步行路线自定义、管理和导航,以及外部的旅游、餐饮、购物等几乎能想象到的场景,都可以封装成模块、组件,让开发者轻松调取,百度语音技术开放的原则,也从一个技术、工具真正过渡到包罗万象的语音识别应用生态,未来会接入更多的第三方应用,实现能够容纳从衣食住行到人的生活方方面面真正的助手。
全国服务热线(免长途费):400 0731 177
立即免费人工咨询