国内首个深度学习开源平台百度paddlepaddle来了!-k8凯发
打印 字体大小
时间:2016年09月27日
目前在整个百度业务体系内,人工智能的应用程度已越来越高,从语音技术到图像识别、自然语言理解再到用户画像,百度业务的技术含量正在不断向更高峰冲击。
近日,百度宣布其全新的深度学习开源平台paddlepaddle在开源社区github及百度大脑平台开放,供广大开发者下载使用。百度成为继google、facebook、ibm后又一个将人工智能技术开源的科技巨头,同时也是国内首个开源深度学习平台的科技公司。
纵观国际,谷歌于去年11月发布并开源了新的机器学习平台tensorflow,供相关技术人员进行语音识别或照片识别等多项机器深度学习领域的研究;ibm几乎同步采取了行动,于去年11月底宣布通过apache软件基金会免费为外部程序员提供system ml人工智能工具的源代码;社交巨头facebook,继去年1月公开多款深度学习人工智能工具后,又于去年12月开源了big sur人工智能硬件架构。
paddlepaddle的前身是百度于2013年自主研发的深度学习平台paddle(parallel distributed deep learning,并行分布式深度学习),且一直为百度内部工程师研发使用。
全球各大科技巨头开源的深度学习平台都极具各自技术特点,对于百度,由于其自身在搜索、图像识别、语音语义识别理解、情感分析、机器翻译、用户画像推荐等多领域的业务和技术方向,paddlepaddle则表现更加全面,是一个相对全功能的深度学习框架。
今年9月1日百度世界大会上,百度首席科学家andrew ng(吴恩达)首次宣布将百度深度学习平台对外开放,命名paddlepaddle。
目前,paddlepaddle已实现cpu/gpu单机和分布式模式,同时支持海量数据训练、数百台机器并行运算,以应对大规模的数据训练。此外,paddlepaddle具备高质量gpu代码,提供了neural machine translation、推荐、图像分类、情感分析、semantic role labelling等5个task,每个task都可迅速上手,且大部分任务可直接套用。
百度资深科学家、paddlepaddle研发负责人徐伟介绍:“在paddlepaddle的帮助下,深度学习模型的设计如同编写伪代码一样容易,设计师只需关注模型的高层结构,而无需担心任何琐碎的底层问题。未来,程序员可以快速应用深度学习模型来解决医疗、金融等实际问题,让人工智能发挥出大作用。”
paddlepaddle研发负责人徐伟
目前,paddlepaddle已在百度30多项主要产品和服务之中发挥着作用,如外卖的预估出餐时间、预判网盘故障时间点、精准推荐用户所需信息、海量图像识别分类、字符识别(ocr)、病毒和垃圾信息检测、机器翻译和自动驾驶等领域。
以外卖行业为例,外卖员等待商家出餐的时间耗时严重,百度将不同时段商家的客流量、菜品的制作时间和订单量等数据交给了paddlepaddle,经过对海量数据的深度学习处理,如今,百度外卖的内部系统可以预估每个商家菜品出餐时间,及时告知外卖员,提高了送餐效率,系统也可以更加合理地规划取餐和送餐的路线。
早在今年1月份,百度便将可让人工智能软件运行更高效的关键代码warp-ctc开源。该代码可直接用在当前的人工智能框架中,不仅比传统ctc训练速度快百倍,还大幅降低了对硬件的要求,缩短了研发的周期,让端到端的深度学习变得简单、快速。
据了解,9月底百度还将发布paddlepaddle的新版本,将全面支持mac操作系统、以及cuda8.0和gcc5.4的支持,同时进一步优化了安装过程,帮助更多开放者更好地“上手”。
百度作为一家技术导向型公司,多年来,一直致力于从技术进步中获取价值。未来,百度还将开放更多在深度学习、人工智能等方向的技术成果,供全球开发者使用,充分发挥科技公司领军作用,推动人工智能技术快速普及。
全国服务热线(免长途费):400 0731 177
立即免费人工咨询