杭州2017年2月14日电 /美通社/ -- 在2月12日“2017 Kubernetes Meetup 中国”开幕典礼暨“2.12上海站”活动中,才云发布了全球首个 TensorFlow as a Service (TaaS) v1.0.0 深度学习平台。
谷歌深度学习框架 TensorFlow 自2015年11月开源以来受到了学术界和工业界的广泛关注。然而要将 TensorFlow 真正地应用于生产环境中仍然存在很大的挑战。为了进一步降低 TensorFlow 的使用门槛,才云(caicloud.io)早在 2016 年4月即发布国内首个基于容器集群的分布式深度学习 TensorFlow 系统 Clever,于2月12日正式发布产品 TensorFlow as a Service (TaaS) v1.0.0 商用版。
TaaS v.1.0.0 包括支持 CPU 和 GPU 的分布式 TensorFlow 模型训练平台和 TensorFlow 模型托管平台。通过将 TensorFlow 与谷歌开源的容器云平台管理工具 Kubernetes 结合, Caicloud 提供的 TaaS 服务解决了 TensorFlow 在使用中学习成本高、管理难、监控难、上线难等问题,旨在帮助企业更快、更容易地体验和应用最新深度学习技术。 Caicloud 作为国内首家提供商用分布式 TensorFlow 解决方案的云平台,将引领大数据市场发展的新潮流。
谷歌深度学习框架 TensorFlow
TensorFlow 在谷歌内外都已经得到了广泛的应用。
在谷歌内,语音搜索、广告、电商、图片、街景图、翻译、 YouTube 等众多产品之中都有基于 TensorFlow 的系统。AlphaGo 的开发团队 DeepMind 也正式宣布其开发的系统将全部基于 TensorFlow 。
在谷歌外,优步(Uber)、Snapchat、Twitter、京东、小米等国内外科技公司也加入了使用 TensorFlow 的行列。在短短的一年时间内, TensorFlow 在开源社区 Github 上的活跃度已远超 Caffe 、MXNet 、Torch 、Theano 等其他开源深度学习工具。
TensorFlow 生产化的难点
虽然 TensorFlow 在众多大型 IT 公司已得到了广泛的使用,但在广大的中小型 IT 企业以及传统企业中,要将其应用于生产环境却仍然存在挑战。
在单机环境下,即使使用目前先进的 GPU 都无法满足训练大型深度学习模型的计算量要求。
而在集群环境下, TensorFlow 存在高门槛、难配置、难管理等问题。分布式 TensorFlow 也不支持多用户管理,在多用户同时使用时存在资源和权限分配等问题。
Caicloud 解决方案
为了让更多企业能够享受到 TensorFlow 带来的人工智能技术革新,Caicloud 提供了产品 TensorFlow as a Service (TaaS) v1.0.0 来搭建企业版的 TensorFlow 平台。
TaaS 可以帮助企业更好的管理分布式 TensorFlow 的模型训练过程,并一键上线训练好的 TensorFlow 模型。下表对比了原生态分布式TensorFlow和Caicloud TaaS 平台的差异:
目前,Caicloud 已经将 TaaS 实际应用于很多大数据项目中,并对外提供企业级大数据解决方案服务。
虽然 TaaS 可以极大程度降低企业使用 TensorFlow 的门槛,但为了进一步帮助企业节约研发投入,直接享用深度学习技术,Caicloud 提供了大数据解决方案服务。Caicloud 通过在深度学习算法和平台上的技术积累,已为安防、电商、金融、物流等多个行业提供大数据服务。
Caicloud 基于不同应用场景,针对性地进行数据分析和模型训练,把大数据融入到各个行业的深层次业务中。通过 TaaS 平台,Caicloud 大数据解决方案可以更有效地利用海量数据,从而更多地挖掘数据中的价值。在一些实际问题中,通过 TaaS 平台训练得到的模型可以成功地将正确率提升 80%。
TaaS分布式模型训练平台先睹为快
提交训练任务界面:
任务监控界面:
启动 TensorFlow Serving:
通过界面调试API:
才云计划将在 2017 年 3 月底发行 TaaS 的下一个演进版本 v.2.0.0。除了 TaaS 私有云产品进一步加强外,未来还将有邀请制公有云内测版本,欢迎密切关注。如有业务需求,欢迎垂询:info@caicloud.io