北京2015年8月25日电 /美通社/ -- 企业级基础云服务商青云QingCloud日前宣布,Spark服务作为QingCloud大数据基础平台的重要组件现已正式上线。通过QingCloud Spark服务,用户能够在2-3分钟内创建一个Spark集群,并支持横向和纵向的在线伸缩,提供丰富的监控告警服务,极大地简化了大数据集群的运维和管理,让用户从繁重的运维工作中解脱出来,投入到业务创新中。
数据是新一代的自然资源,是判别企业竞争力的试金石。然而,随着数据量的爆炸式增长、数据来源和结构的多样化,传统IT基础架构已无法满足企业对数据处理的需求,Hadoop、Spark等支持PB级别数据的分布式存储和分布式计算框架应运而生。
青云QingCloud系统工程师&大数据基础平台负责人周小四(Ray Zhou)表示,基础架构是大数据应用的基石,如果没有底层数据架构的支持,大数据就是纸上谈兵。此次推出的Spark服务就是基于QingCloud稳定高效、资源秒级响应、弹性可伸缩的IaaS之上,能够较大限度地发挥Spark轻巧、灵活和快速的优势。
Spark 是继Hadoop之后新一代的大数据分布式处理平台。它是一个基于内存的、容错型的分布式计算引擎。与Hadoop MapReduce相比,Spark的计算速度要快100倍。即便同样采用硬盘计算,Spark也比MapReduce快10倍。Spark卓越的用户体验以及统一的技术堆栈基本上解决了大数据领域所有核心问题,使得Spark迅速成为当前最为热门的大数据基础平台。
Spark 提供了多语言支持,如Scala、Python、Java、R等,支持交互式操作。它在RDD(Resilient Distributed Datasets,一个容错的、并行的数据结构) 基础之上提供了Spark Streaming流式计算,结构化数据处理组件Spark SQL,机器学习库 MLlib 以及图计算GraphX等功能。
具体而言,青云QingCloud提供的Spark服务有如下特征:
青云QingCloud CEO 黄允松(Richard Huang)表示,Spark服务的发布标志着QingCloud完整的大数据基础平台已初步建立,接下来QingCloud还会陆续发布一系列大数据相关服务,如Hadoop、Cassandra、Hive、HBase和Storm等。未来,大数据、数据库、缓存和对象存储将同IaaS组件一起构成QingCloud完整的数据产品生态圈,提供一站式的计算、存储和数据处理服务,更好地帮助用户实现数据的价值。
图片 - http://photos.prnasia.com/prnh/20150825/0861507886
图标 - http://photos.prnasia.com/prnh/20140401/0861402031LOGO