北京2022年6月20日 /美通社/ -- 近日,亚马逊云科技推出Amazon Redshift流式注入(Streaming Ingestion)功能预览,让客户能够直接从Amazon Kinesis Data Streams(一项无服务器流式数据服务,可简化任何规模的数据流捕获、处理和存储)向Amazon Redshift数据仓库中注入实时数据并分析。Amazon Redshift流式注入功能可以让客户无需在Amazon Simple Storage Service(Amazon S3)中暂存数据,直接将每秒数百兆的流数据接收到Amazon Redshift数据仓库集群并处理。Amazon Redshift流式注入(Streaming Ingestion)功能的推出,进一步提升了亚马逊云科技实时数据处理能力,为亚马逊云科技"云、数、智三位一体"的大数据与机器学习融合服务组合的数据处理能力再添利器,将进一步推动机器学习由实验转向规模化落地。
在游戏实时数据分析、在线广告点击流分析、零售POS机数据流分析、应用日志和网络日志分析、物联网设备数据分析等应用场景中,应用或者终端设备会在短时间内持续生成巨量数据流。这些数据流会被送到Amazon Kinesis Data Streams进行实时缓存并最终使用Amazon Redshift完成数据分析。以往,客户如果想从Amazon Kinesis Data Streams向Amazon Redshift注入实时数据,需要先在Amazon S3中暂存数据,然后使用Copy命令加载数据来构建数据管道,这一过程通常需要几分钟才能完成。但越来越多客户希望能够分析实时数据流以尽早获得数据洞察。
Amazon Redshift流式注入功能的推出,满足了客户真实数据流对数据处理规模和实时性的要求。基于这一功能,客户可以同时连接来自多个Amazon Kinesis Data Streams的数据,将实时数据直接注入Amazon Redshift。客户使用现有工具和熟悉的SQL执行下游处理和转换,无需额外的成本,在几秒钟内从数据中获得洞察。Amazon Redshift流式注入大幅简化流式数据管道构建,加速数据处理,支持以低延迟、高吞吐量访问数据仓库中的实时数据,帮助数据工程师、数据分析师和大数据开发者将数据分析从"批量"转向"实时"。
目前,数以万计的客户每天使用Amazon Redshift处理EB级的数据,为高性能商业智能(BI)报告、仪表板应用程序、数据探索和实时分析等分析工作负载提供支持。Amazon Redshift流式注入功能的推出将进一步丰富客户的使用场景。客户可将流式数据实时分析与数据仓库中的其它数据源相结合,丰富和扩展实时分析应用场景。例如,游戏运营人员可以分析来自游戏玩家的实时数据,优化游戏体验,提高转化和留存率;营销部门可以分析在线广告的点击流数据,评估用户足迹和行为,及时向客户投放广告;分析人员可以实时分析零售POS数据,实现零售交易的实时报告、分析和可视化;开发人员和工程师可以实时分析应用程序日志和网络日志流数据,实时排除故障,采取预防措施,改善产品体验。客户可以将Amazon Redshift流式注入功能与Amazon Kinesis服务一起使用,实时分析IoT数据,获取设备状态和属性(位置和传感器数据),监控应用程序,进行欺诈检测,实现实时排行榜功能等等。
为了帮助企业推进大数据和机器学习的融合,将机器学习由实验转为规模化落地实践,亚马逊云科技推出了"云、数、智三位一体"的大数据与机器学习融合服务组合。Amazon Redshift流式注入功能的推出,进一步丰富了亚马逊云科技无服务器分析产品服务不同客户业务场景的能力,可以让客户无需配置、扩展或管理底层基础设施,即可轻松地处理实时动态的数据同步,为机器学习项目提供兼具性能和成本效益的实时特征数据准备。