北京2019年7月17日 /美通社/ -- 十年前,预言家提出信息超载的概念。如今,数据正超出预料地呈指数型增长。在今天的广电大数据系统建设领域,采集所有用户的属性、收视、工单、订购、账单、支付、设备运行等数据可以说是一个浩瀚的工程。
广电数据由数据源经过统一的数据抽取和转换平台进行抽取、格式转换、脱敏等操作,由于汇聚了多个源的数据,通常数据量非常大。
面对庞大的数据体量,以及数据挖掘与分析的个性化需求,一套完整的数据治理机制以及具有良好可扩展性的大数据平台成为广电大数据系统建设、构建以数据为关键要素的智慧广电新模式的核心。
曙光广电大数据应用
最近,曙光中标广州珠江数码集团广电大数据运用项目并且实施。依托多年的大数据项目经验,在智慧广电应用上,助力珠江数码实现全方位数据挖掘与分析需求。
珠江数码为华南地区最大规模的广播电视网络运营商之一,用户规模约400万户。面对移动互联网对传统业务带来的挑战和机遇,珠江数码先后完成了4K智能电视业务平台、综合云平台和广电大数据系统的建设。
在此次项目中,曙光以一站式大数据平台、全程可追溯的数据采控模式、灵活的大屏展示、以及与业务贴合的智能算法,实现珠江数码广电数据面向业务应用的全方位分析和挖掘。
广州珠江数码集团股份有限公司在给曙光的感谢信中特别提到:“曙光研发的XData大数据智能引擎发挥其在数据采集、治理、融合、分析、可视化等方面的能力,实现公司数据整个生命周期的全程可追溯,实现收视数据指标的大屏展示,全面提升数据质量,提升数据的可用性,提供科学决策依据,得到了领导高度认可与赞扬。”
曙光XData大数据智能引擎,目前已入选国家《大数据优秀产品和应用解决方案案例集(2019)》。已实现对数据源进行统一存储和检索,为前端应用系统提供丰富的ETL类服务,并支持跨系统数据的分析应用。另一方面,除了支持支持传统关系库、文件、FTP等数据源的可视接入,还可实现数据采集插件的可拓展。
本次建设智慧广电,曙光大数据服务工程团队还有两个方案技术架构值得一提。
第一个是数据共享平台
曙光XData大数据智能引擎是基于微服务架构的多线程、集群化的数据存储、数据计算的平台工具。
为了实现多种存储系统的统一管理,曙光融合分布式文件系统HDFS、数据仓库Hive、分布式数据库Hbase、并行数据库MppDB等,打造了统一接入、统一管理、统一权限的融合存储层;针对不同的计算内容和计算方式,提供内存计算、流式计算、离线计算、图计算等常规大数据计算方式,支持基于Hadoop生态的主流组件,包括MapReduce/Storm/Spark/Spark Streaming/SparkSQL,搜索支持Solr和ElasticSearch、数据可视化平台等,并且可以在此基础上进行扩展升级。
第二个是数据智能应用
数据智能应用包括收视行为分析、精准营销推荐、数据可视化展示等。
收视行为分析和互联网行业用户画像的结合,依据当前用户的收视习惯和用户评论、用户属性、广告点击等信息,完成基于排行榜与用户浏览历史的节目、广告推荐。
精准营销主要是建立用户档案,为业务部门提供精准化营销、用户挽留、产品推介等市场服务。开发针对每个用户的数据化视图,建立用户的各项数据档案,将其标签化、积分化。
数据可视化展示主要包括大屏交互展示、数据采集过程追踪、报表展示及数据目录。准确的定位数据问题,使数据发挥更大的价值。
依托多年大数据项目经验
以关键技术打通创新节点
曙光大数据工程服务团队依靠多年的大数据项目经验积累、雄厚的技术实力,在数据采集、综合治理、智能分析、可视化服务等领域已经积累了一整套成体系的项目流程规范和技术服务体系。
依托强劲算力,结合与业务贴合的智能算法,依托多年大数据项目经验,曙光在实现广电数据面向业务应用的全方位分析和挖掘的道路上继续探索,通过软硬一体化发展路径,用关键技术打通创新节点,为企业决策提供依据,加速企业战略转型,促进数字经济的飞速发展。