上海2018年7月27日电 /美通社/ -- 近日,由 Gartner 和七牛云联合发布了一份《Five Key Essentials for the New Generation of Intelligent Video Cloud》白皮书报告,报告中针对各行业在视频应用领域升级过程中面临的技术痛点及挑战,提出了构建新一代视频云的5个关键要素和相关参考标准,并描述了智能视频云如何以更便捷的服务和更低的成本帮助客户加速升级。本文则对 Gartner 和七牛云的白皮书报告进行了详细编译。
以下为译文:
一、导语
过去十年里,中国移动互联网的高速发展,带动了各个产业IT基础架构的扩展和升级:
本文介绍各行业在视频应用领域的升级过程中,主要面临的技术痛点和挑战,并提出了构建新一代视频云的5个关键要素和相关参考标准,描述了智能视频云如何以更便捷的服务和更低的成本帮助客户加速升级。未来视频的应用的场景和领域可能会成为企业产品或营销服务中核心的环节,而且它本身的规模变化也非常符合互联网中的马太效应,因此企业都需要提前为自己未来海量的富媒体素材做好充分准备,避免数据失控。
二、各行业在视频时代的新兴场景
1、安防监控
根据 Markets&Markets 的调查结果,2017年至2022年期间,全球监控视频市场年复合增长率将达15.4%,2022年将增至约756亿美元的规模。视频监控广泛应用于各类场合,包括:
最近两年来,以幼儿园、学校代表的公共区域场所监控提出了更高的要求:
而道路交通和城市安全的监控,除了传统的车辆违章监控和识别,行人的违章也逐步纳入到了监控的体系中,如:
由此可以看到,视频监控领域正在面临着产业升级,如何做到公网稳定地访问,产生的海量的图像和视频数据如何更好地存储、分析和检索,是一项巨大的挑战。
2、在线教育
近年来,在线教育发展异常火热,利用互联网音视频技术,解决了优质教育资源传递的时空限制,主要体现形式如下:
如何解决学生观看直播的卡顿问题,如何进一步降低视频互动的延时,提高老师和学生的体验,显得至关重要。另外,随着人工智能的发展,视频技术如何更好地借助 AI 技术,也成为在线教育领域大家更为关注的方向,如:
3、广电新媒体
随着互联网直播兴起,各类广电平台想要做出一档可看且互动性强的直播节目,除了要精心编排节目内容,还要特别重视音视频及互动方式的呈现。显然,在新媒体时代下,传统的广电方案具有一定的局限性:
面对这些局限,广电行业迫切需要全新的视频系统,为消费者提供高画质、强互动的视频娱乐体验和可量化的精确数据管理:
如何实现导播内容的实时切换,如何保证广电内容实时传输,如何让广电传媒的广告价值较大化,如何制作低成本、高质量的节目,这对广电新媒体来说均是急需解决的难题。
4、智慧法庭
2016年7月1日起,较高人民法院所有公开开庭案件均有网上直播,所有直播视频均有视频存档,公众可在线观看。截至2018年3月,全国范围内的庭审直播共累计66万余场,累计访问近50亿人次。智慧法庭充分运用互联网、大数据、云计算、人工智能等先进信息技术,支持全业务网上办理、全流程依法公开、全方位智能服务:
基于视频及文书,结合人工智能计算机视觉技术,读取、分析电子化卷宗,抓取重要因素,并分类标注。例如把犯罪动机、犯罪时间、犯罪工具等 -- 以不同颜色打上标签,并予以比对分析。
建设智慧法庭,如何保障开庭审讯直播视频的实时传输,如何存储海量直播视频用于点播回放,如何基于广泛的视频内容进行智能分析,对视频基础设施的可靠性提出了更高的要求和挑战。
5、远程医疗
当前医疗资源还存在着地区分布不均问题,医疗专家可以通过在线直播、实时音视频进行跨区域互动会诊:
远程医疗这一概念被提出后,已经被广泛应用。但是,如何提高视频传输性能,如何确保家庭、基层医疗机构和户外应急的远程医疗快速接入,是当前的远程医疗业务系统面临的主要挑战。
从以上列举的几个行业新兴场景可以看出,在产业升级的过程中,他们都面临着巨大的技术和资源挑战。大部分企业无法在短时间内构建有效的相关视频服务能力,因此如何选择和利用公有云的相关视频服务,快速满足业务的升级需求,显得至关重要。
三、智能视频云的关键要素
为了满足各行业在视频时代新的需求和挑战,智能视频云至少需要拥有以下5个关键要素:
1、稳定的网络传输与分发:直播延迟不高于1s,互动延迟不高于150ms
2、可扩展的海量存储服务:可以实现业务层无感知PB级扩容
3、云端媒体的编辑处理:可以在数秒内创建独立计算实例,执行自定义媒体编辑操作
4、视频内容的智能分析:视频内容识别率高于95%
5、完备的权限控制:彻底杜绝非法拷贝,秒级封禁盗链流量
要素1:稳定的网络传输与分发:提供流畅的观看体验与低延迟的互动
要素2:可扩展的海量存储服务:高可靠易扩展的数据安全保障
要素3:端媒体的编辑处理:快捷多用途云端视频编辑
要素4:视频内容的智能分析:结合人工智能发挥视频数据的较大价值
要素5:完备的权限控制:杜绝非法拷贝与盗链
根据以上5个关键要素,七牛云认为一套完整的智能视频云需要由以下模块组成:
四、智能视频云的成本优势:
智能视频云不仅在技术能够完全满足各行业在视频时代的新需求,相比自主研发,还能为企业大幅节省研发成本和运营成本。
面对高昂的成本,视频云服务在提供了丰富产品的同时,还具有简单易用、可弹性扩展、维护成本低的特点。智能视频云服务通过提供通用且易于根据具体业务定制的技术系统,大大降低了行业应用的开发周期与成本开销,同时视频云的多个模块均可私有或混合部署,在保障企业数据安全的同时,获得和公有云一样的稳定性、可靠性和灵活性。
五:AI在智能视频云的增值应用
在智能视频云的技术和成本优势背后,人工智能,尤其是计算机视觉技术的深度应用发挥了巨大的作用。在七牛云整个智能视频云系统中,计算机视觉技术在诸多环节取代了人工操作,极大地提高了视频内容处理的效率。通过完全不同于传统数据分析的角度,实现了先前难以想象的数据分析应用。
1、视频内容识别:自动识别视频画面信息,从标签库中匹配对应标签
作为计算机视觉基础模型层中重要的几项技术,人脸识别、物体识别、场景识别等技术在安防、广电、教育等领域的众多场景中有广泛的应用场景。
例如在安防行业,拥有人脸识别、动作追踪等功能的高清摄像头,能根据监控范围内人物的动作并判断其行为,对具有可疑行为的人触发自动报警。当智能摄像头与公安部门的在逃嫌犯资料库匹配之后,能在机场、火车站等人流密集场所配合警方识别可疑人员,大幅提升破案、抓捕效率。
2、视频内容结构化:可以像搜索文本文件一样搜索视频文件中的信息
计算机视觉视频结构化相比人工标注具有识别范围广、准确性好、学习模型不断迭代、GPU机器效率高、成本低等一系列明显优势。经标注后的视频能够在远程医疗、在线教育、广电等行业发挥巨大作用。
例如,远程医疗行业拥有的存量和新增影像资料远远超出人工标注的能力范围,想要发挥医疗视频资料的较大价值,需要根据不同类别将视频和图片进行分类。通过人工智能高效完成视频精确分类后,就能像搜索文本文件一样搜索视频文件中的关键信息,进行更有效的利用,真正将医疗大数据变为医疗知识图谱。
3、视频内容审核:从视频中识别敏感信息,提升审核效率
如今,图片和视频取代文字成为主流的传播方式,针对图片和视频的内容审核正变得越来越重要。然而人工审核不仅会造成高企的人力成本,其效率和准确性也很难满足当下巨大的视频数据量带来的审核需求。
例如在广电行业,视频内容鉴黄、鉴暴恐、政治人物识别等工作过去均由人工完成。随着计算机视觉技术的日渐成熟,利用机器代替人工进行绝大部份的内容审核工作,成为了视频时代的提高审核效率的不二之选。凭借计算机视觉技术带来的审核效率革命,鉴黄、鉴暴恐、政治人物识别将不再是广电行业的难题。
4、视频内容推荐:可根据用户消费视频习惯,实现精细化运营
除了能够高效完成视频结构化和内容审核工作,计算机视觉技术还能在业务层面成为内容运营的创新引擎,实现更多个性化产品需求。
同样在广电行业,例如在完成视频内容结构化之后,运营者可以根据用户收看行为记录进行智能内容推荐,甚至在视频的特定时间段和画面的特定位置实现广告定向投放,较大化提升广告转化效果。智能视频内容推荐能够帮助内容运营人员以较高效率实现高水平的用户精细化运营。
六、借助灵活的智能视频云从容面对未来产业升级的未知挑战
未来,很少有企业能脱离互联网而独立存在,因此企业数据的总量会不断增加,对应产生的数据价值甚至负担也会同步提升。每个企业都需要拥有对于文件和富媒体素材(包含海量图片,视频,音频)的使用和存储的弹性能力,但只有极少数企业才需要拥有自建视频云的能力和资源,大部分企业只需要借助一套稳定并可持续升级的视频云平台,迎接未来产业中不断变化和升级的未知挑战。
报告出处:
Gartner白皮书英文版链接:https://www.gartner.com/technology/media-products/newsletters/qiniu/1-4UWO347/index.html
Gartner白皮书中文版链接:https://www.qiniu.com/products/qavs