omniture

揭秘乐视超级语音2.0,云知声独家技术支持

2015-10-13 10:38 13573
9月24日乐视在香港九龙东皇冠假日酒店举行“王者归来”发布会,正式推出乐视第三代超级电视。第三代超级电视拥有强大的智能电视交互能力,加入了远讲场景语音功能,远讲支持5米内全向识别室内声音。

北京2015年10月13日电 /美通社/ -- 9月24日乐视在香港九龙东皇冠假日酒店举行“王者归来”发布会,正式推出乐视第三代超级电视。第三代超级电视拥有强大的智能电视交互能力,加入了远讲场景语音功能,远讲支持5米内全向识别室内声音。模糊搜索智能匹配,说说话就能完全操控电视。“怎么说都听得懂”的乐视超级电视语音交互技术由国内领先的人工智能及智能语音技术服务商云知声独家支持。

云知声作为乐视电视语音交互技术的唯一提供商,从2013年5月乐视发布的第一代超级电视到近期的乐视第三代超级电视,从依赖遥控器或手机进行语音操控到远讲识别和全语音交互,持续不断将最新的语音技术应用落地,提升用户体验。超级语音2.0改变了什么?且听云知声细细道来。

摆脱遥控器和手机APP,乐视超级语音2.0的蜕变历程

2013年,乐视超级电视在五棵松万事达中心全球首发,语音操控惊艳全场。乐视超级电视完全颠覆了传统操作体验,真正把互联网和智能语音“植入”到电视里,不同于以往使用电视上那个足以令人崩溃的全键盘,用户长按遥控器语音键,说出节目名,通过语音识别进行搜索,一步到位,语音输入彻底颠覆了传统的选择输入的方式,让电视进入了全新的语音输入时代。

在第一代超级电视上,语音交互操控除了使用电视遥控器外,云知声为方便用户操作还设计了多屏互动的交互体系,并推出了安卓系统和苹果系统上的带语音交互功能的手机遥控器。推出多屏互动之后,的确给予了一些手机使用者便捷,但是它地弊端也逐步开始显现出来,就是用户地使用成本太高了,用户要先拿起手机,点亮屏幕,密码解锁或者指纹解锁,点击打开应用,再操作电视……每次重复如是繁琐操作,一定程度上是再给用户增加操作成本,并且使用多屏互动之前,还需要扫描屏幕二维码,再下载应用,再安装,整个过程用户的成本都变得非常高,语音操控要依赖遥控器或手机仍然无法称作是最自然的人机交互。

科技源于生活,人机交互更多的也是参考实际的生活,最理想的语音交互,其实就是最常见的最普通的人与人之间的对话与沟通,现在的语音交互,乃至人机交互,都是在不断地朝着这个目标而努力。对于智能电视也是如此,如果能够像人与人直接对话一样,那将会是什么样的一种体验呢?现有的语义的技术,虽然无法达到像人与人那样自由、智能地交流和沟通,但指令式的语音交互,已经是游刃有余了,那为何不在“直接对话”上寻找突破口,大胆地问一句:“为什么电视一定需要遥控器呢?”

当然,这是一个非常大胆地质疑,一方面这是在挑战一个根深蒂固的传统的操作理念,另一方面,也是在挑战一个全新的语音交互领域,作为超级电视的一个创新点,云知声产品团队迎难而上,接受挑战。第一个难题,便是降噪的问题,远讲和近讲的主要区别,是在于说话人和麦克风之间的距离,当距离越远时,环境噪音所带来的影响,会直接导致识别率下降,所以,如何才能将环境的噪音去处掉,便是远讲的第一个关键;第二个难题,是电视在播放时,所播出来的声音会和主讲人的声音混合,如何才能将电视播放的声音消除掉呢?第三个难题,是实际家庭环境的因素,其实就是混响问题,如何才能将混响的影响降到较低呢?问题已经都提出了,接下来就是找寻方案了,进入选择意向的,便是麦克风阵列方案,它有多个麦克风,形成一个阵列,根据不同麦克风采集的声音的各类数据,来进行说话人声音的提取,云知声远讲超级语音技术让用户无需使用遥控器按下语音键才能语音操控,通过麦克风阵列收集语音,经过DSP处理模块对声音降噪,远讲增强及回声消除后清晰收音,电视可以全向识别室内的声音,当你通过“暗号”(唤醒词)激活语音功能后,它将识别到你的声音并且根据指令进行开关机、资源点播等等。同时支持自定义唤醒词,用户可以坐在沙发上对着电视说“乐乐,我要看《捉妖记》”,电视唤醒后,用户便能在电视端看到相关视频。

唤醒仅仅是超级语音2.0的一个开始,超级语音2.0的全语音交互实现了凡是在UI界面中所能见的,皆为语音所能控制的;在电视上所能用的,皆为语音所能操作的。从开机,到关机,从语音搜索,到语音控制,从语音助手应用,到系统应用,甚至到第三方应用,都需要支持语音交互。云知声经过半年多的努力通过热唤醒+语音识别+连续识别+连贯任务最终将全语音交互完美落地,让用户怎么说都听得懂,彻底摆脱遥控器。

云知声发力语音交互入口背后,意在人工智能助理

非智能电视时代当我们打开电视时,看到的就只是电视台按每天既定的节目表播放的电视节目,不会出现一个主页面,也不会有那么多图标点来点去,人们只在乎打开电视马上就能看到什么。而智能电视时代,电视提供给用户的内容越来越多,越来越杂。语音功能作为电视介入互联网搜索的方式之一,对人工智能的要求非常高,语言是人类独有的文明传播方式,要让电脑理解它浩大的语境语义,难度非常之高。此次乐视超级语音2.0支持语音开机、个性化唤醒,其场景化的语音控制使命令更准确,使用范围更广,支持多关键词模糊搜索、连贯任务执行,让用户彻底摆脱遥控器。表面上是用户的交互方式的改变,换一个角度看,将语音当作用户使用习惯的收集工具,将大数据统计处理,用语音连接人和信息,语音连接人和服务,这也是云知声希望通过语音来为用户做的更多。

试想一下,在智能电视上所有软件都放在另外一个界面里,当累了一整天不愿意动弹,回家就想看点自己喜欢的节目打发时间,如果只需要对着电视说“电视开机”它就能自动跳转到你喜欢的电视节目中,那该是多么惬意。此外,基于声纹识别记录说话人信息,分析家庭不同成员观片喜好,在唤醒电视后自动提醒播放电视节目或游戏节目,甚至提供菜谱指导、亲子游戏、体育节目等各种内容。而视频的搜索播放是电视中最为常见的功能之一,全语音的交互体验,不仅仅在视频搜索上,在频道切换、节目单查询、预约提醒等等功能服务商,都是可以体现的,而且通过远讲技术的使用,全语音交互成为了不可或缺的交互基础。

2012年以黑马之姿杀入语音行业的云知声,如今已在人工智能领域多点开花,成绩斐然。云知声“云··芯”超智能方程式已在智能家居、智能车载、在线教育、云平台等行业广泛应用,随着大数据,云计算,人工智能等技术的发展,在万物智能时代,所有的有东西都将会是智能的,无论是汽车,电视,电饭煲,冰箱还是路灯。这些智能的万物,都具有不同层次的智能,都觉有不同的学习能力。这些设备都可以与人做基于语音的自然交互,甚至这些设备之间也可以自动交换信息。目前云知声正在向万物智能的目标而努力,云知声已推出面向智能家居、智能车载的产品应用系统包括智能电视、音箱、空调、语音后视镜、智能语控车机等产品,这些产品通过语音命令进行控制,可以完全摆脱了对遥控器和手机APP的依赖。云知声以语音交互为入口,结合大数据、云计算、人工智能,为用户提供更精准的消费、社交行为推荐,打造家庭人工智能助理。在智能家居平台真正开启未来的全语音生态。

图标 - http://photos.prnasia.com/prnh/20140807/0861405546

消息来源:云知声
China-PRNewsire-300-300.png
全球TMT
微信公众号“全球TMT”发布全球互联网、科技、媒体、通讯企业的经营动态、财报信息、企业并购消息。扫描二维码,立即订阅!
collection