omniture

捷通华声灵云——中国人工智能产业先行者

2014-06-18 17:06

连日来,国内外IT圈关于人工智能各种劲爆消息不绝于耳,先是腾讯微信义无反顾地革了Microsoft小冰的命,其次震惊世界的EugeneGoostman图灵测试,再者百度挖来“谷歌大脑之父”吴恩达(AndrewNG),又传三星收购NUANCE……各种有关人工智能的大企竞合突发事件开始井喷出现。那么,国内高新技术企业又是如何应对这一系列突发事件的呢?

捷通灵云敢为天下先,中国人工智能产业先行者

作为中国人工智能领域的老牌高新技术民族企业,驻扎在北京中关村软件园的捷通华声语音技术有限公司自20世纪末成立伊始就开始专研于语音和手写等智能人机交互技术领域,随着互联网、移动互联网产业发展和社会网络化需求的变化,如今捷通华声已延伸出语音识别(ASR)、语音合成(TTS)、图像识别(OCR)、手写识别(HWR)、自然语言理解(NLU)、机器翻译(MT)等六大技术能力,形成独特的“全智能”效应,并为奥运会、世博会、海陆空交通、金融银行等领域,及上千种移动端APP提供全方位智能人机交互技术服务。

2011年,捷通华声全面整合具有自主知识产权的多项智能人机交互技术,突破性地创建了第一个最大最全的智能人机交互技术云服务开放平台——灵云(www.hcicloud.com),率先拉开了中国人工智能产业化的大幕!

2014年伊始,人工智能的热潮在几大互联网巨头的推波助澜中不断汹涌,各厂商提到的“人工智能”主要集中在智能计算方面,例如百度的“百度大脑”计划,目的是利用计算机模拟人脑拉升它的智力水平,使计算机在未来能够和人类对等交流,提供更准确、高效的服务。其实,人工智能是一个由浅入深的智能化模型、机制和过程,在较浅层次上,人工智能意味着智能化的人机交互方式,在深层次上,人工智能意味着基于机器学习技术的知识表达、归纳、推理等智能计算过程。智能人机交互是人工智能的触角,智能计算是人工智能的核心,二者缺一不可,共同组成一个智能网络。捷通灵云智能平台自诞生以来,凭借优异的灵云智能语音交互技术让计算机实现“能说会听”、出众的灵云图像识别技术让各种数字设备“能写能看”,而灵云语义理解、机器翻译已经突破人机交互的表层,向人工智能深层次挺进。2013年,捷通华声得到了清华大学的鼎力支持,共同致力于实现“灵云科技、源自清华、服务全球”战略规划,共同促进中国人工智能在学术与产业中的发展进步。

在清华大学电子系、计算机、信研院等院系各人工智能顶尖学科团队的支持下,捷通灵云智能语音等人机交互能力更加成熟。灵云语音识别,采用最新深度神经网络算法技术,识别准确率突破95%,并已在国内客服语音质检、IVR语音导航、移动互联网应用等领域实现全面普及性应用;语音合成方面,捷通灵云在国内率先推出支持中、英、德、法、阿拉伯等多达十三种国际语言的语音合成技术服务,在国内智能语音服务达到了50%的市场占有率,而灵云“听与说”两项能力的强化,让人与机器的自然交流变得更加通畅。

灵云OCR与手写识别等智能图像识别技术,犹如人的“眼睛与手”。目前灵云手写识别已能够识别92种国际语言;灵云OCR更是在文档、票据、证照识别领域中异军突起,在不断完善OCR多样化应用的同时,捷通华声也正在清华大学的支持下开发更完善的图像识别技术,除了支持票证、证照、文本的识别,还将陆续推出图片、人脸识别等更多元化的图像识别技术,保证灵云拥有更全面的“视觉与感观”能力。

人类无论用语音交互还是通过文字传递信息,其获取信息的目的则是为了在相互理解之后进行彼此的沟通。捷通灵云智能平台即将全面升级并推出的语义分析、意图理解及机器翻译,进一步推动灵云向人工智能更深层次发展,不仅让灵云“能说会听”、“能写会看”,也要开始学会思考。其中,语义理解等自然语言理解技术就是让灵云拥有了思考的能力,例如通过灵云语音识别不在仅是听懂人的话,同时能够对所识别出的文字信息进行分析理解,然后应用灵云语音合成技术将所要表达的信息以语音方式朗读出来,从而实现灵云人工智能的一个完美应用过程。捷通华声近期推出的灵云智能客户服务系统,全面应用灵云语义理解、语音交互等能力,在国内智能客服、机器人服务等领域独树一帜,并成功为广发、中信等数十家金融领域客户提供了全面智能客户服务。

随着人工智能在互联网产业中关注度越来越高,人工智能似乎一夜间成为产业的热点,捷通灵云智能平台凭借对人工智能产业发展的独特理念与执着信心,终于逐渐显现出其超前魄力的魅力。

捷通华声创始人张连毅表示:“捷通灵云智能平台的创建与发展,不仅有力推动智能人机交互技术在中国的发展与普及化应用,产业的需求、技术的跨越式进步也推动灵云智能平台完成向多模态、全方位智能人机交互能力服务平台的升级与发展。如果说捷通华声是中国人工智能产业的倡导者,那么捷通灵云智能平台就是中国人工智能产业的先行者。”

捷通灵云智能平台——多模态、全方位服务产业

捷通华声灵云智能开放平台自2013年向社会全面开放以来,灵云语音识别(ASR)、语音合成(TTS)、图像识别(OCR)、手写识别(HWR)、自然语言理解(NLU)、机器翻译(MT)等六大技术能力得到产业界、开发者的广泛认同,并助力百度导航、搜狗导航、导航犬、嘀嘀打车、快的打车,天行听书、汉字英雄成为家喻户晓的移动经典应用。灵云能力服务也让超过3亿社会大众轻松体验到智能人交互技术的服务,感受人工智能无限的魅力。

捷通灵云智能开放平台之所以得到产业界的广泛支持,不仅得益于捷通华声所始终倡导的“合作共赢”的合作理念,灵云智能平台已囊括目前人工智能产业中最实用的多项能力,给企业合作伙伴、开发者提供了“要啥有啥”的便捷与舒适。灵云智能平台的三大特色也为合作伙伴、开发者提供了施展才华,全面展现其产品的创新与轻松使用的实力。首先,捷通灵云智能平台是中国目前最大最全的智能人机交互技术交流和体验平台——并免费开放,所以无论技术宅还是企业工程师都可在这里自由调用,尽情发挥想象与创造力;而灵云智能平台“云+端”服务形成灵云独特的优势,“云+端”服务可为企业提供更加合适并实时更新的智能人机交互技术解决方案;还有就是,灵云智能平台的实时创新与互动——是由捷通华声一线技术人员负责,所有最新技术均保证第一时间更新至灵云平台,为所有客户提供及时高效的服务。

捷通华声未来发展,捷通灵云智能平台将在不断增加各种智能人机交互能力的基础上,逐步推出更宽广的人机交互能力与更深层次的人工智能能力,充分发挥移动互联网、云计算服务之优势,真正推动人工智能技术服务产业、服务社会,推动人工智能产业成为中国IT领域中最具创新力的产业力量。

中国人工智能前景展望

当被记者问及如何看待国内人工智能发展的时候,捷通华声CEO张连毅先生饶有兴致地回复道:“近些年来,中国IT界软硬件都发生了巨变,面对国内外掀起的人工智能热潮,及智能移动终端、智慧城市、智能汽车、智能家居等几乎覆盖所有产业的智能化趋势,在这个全新并充满想象的产业中,中国企业不要早言或轻言谁是大腕谁又是巨头,又是想着谁领导谁。中国信息产业应该说已具备了广泛且坚实的人工智能技术研发的经济基础和技术基础,产业界同仁应共同努力,推动人工智能为实现中国完成‘中国制造’向‘中国创造’产业进步做出贡献,并激发中国年青的一代IT人拥有成为世界信息产业领导者的勇气与力量。”

人工智能专家雷·库兹韦尔(raykurzweil)曾在畅销书《奇点临近》中预言强人工智能的研究将迅速崛起(强人工智能是具备了像人一样的思考能力,弱人工智能则是行为语言看起来像人),并在2045年跨越人工智能超过人类智能的“奇点”,他甚至表示,技术奇点的加速模型显示,21世纪就是人类文明的终点,换句话说,现在出生的人们,将在有生之年看到“终极科技”。

对于这种观点,张连毅先生在最后不无幽默地表示:“人的本性都有些“懒”,人类的创造发明都是服务“懒”,如今不要说汽车,就是自行车也比人跑得快。因此,只要人类的本性不变,人类的文明就不会终止,机器再聪明也会如同汽车,得人来开!“

灵云简介:捷通灵云智能开放平台(www.hcicloud.com)是捷通华声全力打造的人工智能技术云服务平台。灵云是一种可以用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,其目标是让人机交互像人与人沟通一样的简单自然。灵云目前以“云+端”方式,为用户提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)和自然语言理解(NLU)、机器翻译(MT)等多项核心技术能力,是目前国内能力最全、服务最广的专业人工智能技术云服务平台。2013年,捷通华声与清华大学建立战略合作伙伴关系,共同实现“灵云科技、源自清华、服务全球“的战略发展目标。

 

消息来源:CTI