日前,亚马逊云科技宣布通过与光环新网和西云数据的紧密合作,在北京区域和宁夏区域正式上线Amazon Transcribe Streaming实时流式语音转录功能。Amazon Transcribe是一项自动语音识别(ASR)服务,可为用户提供方便快捷的语音转文本服务,使用场景包括转录客服电话、自动添加字幕、生成会议纪要,以及为媒体资产生成元数据、创建完全可搜索的存档等。Amazon Transcribe根据转录的音频时长、按实际使用量付费,客户无需花费昂贵的转录费用,便能让开发人员轻松地为其应用程序添加语音转文本功能。
Amazon Transcribe能够快速准确地将语音转换为文本,用户只需投入很少的时间和费用,便可以达到几乎与手动转录相媲美的转录效果。用户可以将它应用于实时音频流或批量音频内容,创建包含音频文件内容的应用程序。Amazon Transcribe采用深度学习功能自动添加标点符号和格式,生成时间戳;并且,用户可以通过转录控制台自定义词汇列表和语言模型,从而为特定领域的词和词组生成更准确的转录,例如产品名称、技术术语等。此外,Amazon Transcribe可以识别和修订敏感的个人身份信息来保护用户隐私安全,并通过词汇表筛选掩蔽或删除转录结果中不文明用语,为客户提供更好的转录效果和用户体验。
目前,Amazon Transcribe支持多种语言,在批量音频内容处理中支持多达31种语言,在实时流失转录场景下支持包括中文普通话、澳大利亚英语、英国英语、美国英语、法语、加拿大法语、德语、意大利语、日语、韩语、巴西葡萄牙语和美国西班牙语等在内的12种语言。
(美通社,2021年8月3日北京)