首页 > 技术知识 > 正文

微软最近为其认知语音服务推出了新功能,通过发音评估、新的语音转文本 (STT) 语言以及预构建和自定义神经语音增强功能来加速语言学习。

Microsoft Azure 认知语音服务是技术和服务的综合集合,例如语音转文本、文本转语音、自定义神经语音 (CNV) 对话听录服务、说话人识别、语音翻译、语音 SDK 和语音设备开发工具包 (DDK),可加速语音合并到应用程序中。

发音评估是 Azure 认知服务组合中语音服务的一项功能,以 10+ 种语言和差异公开提供,包括美式英语、英式英语、澳大利亚英语、法语、西班牙语和中文,其他语言以预览版提供。它利用 Azure 神经文本到语音转换转换器模型顺序回归和分层结构来提高单词级别评估的准确性,从而为各种背景的语言学习者提供提高技能的能力。

微软推出新的认知语音服务功能以加速语言学习-微软的语音识别

此外,Azure 语音转文本支持多语言学习方案的实时语言识别,并通过更好的理解和可读上下文帮助人与人交互。该服务的新语音转文本 (STT) 语言基于大量数据,利用最新的多语言建模技术和提供输出的迁移学习技术,其中包括反向文本规范化 (ITN)、大写(如果适用)和自动标点符号,以提高可读性。

最后,Microsoft Azure AI 为 AI 教师提供了一系列预构建的神经语音、内容朗读功能等。自定义神经语音 (CNV) 还使用户能够使用人类语音样本作为训练数据,为其应用程序创建独特的自定义合成语音。CNV 基于神经文本转语音技术,非常适合代表品牌和拟人化机器进行对话交互。教育公司正在使用这项技术来个性化语言学习,例如DuolingoPearson

猜你喜欢