长语音识别

优势特点

领先技术准确率高

与短语音听写API共享业界先进的声学和语言模型，识别准确率可高达96.36%。处于业界先进水平。

多语种多口音识别

支持中文普通话识别；支持20多种口音，如广普、川普、东北口音；支持中文对话夹杂英文词汇；支持英语、阿拉伯语识别；支持嘈杂的收音环境，如火车站、聊天室等；支持不同收音设备、不同的麦克风条件等等。

快速识别智能断句

1小时音频1分钟出稿，支持多路并发，每路每秒可以处理超过10s长的音频；识别可以中文对话语境，智能断句并匹配标点。动态识别内容，并根据上下文智能修正结果。

支持时间戳与热词配置

支持开启时间戳功能，返回每句或每个字开始与结束时间，便于二次功能开发。支持可以定制特定场景下的高频词汇清单，支持1000余个专业术语，提高自定义场景中的识别准确率。可以自定义1000余个专业术语。

应用场景

会议录音转写

视频字幕生成

语音内容安全

电话营销/质检

会议录音转写

将会议、课堂、访谈长时间录音快速识别出文字，根据时间戳快速对内容进行总结分析，提高纪要记录效率。

典型客户

相关推荐

长语音识别接入文档

点击可查看长语音识别调用方式及返回内容详情

短语音识别

将60秒内的语音快速为文字，适用于手机语音输入、语音搜索、人机对话等语音交互场景

实时语音识别

将音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

即刻申请免费试用

如需了解详情，您可一键申请，我们将为您提供免费试用