优势特点
领先技术准确率高
与短语音听写API共享业界先进的声学和语言模型,识别准确率可高达96.36%。处于业界先进水平。
多语种多口音识别
支持中文普通话识别;支持20多种口音,如广普、川普、东北口音;支持中文对话夹杂英文词汇;支持英语、阿拉伯语识别;支持嘈杂的收音环境,如火车站、聊天室等;支持不同收音设备、不同的麦克风条件等等。
快速识别智能断句
1小时音频1分钟出稿,支持多路并发,每路每秒可以处理超过10s长的音频;识别可以中文对话语境,智能断句并匹配标点。动态识别内容,并根据上下文智能修正结果。
支持时间戳与热词配置
支持开启时间戳功能,返回每句或每个字开始与结束时间,便于二次功能开发。支持可以定制特定场景下的高频词汇清单,支持1000余个专业术语,提高自定义场景中的识别准确率。可以自定义1000余个专业术语。
应用场景
会议录音转写
视频字幕生成
语音内容安全
电话营销/质检

会议录音转写
将会议、课堂、访谈长时间录音快速识别出文字,根据时间戳快速对内容进行总结分析,提高纪要记录效率。
典型客户


相关推荐
长语音识别接入文档
点击可查看长语音识别调用方式及返回内容详情
短语音识别
将60秒内的语音快速为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景
实时语音识别
将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景