优势特点
领先技术准确率高
识别准确率可达99.2%(数据来源SpeechIO 2022年2月份新闻联播数据集测试结果)处于业界先进水平。
毫秒级响应
流式接口,实时传输。 响应速度可达毫秒级,用户边说边返回文字。
多语种多口音识别
支持中文普通话识别;支持20多种口音,如广普、川普、东北口音;支持中文对话夹杂英文词汇;支持英语、阿拉伯语识别;支持嘈杂的收音环境,如火车站、聊天室等;支持不同收音设备、不同的麦克风条件等等。
智能标点,动态修正
基于大量垂直领域语料训练,可在识别过程中根据语境含义与停顿,智能匹配合适的标点符号,并可以根据上下文进行动态修正。
应用场景
实时解说字幕
视频直播字幕
实时会议记录
实时语音游戏

实时解说字幕
赛事直播、大会演讲等场景,可以在屏幕上实时展示嘉宾演讲字幕,逐字展示并根据上下文智能纠错,支持自定义1000以上特定场景下的热词与术语,准确率高,提高观众观看体验。
典型客户


相关推荐
实时语音识别接入文档
点击可查看长语音识别调用方式及返回内容详情
长语音识别
将会议、访谈之类的长时间录音批量识别为文字,通过静音识别自动将有语音部分进行切分,提升识别效率
短语音识别
将60秒内的语音快速为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景