文档
测试

实时语音识别

POST
/asr/real-time-speech

接口描述

本接口需要签名 算法详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/I3RvpNQ8

请求头

参数名
类型
描述
必填
公共请求头
详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/MfHqm2xM
必填

请求参数

参数名
类型
描述
必填
voice
string
实时语音文件分片 语音要求 采样率16K 每个分片的大小设置成6400字节 base64后传输
必填
engine_model_type
string
识别语言 详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/P0LjiaHs
必填
voice_id
string
客户端生成的随机16位字符串 需要避免重复 一整段语音使用同一个voice_id 即:按钮按下到松开按钮 使用同一个voice_id
必填
format
string
语音文件编码格式 语音编码方式可传 pcm;speex;silk;mp3;opus;wav;m4a;aac 建议使用wav
必填
seq
int
语音分片的序号,序号从0开始,每次请求递增1, 两个 seq 之间间隔不能超过6秒
必填
end
int
是否为最后一片,最后一片语音片为1,其余为0。
必填

响应参数

参数名
类型
描述
必填
code
必填
message
必填
server_time
必填
result
object
必填
text
string
目前识别出来的文字
必填
seq
int
第几个分片
必填
end
int
是否为最后一片,最后一片语音片为1,其余为0。
必填

说明 / 示例

``` { "code": 200, "message": "成功", "server_time": 1614846293, "result": { "text": "We are playing this a new year's concert, um in a very unusual situation, we know that we are playing for many millions of people ar ound the world practically more than ninety different countries but it's very strange for us to play in a such beautiful historical hole completely", "seq": 1087, "end": 1 } } ```