实时语音识别
POST
/asr/real-time-speech
接口描述
本接口需要签名 算法详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/I3RvpNQ8
请求头
参数名
类型
描述
必填
公共请求头
详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/MfHqm2xM
必填
请求参数
参数名
类型
描述
必填
voice
string
实时语音文件分片 语音要求 采样率16K 每个分片的大小设置成6400字节 base64后传输
必填
engine_model_type
string
识别语言 详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/P0LjiaHs
必填
voice_id
string
客户端生成的随机16位字符串 需要避免重复 一整段语音使用同一个voice_id 即:按钮按下到松开按钮 使用同一个voice_id
必填
format
string
语音文件编码格式 语音编码方式可传 pcm;speex;silk;mp3;opus;wav;m4a;aac 建议使用wav
必填
seq
int
语音分片的序号,序号从0开始,每次请求递增1, 两个 seq 之间间隔不能超过6秒
必填
end
int
是否为最后一片,最后一片语音片为1,其余为0。
必填