文档

测试

实时语音识别

websocket测试

POST

/asr/real-time-speech

接口描述

本接口需要签名算法详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/I3RvpNQ8

请求头

参数名

类型

描述

必填

公共请求头

详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/MfHqm2xM

必填

请求参数

参数名

类型

描述

必填

voice

string

实时语音文件分片语音要求采样率16K 每个分片的大小设置成6400字节 base64后传输

必填

engine_model_type

string

识别语言详见 https://easydoc.xyz/doc/99486551/1tEmNjF6/P0LjiaHs

必填

voice_id

string

客户端生成的随机16位字符串需要避免重复一整段语音使用同一个voice_id 即：按钮按下到松开按钮使用同一个voice_id

必填

format

string

语音文件编码格式语音编码方式可传 pcm；speex；silk；mp3；opus；wav；m4a；aac 建议使用wav

必填

seq

int

语音分片的序号，序号从0开始，每次请求递增1，两个 seq 之间间隔不能超过6秒

必填

end

int

是否为最后一片，最后一片语音片为1，其余为0。

必填

响应参数

参数名

类型

描述

必填

code

必填

message

必填

server_time

必填

result

object

必填

text

string

目前识别出来的文字

必填

seq

int

第几个分片

必填

end

int

是否为最后一片，最后一片语音片为1，其余为0。

必填

说明 / 示例

``` { "code": 200, "message": "成功", "server_time": 1614846293, "result": { "text": "We are playing this a new year's concert, um in a very unusual situation, we know that we are playing for many millions of people ar ound the world practically more than ninety different countries but it's very strange for us to play in a such beautiful historical hole completely", "seq": 1087, "end": 1 } } ```

上一篇短语音识别支持语言接口

nextDoc 实时语音识别支持语言接口