1. 声音识别

对帕金森病人的声音进行分析。

POST:http://api.xdua.com/hannm/{file}

字段名 字段位置 字段类型 字段说明 举例 必选
apiv head string API版本,默认是1.0.0 1.0.0 可选
Authorization head string 客户端保存的鉴权token Authorization字符串 必选
file body string 记录患者声音的音频,属性为wav 必选
type body string 文件的类型为sound 必选

返回数据

{ 
    "error": 0,
    "reason": 'Success',
    "result":{
        "score":1
}

成功返回

字段名 字段类型 字段说明 举例
score int 由sound模型分析声音波形的数字特征和波形变化幅度的数字特征以及音频信号的梅尔倒谱系数,采样点数得到的分数. 其中数字特征:平均值,方差,最大值,最小值,极差,偏度,峰度. 1.0: ,2.0: ,3.0: ,4.0: ,5.0:

feature

字段名 字段类型 字段说明
topf float 谱峰位置,浮点数字,从加速度数据中计算频谱的谱峰位置。单位为hz,请保留小数点后两位数字,这个值的区间是(0,60)
ampmean float 每一时刻音频波形振幅组成一个数组,这个数组的平均值
ampvar float 每一时刻音频波形振幅组成一个数组,这个数组的方差
ampskew float 每一时刻音频波形振幅组成一个数组,这个数组的偏度,即表征概率分布密度曲线相对于平均值不对称程度的特征数
ampkurt float 每一时刻音频波形振幅组成一个数组,这个数组的峰度,即表征概率密度在均值处峰值高低的特征
ampptp float 每一时刻音频波形振幅组成一个数组,这个数组的极差
ampmax float 每一时刻音频波形振幅组成一个数组,这个数组的最大值
ampmin float 每一时刻音频波形振幅组成一个数组,这个数组的最小值
dif_mean float 由波形振幅变化幅度所组成的数组(即原波形振幅数组后一项减去前一项得到的一组差数组)的平均值
dif_var float 由波形振幅变化幅度所组成的数组(即原波形振幅数组后一项减去前一项得到的一组差数组)的方差
dif_skew float 由波形振幅变化幅度所组成的数组(即原波形振幅数组后一项减去前一项得到的一组差数组)的偏度,即表征概率分布密度曲线相对于平均值不对称程度的特征数
dif_kurt float 由波形振幅变化幅度所组成的数组(即原波形振幅数组后一项减去前一项得到的一组差数组)的峰度,即表征概率密度在均值处峰值高低的特征
dif_ptp float 由波形振幅变化幅度所组成的数组(即原波形振幅数组后一项减去前一项得到的一组差数组)的极差
dif_max float 由波形振幅变化幅度所组成的数组(即原波形振幅数组后一项减去前一项得到的一组差数组)的最大值
dif_min float 由波形振幅变化幅度所组成的数组(即原波形振幅数组后一项减去前一项得到的一组差数组)的最小值
energy1 float 浮点数,energy1
energy2 float 浮点数,energy2
energy3 float 浮点数,energy3
energy4 float 浮点数,energy4
energy5 float 浮点数,energy5
energy6 float 浮点数,energy6
energy7 float 浮点数,energy7
energy8 float 浮点数,energy8
energy9 float 浮点数,energy9
energy10 float 浮点数,energy10
nframes int 音频的采样点数
mfccs array 一维数组,音频的梅尔倒谱系数。MFCCs是一种准确描述声道的形状在语音短时功率谱的包络的一种特征

失败返回

{
    "error": 1,
    "reason": "失败原因",
    "result": {"失败的参考数据"},
}

1.1. 错误码

错误码来自于error字段

1.2. Browser SDK调用示例代码

results matching ""

    No results matching ""