首页  专利技术  其他产品的制造及其应用技术

一种音频处理方法、装置、电子设备及存储介质与流程

2025-10-16 16:40:07 22次浏览

技术特征:

1.一种音频处理方法,其特征在于,所述音频处理方法包括:

2.根据权利要求1所述的音频处理方法,其特征在于,通过以下步骤确定出所述语音处理模型:

3.根据权利要求2所述的音频处理方法,其特征在于,所述将第一样本音频的梅尔谱特征输入至预先训练好的目标声码器之中,对所述梅尔谱特征进行重建处理,输出所述第一样本音频的第一重建音频波形,包括:

4.根据权利要求2所述的音频处理方法,其特征在于,通过以下步骤对确定出所述目标声码器:

5.根据权利要求2所述的音频处理方法,其特征在于,所述基于所述第一损失值、所述初始编码器网络层的第二损失值、所述初始量化器网络层的第三损失值以及所述初始解码器网络层的第四损失值对所述神经网络模型进行迭代训练,确定出所述语音处理模型,包括:

6.根据权利要求2所述的音频处理方法,其特征在于,所述将所述第一样本音频输入至所述神经网络模型之中,基于初始编码器网络层、初始量化器网络层以及初始解码器网络层进行处理,输出重建后的所述第一样本音频,包括:

7.根据权利要求6所述的音频处理方法,其特征在于,通过以下方式确定出所述第二损失值、所述第三损失值以及所述第四损失值:

8.一种音频处理装置,其特征在于,所述音频处理装置包括:

9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至7任一所述的音频处理方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的音频处理方法的步骤。


技术总结
本申请提供了一种音频处理方法、装置、电子设备及存储介质,包括:将待处理音频输入至语音处理模型的编码器网络层之中,对待处理音频的特征向量进行固定维度编码处理,输出待处理音频的离散化特征向量;将离散化特征向量输入至量化器网络层之中,对离散化特征向量进行残差矢量量化处理,输出待处理音频的残差矢量量化特征向量;将残差矢量量化特征向量输入至解码器网络层之中,对残差矢量量化特征向量进行解码处理,输出重建后的待处理音频。结合声码器监督分支的语音处理模型可以把音频信号编码为离散的表示,在声码器的辅助监督下提高重建的音频质量,保证模型性能不降低的情况下提高处理速度。

技术研发人员:张德俊,王秋明
受保护的技术使用者:北京远鉴信息技术有限公司
技术研发日:
技术公布日:2024/9/2
文档序号 : 【 39267410 】

技术研发人员:张德俊,王秋明
技术所有人:北京远鉴信息技术有限公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
张德俊王秋明北京远鉴信息技术有限公司
语音合成方法及装置与流程 返回列表
相关内容