首页  专利技术  其他产品的制造及其应用技术

歌声鉴伪模型的训练方法、歌声鉴伪方法及相关产品与流程

2025-10-16 14:40:08 40次浏览

技术特征:

1.一种歌声鉴伪模型的训练方法,其特征在于,所述歌声鉴伪模型包含歌声特征提取模型和目标分类器模型,所述训练方法包括:

2.根据权利要求1所述的训练方法,其特征在于,从机器演唱的歌曲样本中提取各歌声片段作为正样本歌声片段之后,所述训练方法还包括:

3.根据权利要求1或2所述的训练方法,其特征在于,提取所述正样本歌声片段和所述负样本歌声片段各自对应的歌声特征之后,所述训练方法还包括:

4.根据权利要求1或2所述的训练方法,其特征在于,所述使用所述正样本歌声片段和所述负样本歌声片段各自对应的标签信息、所述歌声特征对初始分类器模型进行训练,包括:

5.根据权利要求4所述的训练方法,其特征在于,若所述歌声辅助特征包含不同类型的多类特征,所述训练方法还包括:

6.根据权利要求1所述的训练方法,其特征在于,若融合概率大于等于目标判断阈值,所述融合概率由所述正样本歌声片段和所述负样本歌声片段各自对应的所述预测概率融合得到的,则确定所述样本歌曲为机器演唱的歌曲样本;所述目标判断阈值的确定过程,包括:

7.一种歌声鉴伪方法,其特征在于,包括:

8.根据权利要求7所述的歌声鉴伪方法,其特征在于,若所述歌声鉴伪模型有多个,且各所述歌声鉴伪模型之间的歌曲样本存在类型差别,所述类型差别不包含机器演唱或真人演唱的区分,则所述歌声鉴伪方法还包括:

9.根据权利要求7所述的歌声鉴伪方法,其特征在于,将所述各歌声片段输入歌声鉴伪模型,以得到所述各歌声片段分别被预测为机器演唱片段的预测概率之后,所述歌声鉴伪方法还包括:

10.一种电子设备,其特征在于,包括:

11.一种计算机可读存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至6中任意一项或权利要求7至9中任意一项所述的方法。

12.一种包含指令或计算机程序的计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得计算机执行如权利要求1至6中任意一项或权利要求7至9中任意一项所述的方法。


技术总结
本申请实施例公开了歌声鉴伪模型的训练方法、歌声鉴伪方法及相关产品,该训练方法包括:获取机器演唱的正样本歌声片段、真人演唱的负样本歌声片段;将各歌声片段分别输入歌声特征提取模型,得到各歌声片段的歌声特征,此歌声特征提取模型采用对比学习思想训练得到;使用各歌声片段的标签信息、歌声特征对初始分类器模型进行训练,得到目标分类器模型;目标分类器模型用于判断待测歌曲是否为机器演唱。采用歌声特征提取模型提取歌声特征,可有效替代人工快而准地学习到机器演唱和真人演唱之间的声学差异,以保障目标分类器模型鉴别歌曲真伪时的效率和准确度,同时,填补对机器生成歌声进行检测的技术空缺。

技术研发人员:汪照文,江益靓,孔令城,赵伟峰,周文江,徐雨晴,吕烨子,林艳秋
受保护的技术使用者:腾讯音乐娱乐科技(深圳)有限公司
技术研发日:
技术公布日:2024/9/2
文档序号 : 【 39266866 】

技术研发人员:汪照文,江益靓,孔令城,赵伟峰,周文江,徐雨晴,吕烨子,林艳秋
技术所有人:腾讯音乐娱乐科技(深圳)有限公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
汪照文江益靓孔令城赵伟峰周文江徐雨晴吕烨子林艳秋腾讯音乐娱乐科技(深圳)有限公司
样本增强方法、装置、计算机设备和存储介质与流程 语音合成方法及装置与流程
相关内容