新一代信息技术

当前位置: 首页 > 科技资源 > 专利推介 > 新一代信息技术 > 正文

一种基于多尺度通道分离卷积特征提取的说话人聚类方法

专利号:ZL202210588389.0

专利类型:发明授权

发明人:李海滨; 张晓龙; 李雅倩; 肖存军

公开(公告)日:2023-9-12

转化方式:转让、许可、作价入股

联系人:周老师

联系电话:0335-8518633

发明人 李海滨; 张晓龙; 李雅倩; 肖存军 公开(公告)日 2023-9-12
专利类型 发明授权 转化方式 转让、许可、作价入股
联系人 周老师 联系电话 0335-8518633
本发明公开了一种基于多尺度通道分离卷积特征提取的说话人聚类方法,属于声纹识别技术领域,包括以下步骤:将VoxCeleb和AMI数据集切分为训练集、开发集和测试集;对VoxCeleb和AMI数据进行预处理;在ECAPA‑TDNN网络框架的基础上搭建多尺度通道分离卷积模块;选用AAM‑softmax损失函数对模型进行多次训练得到最优模型;利用多尺度通道分离卷积模型对AMI会议数据提取特征,并运用谱聚类进行聚类分析;使用标准的分割聚类错误率DER对聚类结果打分。本发明能够提取到具有判别性的声纹特征,并在谱聚类算法上取得良好的效果,以相对较小的参数量为代价取得了更低的分割聚类错误率。

关闭

河北省秦皇岛市河北大街西段438号燕山大学世纪楼1307

0335-8057035  0335-8067036

jszy@ysu.edu.cn

©版权所有:燕山大学科技产业促进中心

  • 微信公众号