本发明公开了一种基于多尺度通道分离卷积特征提取的说话人聚类方法,属于声纹识别技术领域,包括以下步骤:将VoxCeleb和AMI数据集切分为训练集、开发集和测试集;对VoxCeleb和AMI数据进行预处理;在ECAPA‑TDNN网络框架的基础上搭建多尺度通道分离卷积模块;选用AAM‑softmax损失函数对模型进行多次训练得到最优模型;利用多尺度通道分离卷积模型对AMI会议数据提取特征,并运用谱聚类进行聚类分析;使用标准的分割聚类错误率DER对聚类结果打分。本发明能够提取到具有判别性的声纹特征,并在谱聚类算法上取得良好的效果,以相对较小的参数量为代价取得了更低的分割聚类错误率。