mdz/pytorch/ERes2Net/1_scripts/0_infer.py

import argparse
import functools
import sys
sys.path.append(R"../0_ERes2Net")

from mvector.predict import MVectorPredictor
from mvector.utils.utils import add_arguments, print_arguments

parser = argparse.ArgumentParser(description=__doc__)
add_arg = functools.partial(add_arguments, argparser=parser)
# add_arg('configs',          str,    'configs/eres2net.yml',        '配置文件')
add_arg('configs',          str,    'configs/tdnn.yml',        '配置文件')
add_arg('audio_path1',      str,    'dataset/a_1.wav',          '预测第一个音频')
add_arg('audio_path2',      str,    'dataset/b_2.wav',          '预测第二个音频')
add_arg('threshold',        float,  0.7,                        '判断是否为同一个人的阈值')
# add_arg('model_path',       str,    '../weights/ERes2Net_TSTP_Fbank/best_model/', '模型权重文件路径')
add_arg('model_path',       str,    '../weights/TDNN_Fbank/best_model/', '模型权重文件路径')
args = parser.parse_args()
print_arguments(args=args)

# 获取识别器
predictor = MVectorPredictor(configs=args.configs,
                             model_path=args.model_path,
                             use_gpu=False)

dist = predictor.contrast(args.audio_path1, args.audio_path2)
if dist > args.threshold:
    print(f"{args.audio_path1} 和 {args.audio_path2} 为同一个人，相似度为：{dist}")
else:
    print(f"{args.audio_path1} 和 {args.audio_path2} 不是同一个人，相似度为：{dist}")