K230自定义唤醒词训练时过拟合,且模型无法识别

Viewed 97

问题描述


只训练一个唤醒词,训练时第一轮acc就到1了,导出的kmodel文件无法识别,用官方提供的kmodel倒是可以正常识别,可以排除是硬件问题。训练时提供了500条15s秒的wav文件(16kHz / 16bit,wav_from_k230.zip),通过训练脚本拆分后得到约2500条含有单个唤醒词的样本,音频样本抽测过均正常。

复现步骤


1、将wav_from_k230.zip文件放置在speechcommand_v1文件夹内,zip文件的目录为:wav_from_k230.zip->wav_from_k230->xiaozhixiaozhi->xiaozhi_n.wav,同时在speechcommand_v1内下载了speech_commands_v0.01.tar.gz负样本数据。
2、在s0目录下运行./run.sh -1 5 "/root/K230_training_scripts/end2end_kws_doc/" xiaozhixiaozhi 2 0 之后第一轮就出现了过拟合的现象。

1 Answers

你可以跑完100个epoch试试,第一轮的结果训练出来的模型并没有那么好。

这边尝试过100个epoch跑完,每个回合的epoch都是接近1的,最后导出的kmodel也无法正常识别。我看了下社区中其他关于唤醒词训练的问题,跟我的情况很类似,不过没有看到解决方案。

数据是使用k230采集的吗?麦克风采集的数据也不一样,需要使用230采集适配的语音数据。

嗯嗯是的