K230自定义唤醒词训练时过拟合，且模型无法识别

Question

问题描述

只训练一个唤醒词，训练时第一轮acc就到1了，导出的kmodel文件无法识别，用官方提供的kmodel倒是可以正常识别，可以排除是硬件问题。训练时提供了500条15s秒的wav文件(16kHz / 16bit，wav_from_k230.zip)，通过训练脚本拆分后得到约2500条含有单个唤醒词的样本，音频样本抽测过均正常。

复现步骤

1、将wav_from_k230.zip文件放置在speechcommand_v1文件夹内，zip文件的目录为：wav_from_k230.zip->wav_from_k230->xiaozhixiaozhi->xiaozhi_n.wav，同时在speechcommand_v1内下载了speech_commands_v0.01.tar.gz负样本数据。
2、在s0目录下运行./run.sh -1 5 "/root/K230_training_scripts/end2end_kws_doc/" xiaozhixiaozhi 2 0 之后第一轮就出现了过拟合的现象。

Wy001 · Answer

你可以跑完100个epoch试试，第一轮的结果训练出来的模型并没有那么好。

K230自定义唤醒词训练时过拟合，且模型无法识别

问题描述

复现步骤

1 Answers