原创

语音系列-wenet之pytorch模型导出为Onnx模型后结果前后不一致

2024-06-26 09:44:34

使用comformer模型训练了一个粤语语音识别模型，后面使用export_onnx_gpu.py将pytorch模型导出为Onnx模型，两个模型识别结果相差很大，Onnx模型结果明显要差

看到github也有人提出相同的issue,但是没有解决方法。后来一点点比对pt和onnx的输出，最终找到差距是推理代码的 eos和sos的id被固定为len(vocab) - 1

#wenet/runtime/gpu/model\_repo/scoring/1/model.py
sos = eos = len(vocab) - 1 # 这里应该改为sos = eos =2

#wenet/bin/recognize\_onnx\_gpu.py
eos = sos = len(char\_dict) - 1 # 这里应该改为sos = eos =2

因为build dict的时候 echo "<sos/eos> 2" >> \$dict 直接固化为2了

if [ \${stage} -le 2 ] && [ \${stop\_stage} -ge 2 ]; then
echo "Make a dictionary"
mkdir -p \$(dirname \$dict)
echo " 0" > \${dict} # 0 is for "blank" in CTC
echo " 1" >> \${dict} # must be 1
echo "<sos/eos> 2" >> \$dict

0条评论

0 / 1000

林****玉

6文章数

0点赞数

0粉丝数

林****玉

6 文章 | 0 粉丝

林****玉

6文章数

0点赞数

0粉丝数

林****玉

6 文章 | 0 粉丝

原创

语音系列-wenet之pytorch模型导出为Onnx模型后结果前后不一致

2024-06-26 09:44:34

使用comformer模型训练了一个粤语语音识别模型，后面使用export_onnx_gpu.py将pytorch模型导出为Onnx模型，两个模型识别结果相差很大，Onnx模型结果明显要差

看到github也有人提出相同的issue,但是没有解决方法。后来一点点比对pt和onnx的输出，最终找到差距是推理代码的 eos和sos的id被固定为len(vocab) - 1

#wenet/runtime/gpu/model\_repo/scoring/1/model.py
sos = eos = len(vocab) - 1 # 这里应该改为sos = eos =2

#wenet/bin/recognize\_onnx\_gpu.py
eos = sos = len(char\_dict) - 1 # 这里应该改为sos = eos =2

因为build dict的时候 echo "<sos/eos> 2" >> \$dict 直接固化为2了

if [ \${stage} -le 2 ] && [ \${stop\_stage} -ge 2 ]; then
echo "Make a dictionary"
mkdir -p \$(dirname \$dict)
echo " 0" > \${dict} # 0 is for "blank" in CTC
echo " 1" >> \${dict} # must be 1
echo "<sos/eos> 2" >> \$dict

文章来自个人专栏

文章 | 订阅

0条评论

0 / 1000

请输入你的评论

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

语音系列-wenet之pytorch模型导出为Onnx模型后结果前后不一致

语音系列-wenet之pytorch模型导出为Onnx模型后结果前后不一致

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

语音系列-wenet之pytorch模型导出为Onnx模型后结果前后不一致

语音系列-wenet之pytorch模型导出为Onnx模型后结果前后不一致