用CTC直接微调效果非常差 #39

zyh3826 · 2023-05-25T01:32:11Z

在common voice上使用huggingface的Wav2Vec2ForCTC进行微调，模型加载

model = Wav2Vec2ForCTC.from_pretrained(
                                        model_path,
                                        ctc_loss_reduction='mean',
                                        pad_token_id=tokenizer.pad_token_id,
                                        vocab_size=len(tokenizer))
model.freeze_feature_extractor()

loss从160直接干到4就不降了，预测的时候输入一句话，其输出向量每一行都是一样的，也就是说只输出同一个字，如图
train loss

eval loss

logits

pred_id

怎么调都无法成功。
但是在common voice上用facebook/wav2vec2-large-xlsr-53微调是有效果的

The text was updated successfully, but these errors were encountered:

LiuShixing · 2023-05-25T01:51:41Z

hugging face使用我用的是Wav2Vec2Model，没有用Wav2Vec2ForCTC，不知道是不是因为这个。另外，common voice是多语言吧，我们的模型只在中文上训练的。其他语言能力未知

zyh3826 · 2023-05-25T09:42:15Z

hugging face使用我用的是Wav2Vec2Model，没有用Wav2Vec2ForCTC，不知道是不是因为这个。另外，common voice是多语言吧，我们的模型只在中文上训练的。其他语言能力未知

common voice的中文数据，2GB的那个，Facebook那个也是没有CTC，自己做词表，然后接CTC微调

lizongyao123 · 2023-10-20T06:32:58Z

@zyh3826 你直接CTC微调最后成功了吗

zyh3826 · 2023-11-02T08:49:04Z

@zyh3826 你直接CTC微调最后成功了吗

没有，换fb的模型了

sugermano · 2024-09-11T05:29:27Z

hugging face使用我用的是Wav2Vec2Model，没有用Wav2Vec2ForCTC，不知道是不是因为这个。另外，common voice是多语言吧，我们的模型只在中文上训练的。其他语言能力未知

common voice的中文数据，2GB的那个，Facebook那个也是没有CTC，自己做词表，然后接CTC微调

你好，我想请教一下怎么自己做词汇表？？

zyh3826 · 2024-09-13T08:53:34Z

hugging face使用我用的是Wav2Vec2Model，没有用Wav2Vec2ForCTC，不知道是不是因为这个。另外，common voice是多语言吧，我们的模型只在中文上训练的。其他语言能力未知

common voice的中文数据，2GB的那个，Facebook那个也是没有CTC，自己做词表，然后接CTC微调

你好，我想请教一下怎么自己做词汇表？？

时间有点久了，忘记怎么操作的了

kirayomato · 2025-02-09T11:49:10Z

遇到了一样的问题，loss下降到一定值以后就不再下降，输出全是空白

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

用CTC直接微调效果非常差 #39

用CTC直接微调效果非常差 #39

zyh3826 commented May 25, 2023

LiuShixing commented May 25, 2023

zyh3826 commented May 25, 2023

lizongyao123 commented Oct 20, 2023

zyh3826 commented Nov 2, 2023

sugermano commented Sep 11, 2024

zyh3826 commented Sep 13, 2024

kirayomato commented Feb 9, 2025

用CTC直接微调效果非常差 #39

用CTC直接微调效果非常差 #39

Comments

zyh3826 commented May 25, 2023

LiuShixing commented May 25, 2023

zyh3826 commented May 25, 2023

lizongyao123 commented Oct 20, 2023

zyh3826 commented Nov 2, 2023

sugermano commented Sep 11, 2024

zyh3826 commented Sep 13, 2024

kirayomato commented Feb 9, 2025