Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

用CTC直接微调效果非常差 #39

Open
zyh3826 opened this issue May 25, 2023 · 7 comments
Open

用CTC直接微调效果非常差 #39

zyh3826 opened this issue May 25, 2023 · 7 comments

Comments

@zyh3826
Copy link

zyh3826 commented May 25, 2023

在common voice上使用huggingface的Wav2Vec2ForCTC进行微调,模型加载

model = Wav2Vec2ForCTC.from_pretrained(
                                        model_path,
                                        ctc_loss_reduction='mean',
                                        pad_token_id=tokenizer.pad_token_id,
                                        vocab_size=len(tokenizer))
model.freeze_feature_extractor()

loss从160直接干到4就不降了,预测的时候输入一句话,其输出向量每一行都是一样的,也就是说只输出同一个字,如图
train loss
image
eval loss
image
logits
image
pred_id
image
怎么调都无法成功。
但是在common voice上用facebook/wav2vec2-large-xlsr-53微调是有效果的
image

@LiuShixing
Copy link
Contributor

hugging face使用我用的是Wav2Vec2Model,没有用Wav2Vec2ForCTC,不知道是不是因为这个。另外,common voice是多语言吧,我们的模型只在中文上训练的。其他语言能力未知

@zyh3826
Copy link
Author

zyh3826 commented May 25, 2023

hugging face使用我用的是Wav2Vec2Model,没有用Wav2Vec2ForCTC,不知道是不是因为这个。另外,common voice是多语言吧,我们的模型只在中文上训练的。其他语言能力未知

common voice的中文数据,2GB的那个,Facebook那个也是没有CTC,自己做词表,然后接CTC微调

@lizongyao123
Copy link

@zyh3826 你直接CTC微调最后成功了吗

@zyh3826
Copy link
Author

zyh3826 commented Nov 2, 2023

@zyh3826 你直接CTC微调最后成功了吗

没有,换fb的模型了

@sugermano
Copy link

hugging face使用我用的是Wav2Vec2Model,没有用Wav2Vec2ForCTC,不知道是不是因为这个。另外,common voice是多语言吧,我们的模型只在中文上训练的。其他语言能力未知

common voice的中文数据,2GB的那个,Facebook那个也是没有CTC,自己做词表,然后接CTC微调

你好,我想请教一下怎么自己做词汇表??

@zyh3826
Copy link
Author

zyh3826 commented Sep 13, 2024

hugging face使用我用的是Wav2Vec2Model,没有用Wav2Vec2ForCTC,不知道是不是因为这个。另外,common voice是多语言吧,我们的模型只在中文上训练的。其他语言能力未知

common voice的中文数据,2GB的那个,Facebook那个也是没有CTC,自己做词表,然后接CTC微调

你好,我想请教一下怎么自己做词汇表??

时间有点久了,忘记怎么操作的了

@kirayomato
Copy link

遇到了一样的问题,loss下降到一定值以后就不再下降,输出全是空白

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants