Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于stage_1输出 #79

Open
zzzzzzyc opened this issue Aug 25, 2024 · 4 comments
Open

关于stage_1输出 #79

zzzzzzyc opened this issue Aug 25, 2024 · 4 comments

Comments

@zzzzzzyc
Copy link

在使用轻量级第一阶段微调后,只得到last.ckpt这一个文件正常吗

@YOUseven
Copy link

+1,轻量级stage2微调后也是只有一个last.ckpt,推理的时候运行graphgpt_eval.sh怎么读取呢,直接运行会报错没有config.json

@HuizhaoWang
Copy link

+1,轻量级stage2微调后也是只有一个last.ckpt,推理的时候运行graphgpt_eval.sh怎么读取呢,直接运行会报错没有config.json

请问这个部分你解决了吗?pytorch_lightning保存的模型文件last.ckpt如何可以像huggingface中的其它模型使用?

@sustech-lz
Copy link

+1,轻量级stage2微调后也是只有一个last.ckpt,推理的时候运行graphgpt_eval.sh怎么读取呢,直接运行会报错没有config.json

请问这个部分你解决了吗?pytorch_lightning保存的模型文件last.ckpt如何可以像huggingface中的其它模型使用?

想请问大家,你们第一阶段训练了多少时间呢?这个双卡4090需要20天吗?我跑一个epoch需要7天,不知道大家是不是也这样呢?

@baidingyuan
Copy link

+1,轻量级stage2微调后也是只有一个last.ckpt,推理的时候运行graphgpt_eval.sh怎么读取呢,直接运行会报错没有config.json

请问这个部分你解决了吗?pytorch_lightning保存的模型文件last.ckpt如何可以像huggingface中的其它模型使用?

想请问大家,你们第一阶段训练了多少时间呢?这个双卡4090需要20天吗?我跑一个epoch需要7天,不知道大家是不是也这样呢?

设置有问题吧,可以把训练的sh发出来看一下,我双卡24G的4090跑一轮差不多是两天半

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants