Semi-Supervised Instruction Fine-Tuning with JAX

Quick Start

Packages

python3 -m venv env
source env/bin/activate

pip3 install transformers  # 4.26.1
pip3 install datasets  # 2.9.0
pip3 install flax  # 0.6.4

pip3 install wandb

Important: Install jax and jaxlib as described in JAX documentations.

Data Preprocessing

mkdir -pv data/raw
mkdir -pv data/processed

git lfs install
git clone https://huggingface.co/datasets/Hello-SimpleAI/HC3 data/raw/HC3

python3 -m sft.data.convert_hc3_dataset \
    data/raw/HC3/reddit_eli5.jsonl \
    data/processed/reddit_eli5

Basic Fine-Tuning

python3 -m sft.train \
    --base_hf_model=jacobthebanana/galactica-125m \
    --early_stop_threshold=5 \
    --hf_dataset_dict=data/processed/eli5 \
    --max_learning_rate=1e-05 \
    --num_epochs=1 \
    --train_batch_size=8 \
    --train_block_size=256 \
    --train_prng_seed=0

Contributing

Unit Testing

JAX_DEBUG_NANS=True python3 -m unittest sft.tests

Acknowledgements

Research supported with compute resources from Google's TPU Research Cloud (TRC)

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
sft		sft
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Semi-Supervised Instruction Fine-Tuning with JAX

Quick Start

Packages

Data Preprocessing

Basic Fine-Tuning

Contributing

Unit Testing

Acknowledgements

About

Releases

Packages

Languages

jacobthebanana/jax-clm-sft

Folders and files

Latest commit

History

Repository files navigation

Semi-Supervised Instruction Fine-Tuning with JAX

Quick Start

Packages

Data Preprocessing

Basic Fine-Tuning

Contributing

Unit Testing

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages