sagemaker_mixtral_quantize_and_eval

Quantize and host a Mixtral with SageMaker LMI and evaluate it with SageMaker Clarify

mixtral_LMI-8bit.ipynb - deploy an 8bit quantized Mixtral model on a SageMaker Endpoint

mixtral_LMI-bf16.ipynb - deploy an 16bit (bf16) Mixtral model on a SageMaker Endpoint

eval_mixtral.ipynb - Use SageMaker Clarify with fmeval to evaluate the 8bit model

Refereneces

4x NVIDIA A10G

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
djl-hf-mixtral-8bit		djl-hf-mixtral-8bit
djl-hf-mixtral-bf16		djl-hf-mixtral-bf16
old		old
trtllm-llama2-7b-chat		trtllm-llama2-7b-chat
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
eval_mixtral.ipynb		eval_mixtral.ipynb
llama2-7b_TRTLLM.ipynb		llama2-7b_TRTLLM.ipynb
mixtral_LMI-8bit.ipynb		mixtral_LMI-8bit.ipynb
mixtral_LMI-bf16.ipynb		mixtral_LMI-bf16.ipynb
trex_sample.jsonl		trex_sample.jsonl

Provide feedback