History for inference_with_transformers_zh · ymcui/Chinese-LLaMA-Alpaca-2 Wiki

update inference_with_transformers

iMountTai committed Dec 25, 2023

e7283dc

Add usage instruction of the parameter `--flash_attn`

GoGoJoestar committed Oct 25, 2023

d2aeb9a

add speculative sampling

airaria committed Oct 8, 2023

2fe7c9c

Updated inference_with_transformers_zh (markdown)

airaria committed Aug 8, 2023

65187bf

Updated inference_with_transformers_zh (markdown)

airaria committed Aug 3, 2023

dcb19b3

Merge branch 'master' of https://github.com/ymcui/Chinese-LLaMA-Alpaca-2.wiki

ymcui committed Aug 2, 2023

175fbe3

prioritize full mode usage, fix style

ymcui committed Aug 2, 2023

f315a70

reserve load_in_8bit

iMountTai committed Aug 2, 2023

8f11798

修改load_in_8bit为load_in_kbit及部分说明信息

iMountTai committed Aug 2, 2023

c945b48

Updated inference_with_transformers_zh (markdown)

GoGoJoestar committed Aug 1, 2023

d3106d7

Updated inference_with_transformers_zh (markdown)

airaria committed Aug 1, 2023

5ed3037

Updated inference_with_transformers_zh (markdown)

airaria committed Aug 1, 2023

c42591d

Updated inference_with_transformers_zh (markdown)

ymcui committed Jul 31, 2023

77adb0a

init

ymcui committed Jul 31, 2023

4c401b3

Provide feedback