[Quantization] Support loading AWQ, GPTQ, GGUF/GGML quantized models #85

xwu99 · 2024-01-26T01:22:49Z

No description provided.

* enhance streaming output Signed-off-by: jiafuzha <[email protected]> * enhance streaming output Signed-off-by: jiafuzha <[email protected]> * update UI related code * enhance streaming output Signed-off-by: jiafuzha <[email protected]> * enhance streaming output Signed-off-by: jiafuzha <[email protected]> --------- Signed-off-by: jiafuzha <[email protected]> Co-authored-by: KepingYan <[email protected]>

xwu99 changed the title ~~[Quantization] Support loading AWQ and GPTQ quantized models~~ [Quantization] Support loading AWQ, GPTQ, GGUF/GGML quantized models Jan 26, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Quantization] Support loading AWQ, GPTQ, GGUF/GGML quantized models #85

[Quantization] Support loading AWQ, GPTQ, GGUF/GGML quantized models #85

xwu99 commented Jan 26, 2024

[Quantization] Support loading AWQ, GPTQ, GGUF/GGML quantized models #85

[Quantization] Support loading AWQ, GPTQ, GGUF/GGML quantized models #85

Comments

xwu99 commented Jan 26, 2024