fix huggingface download in local LLM

RocketChat · Jan 17, 2024 · c5b23c5 · c5b23c5
1 parent fba1ed3
commit c5b23c5
Showing 1 changed file with 6 additions and 3 deletions.
diff --git a/deploy_local_llm/serve.sh b/deploy_local_llm/serve.sh
@@ -32,7 +32,8 @@ if [ -d "llama-cpp-python" ]; then
 else
     git clone --recurse-submodules https://github.com/tybalex/llama-cpp-python.git
 fi
-python3 -m pip install --no-cache -e ./llama-cpp-python
+# python3 -m pip install --no-cache -e ./llama-cpp-python
+python3 -m pip install -e ./llama-cpp-python
 
 # (Optional) export grammar file path as environment variable
 export GRAMMAR_FILE=grammar/json_grammar.gbnf
@@ -42,11 +43,13 @@ model_dir="./model"
 if [ ! -d "$model_dir" ]; then
     mkdir "$model_dir"
 fi
+model_name="openhermes-2.5-neural-chat-v3-3-slerp.Q6_K.gguf"
+llm_file="${model_dir}/${model_name}"
+model_url="https://huggingface.co/TheBloke/OpenHermes-2.5-neural-chat-v3-3-Slerp-GGUF/resolve/main/${model_name}"
 
 # Download the LLM
-llm_file="${model_dir}/openhermes-2.5-neural-chat-v3-3-slerp.Q6_K.gguf"
 if [ ! -f "$llm_file" ]; then
-    curl -o "$llm_file" https://huggingface.co/TheBloke/OpenHermes-2.5-neural-chat-v3-3-Slerp-GGUF/resolve/main/openhermes-2.5-neural-chat-v3-3-slerp.Q6_K.gguf
+    curl -L -o "$llm_file" "$model_url"
 fi
 
 # Start server