fix: improve error handling and remove unnecessary OpenAI client initialization in HuggingFaceProvider

pravinpaudel · pravinpaudel · commit 72b57515357b · 2025-06-09T20:03:33.000-03:00
diff --git a/apps/backend/app/agent/manager.py b/apps/backend/app/agent/manager.py
@@ -38,7 +38,7 @@ async def _get_provider(self, **kwargs: Any) -> OllamaProvider | OpenAIProvider
             raise ProviderError(
                 f"Ollama Model '{model}' is not found. Run `ollama pull {model} or pick from any available models {installed_ollama_models}"
             )
-        return OllamaProvider(model_name=model, host="http://localhost:11434")
+        return OllamaProvider(model_name=model)
 
     async def run(self, prompt: str, **kwargs: Any) -> Dict[str, Any]:
         """
diff --git a/apps/backend/app/agent/providers/huggingface.py b/apps/backend/app/agent/providers/huggingface.py
@@ -15,11 +15,7 @@ def __init__(self, model_name: str = "microsoft/Phi-3-mini-4k-instruct"):
         self._api_key = os.getenv("HF_API_KEY")
         if not self._api_key:
             raise ProviderError("Hugging Face API key is missing")
-        # Initialize the OpenAI client with Hugging Face API endpoint
-        self._client = OpenAI(
-            base_url="https://api-inference.huggingface.co/models",
-            api_key=self._api_key,
-        )
+        
  
     async def __call__(self, prompt: str, **generation_args: Any) -> str:
         opts = {
@@ -38,7 +34,7 @@ def _generate_sync(self, prompt: str, options: Dict[str, Any]) -> str:
                 "parameters": {
                     "temperature": options.get("temperature", 0.7),
                     "top_p": options.get("top_p", 0.9),
-                    "max_new_tokens": options.get("max_tokens", 20000),
+                    "max_tokens": options.get("max_tokens", 20000),
                 }
             }
             response = requests.post(
@@ -47,13 +43,20 @@ def _generate_sync(self, prompt: str, options: Dict[str, Any]) -> str:
                 json=payload
             )
             response.raise_for_status()  # Raise an exception for 4XX/5XX responses
-            return response.json()[0]["generated_text"]
+            response_data = response.json()
+            if not response_data or not isinstance(response_data, list) or len(response_data) == 0:
+                raise ProviderError("Invalid response format from Hugging Face API")
+            if "generated_text" not in response_data[0]:
+                raise ProviderError("Missing 'generated_text' in Hugging Face API response")
+            return response_data[0]["generated_text"]
         except Exception as e:
             raise ProviderError(f"Hugging Face - error generating response: {e}") from e
 
 class HuggingFaceEmbeddingProvider(EmbeddingProvider):
     def __init__(self, api_key: str | None = None, embedding_model: str = "sentence-transformers/all-MiniLM-L6-v2"):
         self._api_key = api_key or os.getenv("HF_API_KEY")
+        if not self._api_key:
+            raise ProviderError("Hugging Face API key is missing")
         self._model = SentenceTransformer(embedding_model)
     
     async def embed(self, text: str) -> list[float]:

Original file line number	Diff line number	Diff line change
`@@ -38,7 +38,7 @@ async def _get_provider(self, **kwargs: Any) -> OllamaProvider \| OpenAIProvider`
`38`	`38`	`raise ProviderError(`
`39`	`39`	f"Ollama Model '{model}' is not found. Run `ollama pull {model} or pick from any available models {installed_ollama_models}"
`40`	`40`	`)`
`41`		`- return OllamaProvider(model_name=model, host="http://localhost:11434")`
	`41`	`+ return OllamaProvider(model_name=model)`
`42`	`42`
`43`	`43`	`async def run(self, prompt: str, **kwargs: Any) -> Dict[str, Any]:`
`44`	`44`	`"""`