feat: update Ollama embedding API to latest version with multi-text embedding support (#1715)

SLKun · web-flow · commit e7e99e558afa · 2024-08-06T23:43:20.000+08:00
diff --git a/relay/adaptor/ollama/adaptor.go b/relay/adaptor/ollama/adaptor.go
@@ -24,7 +24,7 @@ func (a *Adaptor) GetRequestURL(meta *meta.Meta) (string, error) {
 	// https://github.com/ollama/ollama/blob/main/docs/api.md
 	fullRequestURL := fmt.Sprintf("%s/api/chat", meta.BaseURL)
 	if meta.Mode == relaymode.Embeddings {
-		fullRequestURL = fmt.Sprintf("%s/api/embeddings", meta.BaseURL)
+		fullRequestURL = fmt.Sprintf("%s/api/embed", meta.BaseURL)
 	}
 	return fullRequestURL, nil
 }
diff --git a/relay/adaptor/ollama/main.go b/relay/adaptor/ollama/main.go
@@ -157,8 +157,15 @@ func StreamHandler(c *gin.Context, resp *http.Response) (*model.ErrorWithStatusC
 
 func ConvertEmbeddingRequest(request model.GeneralOpenAIRequest) *EmbeddingRequest {
 	return &EmbeddingRequest{
-		Model:  request.Model,
-		Prompt: strings.Join(request.ParseInput(), " "),
+		Model: request.Model,
+		Input: request.ParseInput(),
+		Options: &Options{
+			Seed:             int(request.Seed),
+			Temperature:      request.Temperature,
+			TopP:             request.TopP,
+			FrequencyPenalty: request.FrequencyPenalty,
+			PresencePenalty:  request.PresencePenalty,
+		},
 	}
 }
 
@@ -201,15 +208,17 @@ func embeddingResponseOllama2OpenAI(response *EmbeddingResponse) *openai.Embeddi
 	openAIEmbeddingResponse := openai.EmbeddingResponse{
 		Object: "list",
 		Data:   make([]openai.EmbeddingResponseItem, 0, 1),
-		Model:  "text-embedding-v1",
+		Model:  response.Model,
 		Usage:  model.Usage{TotalTokens: 0},
 	}
 
-	openAIEmbeddingResponse.Data = append(openAIEmbeddingResponse.Data, openai.EmbeddingResponseItem{
-		Object:    `embedding`,
-		Index:     0,
-		Embedding: response.Embedding,
-	})
+	for i, embedding := range response.Embeddings {
+		openAIEmbeddingResponse.Data = append(openAIEmbeddingResponse.Data, openai.EmbeddingResponseItem{
+			Object:    `embedding`,
+			Index:     i,
+			Embedding: embedding,
+		})
+	}
 	return &openAIEmbeddingResponse
 }
 
diff --git a/relay/adaptor/ollama/model.go b/relay/adaptor/ollama/model.go
@@ -37,11 +37,15 @@ type ChatResponse struct {
 }
 
 type EmbeddingRequest struct {
-	Model  string `json:"model"`
-	Prompt string `json:"prompt"`
+	Model string   `json:"model"`
+	Input []string `json:"input"`
+	// Truncate  bool     `json:"truncate,omitempty"`
+	Options *Options `json:"options,omitempty"`
+	// KeepAlive string   `json:"keep_alive,omitempty"`
 }
 
 type EmbeddingResponse struct {
-	Error     string    `json:"error,omitempty"`
-	Embedding []float64 `json:"embedding,omitempty"`
+	Error      string      `json:"error,omitempty"`
+	Model      string      `json:"model"`
+	Embeddings [][]float64 `json:"embeddings"`
 }

Original file line number	Diff line number	Diff line change
`@@ -24,7 +24,7 @@ func (a Adaptor) GetRequestURL(meta meta.Meta) (string, error) {`
`24`	`24`	`// https://github.com/ollama/ollama/blob/main/docs/api.md`
`25`	`25`	`fullRequestURL := fmt.Sprintf("%s/api/chat", meta.BaseURL)`
`26`	`26`	`if meta.Mode == relaymode.Embeddings {`
`27`		`- fullRequestURL = fmt.Sprintf("%s/api/embeddings", meta.BaseURL)`
	`27`	`+ fullRequestURL = fmt.Sprintf("%s/api/embed", meta.BaseURL)`
`28`	`28`	`}`
`29`	`29`	`return fullRequestURL, nil`
`30`	`30`	`}`
Original file line number	Diff line number	Diff line change
`@@ -37,11 +37,15 @@ type ChatResponse struct {`
`37`	`37`	`}`
`38`	`38`
`39`	`39`	`type EmbeddingRequest struct {`
`40`		- Model string `json:"model"`
`41`		- Prompt string `json:"prompt"`
	`40`	+ Model string `json:"model"`
	`41`	+ Input []string `json:"input"`
	`42`	+ // Truncate bool `json:"truncate,omitempty"`
	`43`	+ Options *Options `json:"options,omitempty"`
	`44`	+ // KeepAlive string `json:"keep_alive,omitempty"`
`42`	`45`	`}`
`43`	`46`
`44`	`47`	`type EmbeddingResponse struct {`
`45`		- Error string `json:"error,omitempty"`
`46`		- Embedding []float64 `json:"embedding,omitempty"`
	`48`	+ Error string `json:"error,omitempty"`
	`49`	+ Model string `json:"model"`
	`50`	+ Embeddings [][]float64 `json:"embeddings"`
`47`	`51`	`}`