Rerank-Provider hinzufügen
LiteLLM folgt dem Cohere Rerank API-Format für alle Rerank-Provider. So fügen Sie einen neuen Rerank-Provider hinzu:
1. Erstellen Sie eine transformation.py-Datei
Erstellen Sie eine Konfigurationsklasse namens <Provider><Endpoint>Config, die von BaseRerankConfig erbt.
from litellm.types.rerank import OptionalRerankParams, RerankRequest, RerankResponse
class YourProviderRerankConfig(BaseRerankConfig):
def get_supported_cohere_rerank_params(self, model: str) -> list:
return [
"query",
"documents",
"top_n",
# ... other supported params
]
def transform_rerank_request(self, model: str, optional_rerank_params: OptionalRerankParams, headers: dict) -> dict:
# Transform request to RerankRequest spec
return rerank_request.model_dump(exclude_none=True)
def transform_rerank_response(self, model: str, raw_response: httpx.Response, ...) -> RerankResponse:
# Transform provider response to RerankResponse
return RerankResponse(**raw_response_json)
2. Registrieren Sie Ihren Provider
Fügen Sie Ihren Provider zu litellm.utils.get_provider_rerank_config() hinzu.
elif litellm.LlmProviders.YOUR_PROVIDER == provider:
return litellm.YourProviderRerankConfig()
3. Provider zu rerank_api/main.py hinzufügen
Fügen Sie einen Codeblock hinzu, um zu behandeln, wenn Ihr Provider aufgerufen wird. Ihr Provider sollte die Methode base_llm_http_handler.rerank verwenden.
elif _custom_llm_provider == "your_provider":
...
response = base_llm_http_handler.rerank(
model=model,
custom_llm_provider=_custom_llm_provider,
optional_rerank_params=optional_rerank_params,
logging_obj=litellm_logging_obj,
timeout=optional_params.timeout,
api_key=dynamic_api_key or optional_params.api_key,
api_base=api_base,
_is_async=_is_async,
headers=headers or litellm.headers or {},
client=client,
mod el_response=model_response,
)
...
4. Tests hinzufügen
Fügen Sie eine Testdatei zu tests/llm_translation hinzu.
def test_basic_rerank_cohere():
response = litellm.rerank(
model="cohere/rerank-english-v3.0",
query="hello",
documents=["hello", "world"],
top_n=3,
)
print("re rank response: ", response)
assert response.id is not None
assert response.results is not None