[Beta]Routing basierend auf Request-Metadaten
Erstellen Sie Routing-Regeln basierend auf Request-Metadaten.
Einrichtung
Fügen Sie Folgendes zu Ihrer LiteLLM Proxy Config YAML-Datei hinzu.
router_settings:
enable_tag_filtering: True # 👈 Key Change
1. Erstellen Sie ein Tag
Navigieren Sie in der LiteLLM UI zu Experimental > Tag Management > Create Tag.
Erstellen Sie ein Tag namens private-data und wählen Sie nur die erlaubten Modelle für Anfragen mit diesem Tag aus. Nach der Erstellung sehen Sie das Tag auf der Tag Management-Seite.
2. Testen Sie das Tag-Routing
Jetzt testen wir die Tag-basierten Routing-Regeln.
2.1 Ungültiges Modell
Diese Anfrage wird fehlschlagen, da wir tags=private-data senden, aber das Modell gpt-4o nicht zu den erlaubten Modellen für das Tag private-data gehört.
Hier ist ein Beispiel, das dieselbe Anfrage mit dem OpenAI Python SDK sendet.
- OpenAI Python SDK
- cURL
from openai import OpenAI
client = OpenAI(
api_key="sk-1234",
base_url="http://0.0.0.0:4000/v1/"
)
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "user", "content": "Hello, how are you?"}
],
extra_body={
"tags": "private-data"
}
)
curl -L -X POST 'http://0.0.0.0:4000/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-1234' \
-d '{
"model": "gpt-4o",
"messages": [
{
"role": "user",
"content": "Hello, how are you?"
}
],
"tags": "private-data"
}'
2.2 Gültiges Modell
Diese Anfrage wird erfolgreich sein, da wir tags=private-data senden und das Modell us.anthropic.claude-3-7-sonnet-20250219-v1:0 zu den erlaubten Modellen für das Tag private-data gehört.
Hier ist ein Beispiel, das dieselbe Anfrage mit dem OpenAI Python SDK sendet.
- OpenAI Python SDK
- cURL
from openai import OpenAI
client = OpenAI(
api_key="sk-1234",
base_url="http://0.0.0.0:4000/v1/"
)
response = client.chat.completions.create(
model="us.anthropic.claude-3-7-sonnet-20250219-v1:0",
messages=[
{"role": "user", "content": "Hello, how are you?"}
],
extra_body={
"tags": "private-data"
}
)
curl -L -X POST 'http://0.0.0.0:4000/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-1234' \
-d '{
"model": "us.anthropic.claude-3-7-sonnet-20250219-v1:0",
"messages": [
{
"role": "user",
"content": "Hello, how are you?"
}
],
"tags": "private-data"
}'