v1.67.4-stable - Improved User Management

26. April 2025

Krrish Dholakia

CEO, LiteLLM

Ishaan Jaffer

CTO, LiteLLM

Diese Version bereitstellen

Docker
Pip

docker run litellm
docker run
-e STORE_MODEL_IN_DB=True
-p 4000:4000
ghcr.io/berriai/litellm:main-v1.67.4-stable

pip install litellm

pip install litellm==1.67.4.post1

Wichtige Highlights

Verbessertes Benutzermanagement: Diese Veröffentlichung ermöglicht die Suche und Filterung von Benutzern, Schlüsseln, Teams und Modellen.
Responses API Load Balancing: Routet Anfragen über Provider-Regionen und sorgt für Sitzungskontinuität.
UI-Sitzungsprotokolle: Gruppiert mehrere Anfragen an LiteLLM zu einer Sitzung.

Verbessertes Benutzermanagement

Diese Veröffentlichung erleichtert die Verwaltung von Benutzern und Schlüsseln auf LiteLLM. Sie können jetzt Benutzer, Schlüssel, Teams und Modelle durchsuchen und filtern und Benutzereinstellungen einfacher steuern.

Neue Funktionen umfassen

Suche nach Benutzern nach E-Mail, ID, Rolle oder Team.
Alle Modelle, Teams und Schlüssel eines Benutzers an einem Ort anzeigen.
Benutzerrollen und Modellzugriff direkt vom Tab "Benutzer" ändern.

Diese Änderungen helfen Ihnen, weniger Zeit für die Einrichtung und Verwaltung von Benutzern auf LiteLLM aufzuwenden.

Responses API Load Balancing

Diese Veröffentlichung führt Load Balancing für die Responses API ein, wodurch Sie Anfragen über Provider-Regionen leiten und die Sitzungskontinuität gewährleisten können. Es funktioniert wie folgt:

Wenn eine previous_response_id angegeben ist, leitet LiteLLM die Anfrage an die ursprüngliche Bereitstellung weiter, die die vorherige Antwort generiert hat - wodurch die Sitzungskontinuität gewährleistet wird.
Wenn keine previous_response_id angegeben ist, verteilt LiteLLM die Anfragen auf Ihre verfügbaren Bereitstellungen.

Mehr erfahren

UI-Sitzungsprotokolle

Diese Veröffentlichung ermöglicht es Ihnen, Anfragen an den LiteLLM-Proxy zu einer Sitzung zu gruppieren. Wenn Sie eine 'litellm_session_id' in Ihrer Anfrage angeben, gruppiert LiteLLM automatisch alle Protokolle in derselben Sitzung. Dies ermöglicht es Ihnen, die Nutzung und den Anfrageinhalt pro Sitzung einfach zu verfolgen.

Mehr erfahren

Neue Modelle / Aktualisierte Modelle

OpenAI
1. Kostenverfolgung für 'gpt-image-1' hinzugefügt Erste Schritte
2. Fehlerbehebung: Kostenverfolgung für gpt-image-1 hinzugefügt, wenn die Qualität nicht angegeben ist PR
Azure
1. Zeitstempel-Granularitäten an Whisper in Azure übergeben, korrigiert Erste Schritte
2. Preise für azure/gpt-image-1 hinzugefügt Erste Schritte, PR
3. Kostenverfolgung für 'azure/computer-use-preview', 'azure/gpt-4o-audio-preview-2024-12-17', 'azure/gpt-4o-mini-audio-preview-2024-12-17' hinzugefügt PR
Bedrock
1. Unterstützung für alle kompatiblen Bedrock-Parameter hinzugefügt, wenn model="arn:.." (Bedrock-Anwendungsinferenzprofil-Modelle) Erste Schritte, PR
2. Falsche System-Prompt-Transformation korrigiert PR
VertexAI / Google AI Studio
1. Setzen von 'budget_tokens=0' für 'gemini-2.5-flash' zulassen Erste Schritte, PR
2. Sicherstellen, dass die zurückgegebene 'usage' die Denk-Token-Nutzung einschließt PR
3. Kostenverfolgung für 'gemini-2.5-pro-preview-03-25' hinzugefügt PR
Cohere
1. Unterstützung für cohere command-a-03-2025 hinzugefügt Erste Schritte, PR
SageMaker
1. Unterstützung für den Parameter 'max_completion_tokens' hinzugefügt Erste Schritte, PR
Antworten API
1. Unterstützung für GET- und DELETE-Operationen hinzugefügt - /v1/responses/{response_id} Erste Schritte
2. Sitzungsmanagementunterstützung für Nicht-OpenAI-Modelle hinzugefügt PR
3. Routing-Affinität hinzugefügt, um Modellkonsistenz innerhalb von Sitzungen aufrechtzuerhalten Erste Schritte, PR

Verbesserungen bei der Ausgabenverfolgung

Fehlerbehebung: Fehler bei der Spend-Nachverfolgung behoben, sodass Standard-LiteLLM-Parameter nicht im Speicher geändert werden PR
Einstellungstermine: Einstellungstermine für Azure-, VertexAI-Modelle hinzugefügt PR

Management Endpunkte / UI

Benutzer

Filterung und Suche:
- Benutzer nach user_id, Rolle, Team, sso_id filtern
- Benutzer nach E-Mail suchen
Benutzerinformationsbereich: Ein neuer Benutzerinformationsbereich wurde hinzugefügt PR
- Teams, Schlüssel, Modelle anzeigen, die mit dem Benutzer verbunden sind
- Benutzerrolle, Modellberechtigungen bearbeiten

Teams

Filterung und Suche:
- Teams nach Organisation, Team-ID filtern PR
- Teams nach Teamnamen suchen PR

Schlüssel

Schlüsselverwaltung:
- Unterstützung für Kreuzfilterung und Filterung nach Schlüssel-Hash PR
- Schlüssel-Alias-Zurücksetzung beim Zurücksetzen von Filtern korrigiert PR
- Tabellendarstellung bei Schlüssel-Erstellung korrigiert PR

UI-Protokollseite

Sitzungsprotokolle: UI-Sitzungsprotokolle hinzugefügt Erste Schritte

UI-Authentifizierung & Sicherheit

Authentifizierung erforderlich: Für alle Dashboard-Seiten ist jetzt eine Authentifizierung erforderlich PR
SSO-Korrekturen: Ungültigen Token-Fehler bei der SSO-Benutzeranmeldung behoben PR
[BETA] Verschlüsselte Token: UI auf verschlüsselte Token-Nutzung umgestellt PR
Token-Ablauf: Token-Aktualisierung durch erneutes Weiterleiten zur Anmeldeseite unterstützt (behebt ein Problem, bei dem ein abgelaufener Token eine leere Seite zeigte) PR

Allgemeine UI-Korrekturen

UI-Flackern behoben: UI-Flackerprobleme im Dashboard behoben PR
Verbesserte Terminologie: Bessere Lade- und Keine-Daten-Zustände auf den Seiten für Schlüssel und Tools PR
Azure-Modellunterstützung: Bearbeiten von Azure-öffentlichen Modellnamen und Ändern von Modellnamen nach der Erstellung korrigiert PR
Team-Modellauswahl: Fehlerbehebung für die Team-Modellauswahl PR

Logging / Guardrail Integrationen

Datadog:
1. Datadog LLM-Observability-Protokollierung korrigiert Erste Schritte, PR
Prometheus / Grafana:
1. Auswahl der Datenquelle auf der LiteLLM Grafana-Vorlage aktiviert Erste Schritte, PR
AgentOps:
1. AgentOps-Integration hinzugefügt Erste Schritte, PR
Arize:
1. Fehlende Attribute für Arize & Phoenix Integration hinzugefügt Erste Schritte, PR

Allgemeine Proxy-Verbesserungen

Caching: Caching korrigiert, um 'thinking' oder 'reasoning_effort' bei der Berechnung des Cache-Schlüssels zu berücksichtigen PR
Modellgruppen: Handhabung von Fällen korrigiert, in denen der Benutzer 'model_group' innerhalb von 'model_info' setzt PR
Passthrough-Endpunkte: Sichergestellt, dass 'PassthroughStandardLoggingPayload' mit Methode, URL, Anfrage-/Antwortkörper protokolliert wird PR
SQL-Injection beheben: Mögliche SQL-Injection-Schwachstelle in 'spend_management_endpoints.py' behoben PR

Helm

serviceAccountName im Migrationsjob korrigiert PR

Vollständige Changelog

Die vollständige Liste der Änderungen finden Sie in den GitHub Release Notes.

Diese Version bereitstellen​

Wichtige Highlights​

Verbessertes Benutzermanagement​

Responses API Load Balancing​

UI-Sitzungsprotokolle​

Neue Modelle / Aktualisierte Modelle​

Verbesserungen bei der Ausgabenverfolgung​

Management Endpunkte / UI​

Benutzer​

Teams​

Schlüssel​

UI-Protokollseite​

UI-Authentifizierung & Sicherheit​

Allgemeine UI-Korrekturen​

Logging / Guardrail Integrationen​

Allgemeine Proxy-Verbesserungen​

Helm​

Vollständige Changelog​