v1.63.11-stable

15. März 2025

Krrish Dholakia

CEO, LiteLLM

Ishaan Jaffer

CTO, LiteLLM

Dies sind die Änderungen seit v1.63.2-stable.

Diese Version konzentriert sich hauptsächlich auf

[Beta]Responses API-Unterstützung
Snowflake Cortex Unterstützung, Amazon Nova Bildgenerierung
UI - Anmeldedatenverwaltung, Wiederverwendung von Anmeldedaten beim Hinzufügen neuer Modelle
UI - Testen der Verbindung zum LLM-Anbieter vor dem Hinzufügen eines Modells

Bekannte Probleme

🚨 Bekanntes Problem bei Azure OpenAI - Wir empfehlen kein Upgrade, wenn Sie Azure OpenAI verwenden. Diese Version ist bei unserem Azure OpenAI Lasttest fehlgeschlagen.

Docker Run LiteLLM Proxy

docker run
-e STORE_MODEL_IN_DB=True
-p 4000:4000
ghcr.io/berriai/litellm:main-v1.63.11-stable

Demo-Instanz

Hier ist eine Demo-Instanz, um Änderungen zu testen

Instanz: https://demo.litellm.ai/
Anmeldedaten
- Benutzername: admin
- Passwort: sk-1234

Neue Modelle / Aktualisierte Modelle

Bildgenerierungsunterstützung für Amazon Nova Canvas. Erste Schritte
Preise für neue Jamba-Modelle hinzugefügt. PR
Preise für Amazon EU-Modelle hinzugefügt. PR
Preise für Bedrock Deepseek R1-Modelle hinzugefügt. PR
Gemini-Preise aktualisiert: Gemma 3, Flash 2 Thinking-Update, LearnLM. PR
Cohere Embedding 3-Modelle als Multimodal markiert. PR
Azure Data Zone Preisgestaltung hinzufügen PR
- LiteLLM verfolgt Kosten für Modelle in azure/eu und azure/us

LLM-Übersetzung

Neue Endpunkte

[Beta]POST /responses API. Erste Schritte

Neue LLM-Anbieter

Snowflake Cortex Erste Schritte

Neue LLM-Funktionen

Unterstützt reasoning_content von OpenRouter beim Streaming Erste Schritte

Fehlerbehebungen

OpenAI: Gibt code, param und type bei fehlerhaften Anfragen zurück Weitere Informationen zu litellm-Ausnahmen
Bedrock: Korrigiert das Parsen von Converse-Chunks, um bei Tool-Nutzung nur ein leeres Dict zurückzugeben PR
Bedrock: Unterstützt extra_headers PR
Azure: Korrigiert Funktionsaufruf-Bug & aktualisiert Standard-API-Version auf 2025-02-01-preview PR
Azure: Korrigiert URL für KI-Dienste PR
Vertex AI: Behandelt HTTP-Statuscode 201 in der Antwort PR
Perplexity: Korrigiert falsche Streaming-Antwort PR
Triton: Korrigiert Bug bei Streaming-Abschlüssen PR
Deepgram: Unterstützt Bytes.IO beim Verarbeiten von Audiodateien für Transkriptionen PR
Ollama: Korrigiert "system"-Rolle, die inakzeptabel geworden ist PR
Alle Anbieter (Streaming): Korrigiert, dass der String data: aus dem gesamten Inhalt gestreamter Antworten entfernt wurde PR

Verbesserungen bei der Ausgabenverfolgung

Unterstützt Bedrock Converse Cache Token Tracking Erste Schritte
Kostenverfolgung für Responses API Erste Schritte
Korrigiert Kostenverfolgung für Azure Whisper Erste Schritte

UI

Anmeldeinformationen in der UI wiederverwenden

Sie können jetzt LLM-Anbieteranmeldeinformationen in der LiteLLM UI integrieren. Sobald diese Anmeldeinformationen hinzugefügt wurden, können Sie sie beim Hinzufügen neuer Modelle wiederverwenden Erste Schritte

Verbindungen testen, bevor Modelle hinzugefügt werden

Bevor Sie ein Modell hinzufügen, können Sie die Verbindung zum LLM-Anbieter testen, um zu überprüfen, ob Sie Ihre API-Basis + API-Schlüssel korrekt eingerichtet haben.

Allgemeine UI-Verbesserungen

Modelle hinzufügen-Seite
- Ermöglicht das Hinzufügen von Cerebras-, Sambanova-, Perplexity-, Fireworks-, Openrouter-, TogetherAI-Modellen, Text-Completion OpenAI im Admin-UI
- Ermöglicht das Hinzufügen von EU-OpenAI-Modellen
- Behebung: Bearbeiten und Löschen von Modellen sofort anzeigen
Schlüssel-Seite
- Behebung: Neu erstellte Schlüssel sofort im Admin-UI anzeigen (kein Aktualisieren erforderlich)
- Behebung: Ermöglicht das Klicken auf Top-Schlüssel, wenn Benutzer den Top-API-Schlüssel angezeigt werden
- Behebung: Ermöglicht das Filtern von Schlüsseln nach Team-Alias, Schlüssel-Alias und Org
- UI-Verbesserungen: 100 Schlüssel pro Seite anzeigen, volle Höhe nutzen, Breite des Schlüssel-Alias erhöhen
Benutzerseite
- Behebung: Korrekte Anzahl interner Benutzerschlüssel auf der Benutzerseite anzeigen
- Behebung: Metadaten werden in der Team-UI nicht aktualisiert
Protokolle-Seite
- UI-Verbesserungen: Erweitertes Protokoll im Fokus auf LiteLLM UI halten
- UI-Verbesserungen: Kleinere Verbesserungen auf der Protokollseite
- Behebung: Ermöglicht internen Benutzern, ihre eigenen Protokolle abzufragen
- Speicherung von Fehlerprotokollen in der DB ausschalten Erste Schritte
Anmelden/Abmelden
- Behebung: Korrekte Verwendung von PROXY_LOGOUT_URL, wenn gesetzt Erste Schritte

Sicherheit

Unterstützung für rotierende Master-Schlüssel Erste Schritte
Behebung: Berechtigungen für interne Benutzeransichten, die Rolle internal_user_viewer darf nicht die Test Key Page oder den Create Key Button sehen Weitere Informationen zu rollenbasierter Zugriffskontrolle
Audit-Protokolle für alle Benutzer- und Modellerstellungs-/Update-/Lösch-Endpunkte ausgeben Erste Schritte
JWT
- Unterstützung für mehrere JWT OIDC-Anbieter Erste Schritte
- Behebung: JWT-Zugriff mit Gruppen funktioniert nicht, wenn einem Team Zugriff auf alle Proxy-Modelle zugewiesen ist
Verwendung von K/V-Paaren in einem AWS-Secret Erste Schritte

Logging-Integrationen

Prometheus: Metrik für die Latenz der Azure LLM-API verfolgen Erste Schritte
Athina: Tags, Benutzerfeedback und Modelloptionen zu additional_keys hinzugefügt, die an Athina gesendet werden können Erste Schritte

Leistungs- / Zuverlässigkeitsverbesserungen

Redis + litellm router - Korrigiert Redis-Cluster-Modus für litellm-Router PR

Allgemeine Verbesserungen

OpenWebUI-Integration - thinking-Token anzeigen

Anleitung für den Einstieg in LiteLLM x OpenWebUI. Erste Schritte
thinking-Token auf OpenWebUI anzeigen (Bedrock, Anthropic, Deepseek) Erste Schritte

Vollständiger Git-Diff

Hier ist der vollständige Git-Diff

Bekannte Probleme​

Docker Run LiteLLM Proxy​

Demo-Instanz​

Neue Modelle / Aktualisierte Modelle​

LLM-Übersetzung​

Verbesserungen bei der Ausgabenverfolgung​

UI​

Anmeldeinformationen in der UI wiederverwenden​

Verbindungen testen, bevor Modelle hinzugefügt werden​

Allgemeine UI-Verbesserungen​

Sicherheit​

Logging-Integrationen​

Leistungs- / Zuverlässigkeitsverbesserungen​

Allgemeine Verbesserungen​

Vollständiger Git-Diff​