Diese Version bereitstellen
- Docker
- Pip
docker run
-e STORE_MODEL_IN_DB=True
-p 4000:4000
ghcr.io/berriai/litellm:main-v1.66.0-stable
pip install litellm==1.66.0.post1
v1.66.0-stable ist jetzt verfügbar, hier sind die wichtigsten Highlights dieser Veröffentlichung
Wichtige Highlights
- Echtzeit-API-Kostenverfolgung: Verfolgen Sie die Kosten von Echtzeit-API-Aufrufen
- Microsoft SSO automatische Synchronisierung: Synchronisieren Sie automatisch Gruppen und Gruppenmitglieder von Azure Entra ID nach LiteLLM
- xAI grok-3: Unterstützung für
xai/grok-3Modelle hinzugefügt - Sicherheitskorrekturen: Schwachstellen CVE-2025-0330 und CVE-2024-6825 behoben
Tauchen wir ein.
Echtzeit-API-Kostenverfolgung
Diese Veröffentlichung fügt Echtzeit-API-Protokollierung + Kostenverfolgung hinzu.
- Protokollierung: LiteLLM protokolliert nun die vollständige Antwort von Echtzeit-Aufrufen für alle Protokollierungsintegrationen (DB, S3, Langfuse usw.)
- Kostenverfolgung: Sie können nun 'base_model' und benutzerdefinierte Preise für Echtzeit-Modelle festlegen. Benutzerdefinierte Preise
- Budgets: Ihre Schlüssel-/Benutzer-/Team-Budgets funktionieren nun auch für Echtzeit-Modelle.
Starten Sie hier
Microsoft SSO automatische Synchronisierung
Synchronisiert automatisch Gruppen und Mitglieder von Azure Entra ID nach LiteLLM
Diese Version fügt Unterstützung für die automatische Synchronisierung von Gruppen und Mitgliedern in Microsoft Entra ID mit LiteLLM hinzu. Das bedeutet, dass LiteLLM Proxy-Administratoren weniger Zeit mit der Verwaltung von Teams und Mitgliedern verbringen müssen und LiteLLM Folgendes übernimmt:
- Automatische Erstellung von Teams, die in Microsoft Entra ID existieren
- Synchronisierung von Teammitgliedern in Microsoft Entra ID mit LiteLLM-Teams
Starten Sie hier mit diesem Link
Neue Modelle / Aktualisierte Modelle
xAI
- Unterstützung für `reasoning_effort` für
xai/grok-3-mini-betahinzugefügt. Erste Schritte - Kostenverfolgung für
xai/grok-3-Modelle hinzugefügt. PR
- Unterstützung für `reasoning_effort` für
Hugging Face
- Unterstützung für Inferenz-Anbieter hinzugefügt. Erste Schritte
Azure
- Kostenverfolgung für `azure/gpt-4o-realtime-audio` hinzugefügt. PR
VertexAI
- Unterstützung für das `enterpriseWebSearch`-Tool hinzugefügt. Erste Schritte
- Nur Schlüssel übergeben, die vom Vertex AI-Antwortschema akzeptiert werden. PR
Google AI Studio
Azure
Databricks
Allgemein
- Dienstprogramm `litellm.supports_reasoning()` hinzugefügt, um zu verfolgen, ob eine LLM Reasoning unterstützt. Erste Schritte
- Function Calling - Pydantic Base Model in Message Tool Calls verarbeitet, `tools = []` verarbeitet und Streaming für Tool Calls bei `meta.llama3-3-70b-instruct-v1:0` unterstützt. PR
- LiteLLM Proxy - Parameter `thinking` kann über das Client-SDK an den LiteLLM Proxy übergeben werden. PR
- Parameter `thinking` für LiteLLM korrekt übersetzt. PR
Verbesserungen bei der Ausgabenverfolgung
- OpenAI, Azure
- Echtzeit-API-Kostenverfolgung mit Token-Nutzungsmetriken in Spend-Logs. Erste Schritte
- Anthropic
- Allgemein
Management Endpunkte / UI
Test Key Tab
Darstellung von Reasoning-Inhalten, TTFT (Time to First Byte) und Nutzungsmetriken auf der Test-Key-Seite hinzugefügt. PR
Anzeige von Input-, Output-, Reasoning-Tokens und TTFT-Metriken.
Tag- / Richtlinienverwaltung
Tag-/Richtlinienverwaltung hinzugefügt. Erstellung von Routing-Regeln basierend auf Request-Metadaten. Dies ermöglicht die Durchsetzung, dass Anfragen mit
tags="private"nur an bestimmte Modelle weitergeleitet werden. Erste SchritteTags erstellen und verwalten.
Login-Bildschirm neu gestaltet
- Polierter Login-Bildschirm. PR
Microsoft SSO Auto-Sync
- Debug-Route hinzugefügt, um Admins die Fehlersuche bei SSO-JWT-Feldern zu ermöglichen. PR
- Möglichkeit hinzugefügt, die MSFT Graph API zur Zuweisung von Benutzern zu Teams zu verwenden. PR
- LiteLLM mit Microsoft Entra ID Enterprise Application verbunden. PR
- Möglichkeit für Admins hinzugefügt, `default_team_params` festzulegen, wenn LiteLLM SSO Standard-Teams erstellt. PR
- MSFT SSO korrigiert, um das richtige Feld für die Benutzere-Mail zu verwenden. PR
- UI-Unterstützung für die Einstellung von "Default Team" hinzugefügt, wenn LiteLLM SSO automatisch Teams erstellt. PR
UI-Fehlerbehebungen
Verbesserungen bei Logging / Guardrails.
- Prometheus
- Key- und Team-Budgetmetriken werden als Cronjob geplant ausgegeben. Erste Schritte
Sicherheitskorrekturen.
- Gefixed CVE-2025-0330 - Leakage von Langfuse API-Schlüsseln bei der Team-Ausnahmebehandlung. PR
- Gefixed CVE-2024-6825 - Remote Code Execution in Post-Call-Regeln. PR
Helm
- Service-Annotationen zum LiteLLM-Helm-Chart hinzugefügt. PR
- Zusätzliche Umgebungsvariablen (`extraEnvVars`) zum Helm-Deployment hinzugefügt. PR
Demo
Probieren Sie es noch heute in der Demo-Instanz aus. heute
Vollständiger Git-Diff
Sehen Sie den vollständigen Git-Diff seit v1.65.4-stable hier
