3 Beiträge mit dem Tag "langfuse"

Alle Tags anzeigen

v1.57.8-stable

11. Januar 2025

Krrish Dholakia

CEO, LiteLLM

Ishaan Jaffer

CTO, LiteLLM

alerting, prometheus, secret management, management endpoints, ui, prompt management, finetuning, batch

Neue / Aktualisierte Modelle

Mistral Large Preisgestaltung - https://github.com/BerriAI/litellm/pull/7452
Cohere command-r7b-12-2024 Preisgestaltung - https://github.com/BerriAI/litellm/pull/7553/files
Voyage - neue Modelle, Preise und Kontextfensterinformationen - https://github.com/BerriAI/litellm/pull/7472
Anthropic - max_output_tokens für Bedrock Claude-3-5-Haiku auf 8192 erhöhen

Allgemeine Proxy-Verbesserungen

Health-Check-Unterstützung für Echtzeitmodelle
Unterstützt das Aufrufen von Azure-Echtzeitrouten über virtuelle Schlüssel
Unterstützt benutzerdefinierte Tokenizer auf /utils/token_counter - nützlich beim Überprüfen der Token-Anzahl für selbst gehostete Modelle
Anforderungspriorisierung - unterstützt auch auf dem /v1/completion-Endpunkt

LLM-Übersetzungsverbesserungen

Deepgram STT-Unterstützung. Hier starten
OpenAI Moderationen - Unterstützung für omni-moderation-latest. Hier starten
Azure O1 - Fake-Streaming-Unterstützung. Dies stellt sicher, dass die Antwort gestreamt wird, wenn stream=true übergeben wird. Hier starten
Anthropic - Behandlung von Nicht-Leerzeichen-Zeichen als Stoppsequenz - PR
Azure OpenAI - Unterstützung für die Authentifizierung basierend auf Benutzername + Passwort von Entra ID. Hier starten
LM Studio - Embedding-Routen-Unterstützung. Hier starten
WatsonX - ZenAPIKeyAuth-Unterstützung. Hier starten

Prompt Management Verbesserungen

Langfuse-Integration
HumanLoop-Integration
Unterstützung für die Verwendung von Lastverteilungsmodellen
Unterstützung für das Laden optionaler Parameter aus dem Prompt-Manager

Hier starten

Finetuning + Batch API Verbesserungen

Verbesserte einheitliche Endpunktunterstützung für Vertex AI Finetuning - PR
Unterstützung für den Abruf von Vertex API Batch-Jobs hinzufügen - PR

NEUE Alerting-Integration

PagerDuty Alerting-Integration.

Behandelt zwei Arten von Alarmen

Hohe Ausfallrate der LLM-API. Konfigurieren Sie X Fehler in Y Sekunden, um einen Alarm auszulösen.
Hohe Anzahl von hängenden LLM-Anfragen. Konfigurieren Sie X Hänger in Y Sekunden, um einen Alarm auszulösen.

Hier starten

Prometheus Verbesserungen

Unterstützung für die Verfolgung von Latenz/Ausgaben/Tokens basierend auf benutzerdefinierten Metriken hinzugefügt. Hier starten

NEUE Hashicorp Secret Manager Unterstützung

Unterstützung für das Lesen von Anmeldeinformationen + Schreiben von LLM-API-Schlüsseln. Hier starten

Management-Endpunkte / UI-Verbesserungen

Organisationen erstellen und anzeigen + Organisationsadministratoren in der Proxy-UI zuweisen
Unterstützt das Löschen von Schlüsseln nach key_alias
Teams der Organisation in der UI zuweisen
Verhindert die Verwendung des UI-Sitzungs-Tokens für den "Testschlüssel"-Bereich
Anzeige des verwendeten Modells im "Testschlüssel"-Bereich
Unterstützt Markdown-Ausgabe im "Testschlüssel"-Bereich

Helm-Verbesserungen

Verhindert Istio-Injection für den DB-Migrations-Cronjob
migrationJob.enabled-Variable innerhalb des Jobs verwenden

Logging-Verbesserungen

braintrust logging: project_id berücksichtigen, mehr Metriken hinzufügen - https://github.com/BerriAI/litellm/pull/7613
Athina - Basis-URL unterstützen - ATHINA_BASE_URL
Lunary - Übergabe einer benutzerdefinierten übergeordneten Ausführungs-ID an LLM-Aufrufe zulassen

Git-Diff

Dies ist der Diff zwischen v1.56.3-stable und v1.57.8-stable.

Verwenden Sie dies, um die Änderungen im Codebase zu sehen.

Git Diff

v1.57.7

10. Januar 2025

Krrish Dholakia

CEO, LiteLLM

Ishaan Jaffer

CTO, LiteLLM

langfuse, Management-Endpunkte, UI, prometheus, Geheimnisverwaltung

Langfuse Prompt Management

Langfuse Prompt Management wird als BETA gekennzeichnet. Dies ermöglicht uns, schnell auf Feedback zu reagieren, das wir erhalten, und den Status für Benutzer klarer zu gestalten. Wir erwarten, dass diese Funktion nächsten Monat (Februar 2025) stabil sein wird.

Änderungen

Die Client-Nachricht in der LLM API-Anfrage einschließen. (Zuvor wurde nur die Prompt-Vorlage gesendet, und die Client-Nachricht wurde ignoriert).
Protokollieren Sie die Prompt-Vorlage in der protokollierten Anfrage (z. B. nach S3/Langfuse).
Protokollieren Sie die 'prompt_id' und 'prompt_variables' in der protokollierten Anfrage (z. B. nach S3/Langfuse).

Hier starten

Team-/Organisationsverwaltung + UI-Verbesserungen

Die Verwaltung von Teams und Organisationen in der Benutzeroberfläche ist jetzt einfacher.

Änderungen

Unterstützung für die Bearbeitung von Benutzerrollen innerhalb eines Teams in der Benutzeroberfläche.
Unterstützung für die Aktualisierung der Rolle eines Teammitglieds auf Administrator über die API - /team/member_update
Team-Administratoren zeigen alle Schlüssel für ihr Team an.
Organisationen mit Budgets hinzufügen
Teams Organisationen auf der Benutzeroberfläche zuweisen
SSO-Benutzer automatisch Teams zuweisen

Hier starten

Hashicorp Vault Unterstützung

Wir unterstützen jetzt das Schreiben von LiteLLM Virtual API-Schlüsseln in Hashicorp Vault.

Hier starten

Benutzerdefinierte Prometheus-Metriken

Definieren Sie benutzerdefinierte Prometheus-Metriken und verfolgen Sie Nutzung/Latenz/Anzahl der Anfragen dagegen.

Dies ermöglicht eine feinere Verfolgung - z. B. basierend auf der im Metadaten der Anfrage übergebenen Prompt-Vorlage.

Hier starten

v1.55.8-stable

22. Dezember 2024

Krrish Dholakia

CEO, LiteLLM

Ishaan Jaffer

CTO, LiteLLM

Eine neue LiteLLM Stable-Version wurde gerade veröffentlicht. Hier sind 5 Updates seit v1.52.2-stable.

langfuse, Fallbacks, neue Modelle, azure_storage

Langfuse Prompt Management

Dies erleichtert das Ausführen von Experimenten oder das Ändern spezifischer Modelle wie gpt-4o zu gpt-4o-mini auf Langfuse, anstatt Änderungen in Ihren Anwendungen vorzunehmen. Start hier

Fallback-Prompts clientseitig steuern

Claude-Prompts unterscheiden sich von OpenAI-Prompts.

Übergabe von modellspezifischen Prompts bei der Verwendung von Fallbacks. Start hier

Neue Anbieter / Modelle

/infer-Endpunkt für NVIDIA Triton. Start hier
Rerank-Modelle von Infinity Start hier

✨ Unterstützung für Azure Data Lake Storage

Senden Sie LLM-Nutzungsdaten (Ausgaben, Token) an Azure Data Lake. Dies erleichtert die Nutzung von Nutzungsdaten auf anderen Diensten (z. B. Databricks) Start hier

Docker Run LiteLLM

docker run \
-e STORE_MODEL_IN_DB=True \
-p 4000:4000 \
ghcr.io/berriai/litellm:litellm_stable_release_branch-v1.55.8-stable

Tägliche Updates erhalten

LiteLLM veröffentlicht täglich neue Versionen. Folgen Sie uns auf LinkedIn, um tägliche Updates zu erhalten.

Neue / Aktualisierte Modelle​

Allgemeine Proxy-Verbesserungen​

LLM-Übersetzungsverbesserungen​

Prompt Management Verbesserungen​

Finetuning + Batch API Verbesserungen​

NEUE Alerting-Integration​

Prometheus Verbesserungen​

NEUE Hashicorp Secret Manager Unterstützung​

Management-Endpunkte / UI-Verbesserungen​

Helm-Verbesserungen​

Logging-Verbesserungen​

Git-Diff​

Langfuse Prompt Management​

Team-/Organisationsverwaltung + UI-Verbesserungen​

Hashicorp Vault Unterstützung​

Benutzerdefinierte Prometheus-Metriken​

Langfuse Prompt Management​

Fallback-Prompts clientseitig steuern​

Neue Anbieter / Modelle​

✨ Unterstützung für Azure Data Lake Storage​

Docker Run LiteLLM​

Tägliche Updates erhalten​

Neue / Aktualisierte Modelle

Allgemeine Proxy-Verbesserungen

LLM-Übersetzungsverbesserungen

Prompt Management Verbesserungen

Finetuning + Batch API Verbesserungen

NEUE Alerting-Integration

Prometheus Verbesserungen

NEUE Hashicorp Secret Manager Unterstützung

Management-Endpunkte / UI-Verbesserungen

Helm-Verbesserungen

Logging-Verbesserungen

Git-Diff

Langfuse Prompt Management

Team-/Organisationsverwaltung + UI-Verbesserungen

Hashicorp Vault Unterstützung

Benutzerdefinierte Prometheus-Metriken

Langfuse Prompt Management

Fallback-Prompts clientseitig steuern

Neue Anbieter / Modelle

✨ Unterstützung für Azure Data Lake Storage

Docker Run LiteLLM

Tägliche Updates erhalten