Routing, Loadbalancing & Fallbacks

📄️ Router - Lastenausgleich

LiteLLM verwaltet

Beta-Funktion. Nur zum Testen verwenden.

Mehrere Instanzen desselben Modells load-balancen

Wenn ein Aufruf nach num_retries fehlschlägt, auf eine andere Modellgruppe zurückgreifen.

Das im Router gesetzte Timeout gilt für die gesamte Dauer des Aufrufs und wird auch an die completion()-Aufrufebene weitergegeben.

Anfragen anhand von Tags routen.

LiteLLM unterstützt das Festlegen der folgenden Budgets

Alle Modelle eines Anbieters proxyen