AWS Bedrock

ALLE Bedrock-Modelle (Anthropic, Meta, Deepseek, Mistral, Amazon, etc.) WERDEN UNTERSTÜTZT

Eigenschaft	Details
Beschreibung	Amazon Bedrock ist ein vollständig verwalteter Dienst, der eine Auswahl an leistungsstarken Basismodellen (FMs) bietet.
Provider-Routing in LiteLLM	`bedrock/`, `bedrock/converse/`, `bedrock/invoke/`, `bedrock/converse_like/`, `bedrock/llama/`, `bedrock/deepseek_r1/`
Provider-Dokumentation	Amazon Bedrock ↗
Unterstützte OpenAI-Endpunkte	`/chat/completions`, `/completions`, `/embeddings`, `/images/generations`
Rerank-Endpunkt	`/rerank`
Passthrough-Endpunkt	Unterstützt

LiteLLM erfordert, dass boto3 auf Ihrem System für Bedrock-Anfragen installiert ist

pip install boto3>=1.28.57

Info

Für Amazon Nova Modelle: Upgrade auf v1.53.5+

Info

LiteLLM verwendet boto3 zur Authentifizierung. Alle diese Optionen werden unterstützt - https://boto3.amazonaws.com/v1/documentation/api/latest/guide/credentials.html#credentials.

Verwendung

import os
from litellm import completion

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = completion(
  model="bedrock/anthropic.claude-3-sonnet-20240229-v1:0",
  messages=[{ "content": "Hello, how are you?","role": "user"}]
)

LiteLLM Proxy-Nutzung

So rufen Sie Bedrock mit dem LiteLLM Proxy Server auf

1. config.yaml einrichten

model_list:
  - model_name: bedrock-claude-3-5-sonnet
    litellm_params:
      model: bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0
      aws_access_key_id: os.environ/AWS_ACCESS_KEY_ID
      aws_secret_access_key: os.environ/AWS_SECRET_ACCESS_KEY
      aws_region_name: os.environ/AWS_REGION_NAME

Alle möglichen Authentifizierungsparameter

aws_access_key_id: Optional[str],
aws_secret_access_key: Optional[str],
aws_session_token: Optional[str],
aws_region_name: Optional[str],
aws_session_name: Optional[str],
aws_profile_name: Optional[str],
aws_role_name: Optional[str],
aws_web_identity_token: Optional[str],
aws_bedrock_runtime_endpoint: Optional[str],

2. Proxy starten

litellm --config /path/to/config.yaml

3. Testen

Curl-Anfrage
OpenAI v1.0.0+
Langchain

curl --location 'http://0.0.0.0:4000/chat/completions' \
--header 'Content-Type: application/json' \
--data ' {
      "model": "bedrock-claude-v1",
      "messages": [
        {
          "role": "user",
          "content": "what llm are you"
        }
      ]
    }
'

import openai
client = openai.OpenAI(
    api_key="anything",
    base_url="http://0.0.0.0:4000"
)

# request sent to model set on litellm proxy, `litellm --model`
response = client.chat.completions.create(model="bedrock-claude-v1", messages = [
    {
        "role": "user",
        "content": "this is a test request, write a short poem"
    }
])

print(response)

from langchain.chat_models import ChatOpenAI
from langchain.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
    SystemMessagePromptTemplate,
)
from langchain.schema import HumanMessage, SystemMessage

chat = ChatOpenAI(
    openai_api_base="http://0.0.0.0:4000", # set openai_api_base to the LiteLLM Proxy
    model = "bedrock-claude-v1",
    temperature=0.1
)

messages = [
    SystemMessage(
        content="You are a helpful assistant that im using to make a test request to."
    ),
    HumanMessage(
        content="test from litellm. tell me why it's amazing in 1 sentence"
    ),
]
response = chat(messages)

print(response)

Temperatur, Top-p usw. einstellen

SDK
PROXY

import os
from litellm import completion

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = completion(
  model="bedrock/anthropic.claude-3-sonnet-20240229-v1:0",
  messages=[{ "content": "Hello, how are you?","role": "user"}],
  temperature=0.7,
  top_p=1
)

Auf yaml einstellen

model_list:
  - model_name: bedrock-claude-v1
    litellm_params:
      model: bedrock/anthropic.claude-instant-v1
      temperature: <your-temp>
      top_p: <your-top-p>

Bei der Anfrage einstellen

import openai
client = openai.OpenAI(
    api_key="anything",
    base_url="http://0.0.0.0:4000"
)

# request sent to model set on litellm proxy, `litellm --model`
response = client.chat.completions.create(model="bedrock-claude-v1", messages = [
    {
        "role": "user",
        "content": "this is a test request, write a short poem"
    }
],
temperature=0.7,
top_p=1
)

print(response)

Provider-spezifische Parameter übergeben

Wenn Sie einen Nicht-OpenAI-Parameter an litellm übergeben, gehen wir davon aus, dass es sich um einen provider-spezifischen Parameter handelt und senden ihn als Kwarg im Anforderungsbody. Mehr erfahren

SDK
PROXY

import os
from litellm import completion

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = completion(
  model="bedrock/anthropic.claude-3-sonnet-20240229-v1:0",
  messages=[{ "content": "Hello, how are you?","role": "user"}],
  top_k=1 # 👈 PROVIDER-SPECIFIC PARAM
)

Auf yaml einstellen

model_list:
  - model_name: bedrock-claude-v1
    litellm_params:
      model: bedrock/anthropic.claude-instant-v1
      top_k: 1 # 👈 PROVIDER-SPECIFIC PARAM

Bei der Anfrage einstellen

import openai
client = openai.OpenAI(
    api_key="anything",
    base_url="http://0.0.0.0:4000"
)

# request sent to model set on litellm proxy, `litellm --model`
response = client.chat.completions.create(model="bedrock-claude-v1", messages = [
    {
        "role": "user",
        "content": "this is a test request, write a short poem"
    }
],
temperature=0.7,
extra_body={
    top_k=1 # 👈 PROVIDER-SPECIFIC PARAM
}
)

print(response)

Verwendung - Funktionsaufrufe / Tool-Aufrufe

LiteLLM unterstützt Tool-Aufrufe über die Converse- und Invoke-APIs von Bedrock.

SDK
PROXY

from litellm import completion

# set env
os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

tools = [
    {
        "type": "function",
        "function": {
            "name": "get_current_weather",
            "description": "Get the current weather in a given location",
            "parameters": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    },
                    "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
                },
                "required": ["location"],
            },
        },
    }
]
messages = [{"role": "user", "content": "What's the weather like in Boston today?"}]

response = completion(
    model="bedrock/anthropic.claude-3-sonnet-20240229-v1:0",
    messages=messages,
    tools=tools,
    tool_choice="auto",
)
# Add any assertions, here to check response args
print(response)
assert isinstance(response.choices[0].message.tool_calls[0].function.name, str)
assert isinstance(
    response.choices[0].message.tool_calls[0].function.arguments, str
)

Konfigurieren Sie config.yaml

model_list:
  - model_name: bedrock-claude-3-7
    litellm_params:
      model: bedrock/us.anthropic.claude-3-7-sonnet-20250219-v1:0 # for bedrock invoke, specify `bedrock/invoke/<model>`

Proxy starten

litellm --config /path/to/config.yaml

Testen Sie es!

curl http://0.0.0.0:4000/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $LITELLM_API_KEY" \
-d '{
  "model": "bedrock-claude-3-7",
  "messages": [
    {
      "role": "user",
      "content": "What'\''s the weather like in Boston today?"
    }
  ],
  "tools": [
    {
      "type": "function",
      "function": {
        "name": "get_current_weather",
        "description": "Get the current weather in a given location",
        "parameters": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            },
            "unit": {
              "type": "string",
              "enum": ["celsius", "fahrenheit"]
            }
          },
          "required": ["location"]
        }
      }
    }
  ],
  "tool_choice": "auto"
}'

Verwendung - Vision

from litellm import completion

# set env
os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""


def encode_image(image_path):
    import base64

    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode("utf-8")


image_path = "../proxy/cached_logo.jpg"
# Getting the base64 string
base64_image = encode_image(image_path)
resp = litellm.completion(
    model="bedrock/anthropic.claude-3-sonnet-20240229-v1:0",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Whats in this image?"},
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "data:image/jpeg;base64," + base64_image
                    },
                },
            ],
        }
    ],
)
print(f"\nResponse: {resp}")

Verwendung - 'Denk'- / 'Reasoning-Inhalt'

Dies wird derzeit nur für Anthropic's Claude 3.7 Sonnet + Deepseek R1 unterstützt.

Funktioniert ab v1.61.20+.

Gibt 2 neue Felder im message- und delta-Objekt zurück

reasoning_content - string - Der Reasoning-Inhalt der Antwort
thinking_blocks - Liste von Objekten (nur Anthropic) - Die Denkblöcke der Antwort

Jedes Objekt hat die folgenden Felder

type - Literal["thinking"]- Der Typ des Denkblocks
thinking - string - Das Denken der Antwort. Wird auch in reasoning_content zurückgegeben
signature - string - Eine Base64-kodierte Zeichenkette, die von Anthropic zurückgegeben wird.

Die signature ist bei nachfolgenden Aufrufen von Anthropic erforderlich, wenn 'thinking'-Inhalt übergeben wird (nur erforderlich, um thinking mit Tool-Aufrufen zu verwenden). Mehr erfahren

SDK
PROXY

from litellm import completion

# set env
os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""


resp = completion(
    model="bedrock/us.anthropic.claude-3-7-sonnet-20250219-v1:0",
    messages=[{"role": "user", "content": "What is the capital of France?"}],
    reasoning_effort="low",
)

print(resp)

Konfigurieren Sie config.yaml

model_list:
  - model_name: bedrock-claude-3-7
    litellm_params:
      model: bedrock/us.anthropic.claude-3-7-sonnet-20250219-v1:0
      reasoning_effort: "low" # 👈 EITHER HERE OR ON REQUEST

Proxy starten

litellm --config /path/to/config.yaml

Testen Sie es!

curl http://0.0.0.0:4000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <YOUR-LITELLM-KEY>" \
  -d '{
    "model": "bedrock-claude-3-7",
    "messages": [{"role": "user", "content": "What is the capital of France?"}],
    "reasoning_effort": "low" # 👈 EITHER HERE OR ON CONFIG.YAML
  }'

Erwartete Antwort

Identisch mit Anthropic API-Antwort.

{
    "id": "chatcmpl-c661dfd7-7530-49c9-b0cc-d5018ba4727d",
    "created": 1740640366,
    "model": "us.anthropic.claude-3-7-sonnet-20250219-v1:0",
    "object": "chat.completion",
    "system_fingerprint": null,
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "The capital of France is Paris. It's not only the capital city but also the largest city in France, serving as the country's major cultural, economic, and political center.",
                "role": "assistant",
                "tool_calls": null,
                "function_call": null,
                "reasoning_content": "The capital of France is Paris. This is a straightforward factual question.",
                "thinking_blocks": [
                    {
                        "type": "thinking",
                        "thinking": "The capital of France is Paris. This is a straightforward factual question.",
                        "signature": "EqoBCkgIARABGAIiQL2UoU0b1OHYi+yCHpBY7U6FQW8/FcoLewocJQPa2HnmLM+NECy50y44F/kD4SULFXi57buI9fAvyBwtyjlOiO0SDE3+r3spdg6PLOo9PBoMma2ku5OTAoR46j9VIjDRlvNmBvff7YW4WI9oU8XagaOBSxLPxElrhyuxppEn7m6bfT40dqBSTDrfiw4FYB4qEPETTI6TA6wtjGAAqmFqKTo="
                    }
                ]
            }
        }
    ],
    "usage": {
        "completion_tokens": 64,
        "prompt_tokens": 42,
        "total_tokens": 106,
        "completion_tokens_details": null,
        "prompt_tokens_details": null
    }
}

Übergib `thinking` an Anthropic-Modelle

Identisch mit Anthropic API-Antwort.

Verwendung - Strukturierte Ausgabe / JSON-Modus

SDK
PROXY

from litellm import completion
import os 
from pydantic import BaseModel

# set env
os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

class CalendarEvent(BaseModel):
  name: str
  date: str
  participants: list[str]

class EventsList(BaseModel):
    events: list[CalendarEvent]

response = completion(
  model="bedrock/anthropic.claude-3-7-sonnet-20250219-v1:0", # specify invoke via `bedrock/invoke/anthropic.claude-3-7-sonnet-20250219-v1:0`
  response_format=EventsList,
  messages=[
    {"role": "system", "content": "You are a helpful assistant designed to output JSON."},
    {"role": "user", "content": "Who won the world series in 2020?"}
  ],
)
print(response.choices[0].message.content)

Konfigurieren Sie config.yaml

model_list:
  - model_name: bedrock-claude-3-7
    litellm_params:
      model: bedrock/us.anthropic.claude-3-7-sonnet-20250219-v1:0 # specify invoke via `bedrock/invoke/<model_name>` 
      aws_access_key_id: os.environ/CUSTOM_AWS_ACCESS_KEY_ID
      aws_secret_access_key: os.environ/CUSTOM_AWS_SECRET_ACCESS_KEY
      aws_region_name: os.environ/CUSTOM_AWS_REGION_NAME

Proxy starten

litellm --config /path/to/config.yaml

Testen Sie es!

curl http://0.0.0.0:4000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $LITELLM_KEY" \
  -d '{
    "model": "bedrock-claude-3-7",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant designed to output JSON."
      },
      {
        "role": "user",
        "content": "Who won the worlde series in 2020?"
      }
    ],
    "response_format": {
      "type": "json_schema",
      "json_schema": {
        "name": "math_reasoning",
        "description": "reason about maths",
        "schema": {
          "type": "object",
          "properties": {
            "steps": {
              "type": "array",
              "items": {
                "type": "object",
                "properties": {
                  "explanation": { "type": "string" },
                  "output": { "type": "string" }
                },
                "required": ["explanation", "output"],
                "additionalProperties": false
              }
            },
            "final_answer": { "type": "string" }
          },
          "required": ["steps", "final_answer"],
          "additionalProperties": false
        },
        "strict": true
      }
    }
  }'

Verwendung - Latenzoptimierte Inferenz

Gültig ab v1.65.1+

SDK
PROXY

from litellm import completion

response = completion(
    model="bedrock/anthropic.claude-3-7-sonnet-20250219-v1:0",
    messages=[{"role": "user", "content": "What is the capital of France?"}],
    performanceConfig={"latency": "optimized"},
)

Konfigurieren Sie config.yaml

model_list:
  - model_name: bedrock-claude-3-7
    litellm_params:
      model: bedrock/us.anthropic.claude-3-7-sonnet-20250219-v1:0
      performanceConfig: {"latency": "optimized"} # 👈 EITHER HERE OR ON REQUEST

Proxy starten

litellm --config /path/to/config.yaml

Testen Sie es!

curl http://0.0.0.0:4000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $LITELLM_KEY" \
  -d '{
    "model": "bedrock-claude-3-7",
    "messages": [{"role": "user", "content": "What is the capital of France?"}],
    "performanceConfig": {"latency": "optimized"} # 👈 EITHER HERE OR ON CONFIG.YAML
  }'

Verwendung - Bedrock Guardrails

Beispiel für die Verwendung von Bedrock Guardrails mit LiteLLM

LiteLLM SDK
Proxy bei der Anfrage
Proxy in config.yaml

from litellm import completion

# set env
os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = completion(
    model="anthropic.claude-v2",
    messages=[
        {
            "content": "where do i buy coffee from? ",
            "role": "user",
        }
    ],
    max_tokens=10,
    guardrailConfig={
        "guardrailIdentifier": "ff6ujrregl1q", # The identifier (ID) for the guardrail.
        "guardrailVersion": "DRAFT",           # The version of the guardrail.
        "trace": "disabled",                   # The trace behavior for the guardrail. Can either be "disabled" or "enabled"
    },
)

import openai
client = openai.OpenAI(
    api_key="anything",
    base_url="http://0.0.0.0:4000"
)

# request sent to model set on litellm proxy, `litellm --model`
response = client.chat.completions.create(model="anthropic.claude-v2", messages = [
    {
        "role": "user",
        "content": "this is a test request, write a short poem"
    }
],
temperature=0.7,
extra_body={
    "guardrailConfig": {
        "guardrailIdentifier": "ff6ujrregl1q", # The identifier (ID) for the guardrail.
        "guardrailVersion": "DRAFT",           # The version of the guardrail.
        "trace": "disabled",                   # The trace behavior for the guardrail. Can either be "disabled" or "enabled"
    },
}
)

print(response)

Aktualisiere config.yaml

model_list:
  - model_name: bedrock-claude-v1
    litellm_params:
      model: bedrock/anthropic.claude-instant-v1
      aws_access_key_id: os.environ/CUSTOM_AWS_ACCESS_KEY_ID
      aws_secret_access_key: os.environ/CUSTOM_AWS_SECRET_ACCESS_KEY
      aws_region_name: os.environ/CUSTOM_AWS_REGION_NAME
      guardrailConfig: {
        "guardrailIdentifier": "ff6ujrregl1q", # The identifier (ID) for the guardrail.
        "guardrailVersion": "DRAFT",           # The version of the guardrail.
        "trace": "disabled",                   # The trace behavior for the guardrail. Can either be "disabled" or "enabled"
    }

Proxy starten

litellm --config /path/to/config.yaml

Testen Sie es!

import openai
client = openai.OpenAI(
    api_key="anything",
    base_url="http://0.0.0.0:4000"
)

# request sent to model set on litellm proxy, `litellm --model`
response = client.chat.completions.create(model="bedrock-claude-v1", messages = [
    {
        "role": "user",
        "content": "this is a test request, write a short poem"
    }
],
temperature=0.7
)

print(response)

Verwendung - "Assistant Pre-fill"

Wenn Sie Anthropic's Claude mit Bedrock verwenden, können Sie "Worte in Claudes Mund legen", indem Sie eine Nachricht mit der Rolle assistant als letztes Element im messages-Array einfügen.

[!WICHTIG]Die zurückgegebene Vervollständigung wird Ihren "Pre-fill"-Text *nicht* enthalten, da er Teil des Prompts selbst ist. Stellen Sie sicher, dass Sie Claudes Vervollständigung mit Ihrem Pre-fill voranstellen.

import os
from litellm import completion

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

messages = [
    {"role": "user", "content": "How do you say 'Hello' in German? Return your answer as a JSON object, like this:\n\n{ \"Hello\": \"Hallo\" }"},
    {"role": "assistant", "content": "{"},
]
response = completion(model="bedrock/anthropic.claude-v2", messages=messages)

Beispiel-Prompt an Claude gesendet

Human: How do you say 'Hello' in German? Return your answer as a JSON object, like this:

{ "Hello": "Hallo" }

Assistant: {

Verwendung - "System"-Nachrichten

Wenn Sie Anthropic's Claude 2.1 mit Bedrock verwenden, werden system-Rollen-Nachrichten korrekt für Sie formatiert.

import os
from litellm import completion

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

messages = [
    {"role": "system", "content": "You are a snarky assistant."},
    {"role": "user", "content": "How do I boil water?"},
]
response = completion(model="bedrock/anthropic.claude-v2:1", messages=messages)

Beispiel-Prompt an Claude gesendet

You are a snarky assistant.

Human: How do I boil water?

Assistant:

Verwendung - Streaming

import os
from litellm import completion

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = completion(
  model="bedrock/anthropic.claude-instant-v1",
  messages=[{ "content": "Hello, how are you?","role": "user"}],
  stream=True
)
for chunk in response:
  print(chunk)

Beispiel-Streaming-Ausgabe-Chunk

{
  "choices": [
    {
      "finish_reason": null,
      "index": 0,
      "delta": {
        "content": "ase can appeal the case to a higher federal court. If a higher federal court rules in a way that conflicts with a ruling from a lower federal court or conflicts with a ruling from a higher state court, the parties involved in the case can appeal the case to the Supreme Court. In order to appeal a case to the Sup"
      }
    }
  ],
  "created": null,
  "model": "anthropic.claude-instant-v1",
  "usage": {
    "prompt_tokens": null,
    "completion_tokens": null,
    "total_tokens": null
  }
}

Cross-Region-Inferenz

LiteLLM unterstützt Cross-Region-Inferenz von Bedrock für alle unterstützten Bedrock-Modelle.

SDK
PROXY

from litellm import completion 
import os 


os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""


litellm.set_verbose = True #  👈 SEE RAW REQUEST 

response = completion(
    model="bedrock/us.anthropic.claude-3-haiku-20240307-v1:0",
    messages=messages,
    max_tokens=10,
    temperature=0.1,
)

print("Final Response: {}".format(response))

1. config.yaml einrichten

model_list:
  - model_name: bedrock-claude-haiku
    litellm_params:
      model: bedrock/us.anthropic.claude-3-haiku-20240307-v1:0
      aws_access_key_id: os.environ/AWS_ACCESS_KEY_ID
      aws_secret_access_key: os.environ/AWS_SECRET_ACCESS_KEY
      aws_region_name: os.environ/AWS_REGION_NAME

2. Proxy starten

litellm --config /path/to/config.yaml

3. Testen

Curl-Anfrage
OpenAI v1.0.0+
Langchain

curl --location 'http://0.0.0.0:4000/chat/completions' \
--header 'Content-Type: application/json' \
--data ' {
      "model": "bedrock-claude-haiku",
      "messages": [
        {
          "role": "user",
          "content": "what llm are you"
        }
      ]
    }
'

import openai
client = openai.OpenAI(
    api_key="anything",
    base_url="http://0.0.0.0:4000"
)

# request sent to model set on litellm proxy, `litellm --model`
response = client.chat.completions.create(model="bedrock-claude-haiku", messages = [
    {
        "role": "user",
        "content": "this is a test request, write a short poem"
    }
])

print(response)

from langchain.chat_models import ChatOpenAI
from langchain.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
    SystemMessagePromptTemplate,
)
from langchain.schema import HumanMessage, SystemMessage

chat = ChatOpenAI(
    openai_api_base="http://0.0.0.0:4000", # set openai_api_base to the LiteLLM Proxy
    model = "bedrock-claude-haiku",
    temperature=0.1
)

messages = [
    SystemMessage(
        content="You are a helpful assistant that im using to make a test request to."
    ),
    HumanMessage(
        content="test from litellm. tell me why it's amazing in 1 sentence"
    ),
]
response = chat(messages)

print(response)

Route 'converse' / 'invoke' festlegen

Info

Unterstützt ab LiteLLM Version v1.53.5

LiteLLM verwendet standardmäßig die invoke-Route. LiteLLM verwendet die converse-Route für Bedrock-Modelle, die dies unterstützen.

Um die Route explizit festzulegen, verwenden Sie bedrock/converse/<model> oder bedrock/invoke/<model>.

Z.B.

SDK
PROXY

from litellm import completion

completion(model="bedrock/converse/us.amazon.nova-pro-v1:0")

model_list:
  - model_name: bedrock-model
    litellm_params:
      model: bedrock/converse/us.amazon.nova-pro-v1:0

Abwechselnde Benutzer-/Assistentennachrichten

Verwenden Sie user_continue_message, um eine Standard-Benutzernachricht hinzuzufügen, für Fälle (z. B. Autogen), in denen der Client möglicherweise keinen abwechselnden Benutzer-/Assistentennachrichten folgt, die mit einer Benutzernachricht beginnen und enden.

model_list:
  - model_name: "bedrock-claude"
    litellm_params:
      model: "bedrock/anthropic.claude-instant-v1"
      user_continue_message: {"role": "user", "content": "Please continue"}

ODER

Stellen Sie einfach litellm.modify_params=True ein und LiteLLM wird dies automatisch mit einer Standard-user_continue_message behandeln.

model_list:
  - model_name: "bedrock-claude"
    litellm_params:
      model: "bedrock/anthropic.claude-instant-v1"

litellm_settings:
   modify_params: true

Testen Sie es!

curl -X POST 'http://0.0.0.0:4000/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-1234' \
-d '{
    "model": "bedrock-claude",
    "messages": [{"role": "assistant", "content": "Hey, how's it going?"}]
}'

Verwendung - PDF / Dokumentenverständnis

LiteLLM unterstützt Dokumentenverständnis für Bedrock-Modelle - AWS Bedrock Docs.

Info

LiteLLM unterstützt ALLE Bedrock-Dokumenttypen -

Z.B.: "pdf", "csv", "doc", "docx", "xls", "xlsx", "html", "txt", "md"

Sie können diese auch entweder als image_url oder als base64 übergeben

URL

SDK
PROXY

from litellm.utils import supports_pdf_input, completion

# set aws credentials
os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""


# pdf url
image_url = "https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf"

# Download the file
response = requests.get(url)
file_data = response.content

encoded_file = base64.b64encode(file_data).decode("utf-8")

# model
model = "bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0"

image_content = [
    {"type": "text", "text": "What's this file about?"},
    {
        "type": "file",
        "file": {
            "file_data": f"data:application/pdf;base64,{encoded_file}", # 👈 PDF
        }
    },
]


if not supports_pdf_input(model, None):
    print("Model does not support image input")

response = completion(
    model=model,
    messages=[{"role": "user", "content": image_content}],
)
assert response is not None

Konfigurieren Sie config.yaml

model_list:
  - model_name: bedrock-model
    litellm_params:
      model: bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0
      aws_access_key_id: os.environ/AWS_ACCESS_KEY_ID
      aws_secret_access_key: os.environ/AWS_SECRET_ACCESS_KEY
      aws_region_name: os.environ/AWS_REGION_NAME

Starten Sie den Proxy

litellm --config /path/to/config.yaml

Testen Sie es!

curl -X POST 'http://0.0.0.0:4000/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-1234' \
-d '{
    "model": "bedrock-model",
    "messages": [
        {"role": "user", "content": {"type": "text", "text": "What's this file about?"}},
        {
            "type": "file",
            "file": {
                "file_data": f"data:application/pdf;base64,{encoded_file}", # 👈 PDF
            }
        }
    ]
}'

base64

SDK
PROXY

from litellm.utils import supports_pdf_input, completion

# set aws credentials
os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""


# pdf url
image_url = "https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf"
response = requests.get(url)
file_data = response.content

encoded_file = base64.b64encode(file_data).decode("utf-8")
base64_url = f"data:application/pdf;base64,{encoded_file}"

# model
model = "bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0"

image_content = [
    {"type": "text", "text": "What's this file about?"},
    {
        "type": "image_url",
        "image_url": base64_url, # OR {"url": base64_url}
    },
]


if not supports_pdf_input(model, None):
    print("Model does not support image input")

response = completion(
    model=model,
    messages=[{"role": "user", "content": image_content}],
)
assert response is not None

Konfigurieren Sie config.yaml

model_list:
  - model_name: bedrock-model
    litellm_params:
      model: bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0
      aws_access_key_id: os.environ/AWS_ACCESS_KEY_ID
      aws_secret_access_key: os.environ/AWS_SECRET_ACCESS_KEY
      aws_region_name: os.environ/AWS_REGION_NAME

Starten Sie den Proxy

litellm --config /path/to/config.yaml

Testen Sie es!

curl -X POST 'http://0.0.0.0:4000/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-1234' \
-d '{
    "model": "bedrock-model",
    "messages": [
        {"role": "user", "content": {"type": "text", "text": "What's this file about?"}},
        {
            "type": "image_url",
            "image_url": "data:application/pdf;base64,{b64_encoded_file}",
        }
    ]
}'

Bedrock Importierte Modelle (Deepseek, Deepseek R1)

Deepseek R1

Dies ist eine separate Route, da das Chat-Template anders ist.

Eigenschaft	Details
Provider-Route	`bedrock/deepseek_r1/{model_arn}`
Provider-Dokumentation	Bedrock Importierte Modelle, Deepseek Bedrock Importiertes Modell

SDK
Proxy

from litellm import completion
import os

response = completion(
    model="bedrock/deepseek_r1/arn:aws:bedrock:us-east-1:086734376398:imported-model/r4c4kewx2s0n",  # bedrock/deepseek_r1/{your-model-arn}
    messages=[{"role": "user", "content": "Tell me a joke"}],
)

1. Zur Konfiguration hinzufügen

model_list:
    - model_name: DeepSeek-R1-Distill-Llama-70B
      litellm_params:
        model: bedrock/deepseek_r1/arn:aws:bedrock:us-east-1:086734376398:imported-model/r4c4kewx2s0n

2. Proxy starten

litellm --config /path/to/config.yaml

# RUNNING at http://0.0.0.0:4000

3. Testen!

curl --location 'http://0.0.0.0:4000/chat/completions' \
      --header 'Authorization: Bearer sk-1234' \
      --header 'Content-Type: application/json' \
      --data '{
            "model": "DeepSeek-R1-Distill-Llama-70B", # 👈 the 'model_name' in config
            "messages": [
                {
                "role": "user",
                "content": "what llm are you"
                }
            ],
        }'

Deepseek (nicht R1)

Eigenschaft	Details
Provider-Route	`bedrock/llama/{model_arn}`
Provider-Dokumentation	Bedrock Importierte Modelle, Deepseek Bedrock Importiertes Modell

Verwenden Sie diese Route, um Bedrock-Importierte Modelle aufzurufen, die dem llama Invoke Request / Response-Format folgen

SDK
Proxy

from litellm import completion
import os

response = completion(
    model="bedrock/llama/arn:aws:bedrock:us-east-1:086734376398:imported-model/r4c4kewx2s0n",  # bedrock/llama/{your-model-arn}
    messages=[{"role": "user", "content": "Tell me a joke"}],
)

1. Zur Konfiguration hinzufügen

model_list:
    - model_name: DeepSeek-R1-Distill-Llama-70B
      litellm_params:
        model: bedrock/llama/arn:aws:bedrock:us-east-1:086734376398:imported-model/r4c4kewx2s0n

2. Proxy starten

litellm --config /path/to/config.yaml

# RUNNING at http://0.0.0.0:4000

3. Testen!

curl --location 'http://0.0.0.0:4000/chat/completions' \
      --header 'Authorization: Bearer sk-1234' \
      --header 'Content-Type: application/json' \
      --data '{
            "model": "DeepSeek-R1-Distill-Llama-70B", # 👈 the 'model_name' in config
            "messages": [
                {
                "role": "user",
                "content": "what llm are you"
                }
            ],
        }'

Provisioned Throughput Modelle

Um Provisioned Throughput Bedrock-Modelle zu verwenden, übergeben Sie

model=bedrock/<basis-modell>, z.B. model=bedrock/anthropic.claude-v2. Legen Sie model auf eines der unterstützten AWS-Modelle fest
model_id=provisioned-model-arn

Abschluss

import litellm
response = litellm.completion(
    model="bedrock/anthropic.claude-instant-v1",
    model_id="provisioned-model-arn",
    messages=[{"content": "Hello, how are you?", "role": "user"}]
)

Einbettung

import litellm
response = litellm.embedding(
    model="bedrock/amazon.titan-embed-text-v1",
    model_id="provisioned-model-arn",
    input=["hi"],
)

Unterstützte AWS Bedrock Modelle

LiteLLM unterstützt ALLE Bedrock-Modelle.

Hier ist ein Beispiel für die Verwendung eines Bedrock-Modells mit LiteLLM. Eine vollständige Liste finden Sie in der Modellkostenübersicht

Modellname	Befehl
Deepseek R1	`completion(model='bedrock/us.deepseek.r1-v1:0', messages=messages)`
Anthropic Claude-V3.5 Sonnet	`completion(model='bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0', messages=messages)`
Anthropic Claude-V3 Sonnet	`completion(model='bedrock/anthropic.claude-3-sonnet-20240229-v1:0', messages=messages)`
Anthropic Claude-V3 Haiku	`completion(model='bedrock/anthropic.claude-3-haiku-20240307-v1:0', messages=messages)`
Anthropic Claude-V3 Opus	`completion(model='bedrock/anthropic.claude-3-opus-20240229-v1:0', messages=messages)`
Anthropic Claude-V2.1	`completion(model='bedrock/anthropic.claude-v2:1', messages=messages)`
Anthropic Claude-V2	`completion(model='bedrock/anthropic.claude-v2', messages=messages)`
Anthropic Claude-Instant V1	`completion(model='bedrock/anthropic.claude-instant-v1', messages=messages)`
Meta llama3-1-405b	`completion(model='bedrock/meta.llama3-1-405b-instruct-v1:0', messages=messages)`
Meta llama3-1-70b	`completion(model='bedrock/meta.llama3-1-70b-instruct-v1:0', messages=messages)`
Meta llama3-1-8b	`completion(model='bedrock/meta.llama3-1-8b-instruct-v1:0', messages=messages)`
Meta llama3-70b	`completion(model='bedrock/meta.llama3-70b-instruct-v1:0', messages=messages)`
Meta llama3-8b	`completion(model='bedrock/meta.llama3-8b-instruct-v1:0', messages=messages)`
Amazon Titan Lite	`completion(model='bedrock/amazon.titan-text-lite-v1', messages=messages)`
Amazon Titan Express	`completion(model='bedrock/amazon.titan-text-express-v1', messages=messages)`
Cohere Command	`completion(model='bedrock/cohere.command-text-v14', messages=messages)`
AI21 J2-Mid	`completion(model='bedrock/ai21.j2-mid-v1', messages=messages)`
AI21 J2-Ultra	`completion(model='bedrock/ai21.j2-ultra-v1', messages=messages)`
AI21 Jamba-Instruct	`completion(model='bedrock/ai21.jamba-instruct-v1:0', messages=messages)`
Meta Llama 2 Chat 13b	`completion(model='bedrock/meta.llama2-13b-chat-v1', messages=messages)`
Meta Llama 2 Chat 70b	`completion(model='bedrock/meta.llama2-70b-chat-v1', messages=messages)`
Mistral 7B Instruct	`completion(model='bedrock/mistral.mistral-7b-instruct-v0:2', messages=messages)`
Mixtral 8x7B Instruct	`completion(model='bedrock/mistral.mixtral-8x7b-instruct-v0:1', messages=messages)`

Bedrock Embedding

API-Schlüssel

Dies kann als Umgebungsvariable festgelegt oder als Parameter für litellm.embedding() übergeben werden

import os
os.environ["AWS_ACCESS_KEY_ID"] = ""        # Access key
os.environ["AWS_SECRET_ACCESS_KEY"] = ""    # Secret access key
os.environ["AWS_REGION_NAME"] = ""           # us-east-1, us-east-2, us-west-1, us-west-2

Verwendung

from litellm import embedding
response = embedding(
    model="bedrock/amazon.titan-embed-text-v1",
    input=["good morning from litellm"],
)
print(response)

Unterstützte AWS Bedrock Embedding-Modelle

Modellname	Verwendung	Unterstützte zusätzliche OpenAI-Parameter
Titan Embeddings V2	`embedding(model="bedrock/amazon.titan-embed-text-v2:0", input=input)`	hier
Titan Embeddings - V1	`embedding(model="bedrock/amazon.titan-embed-text-v1", input=input)`	hier
Titan Multimodal Embeddings	`embedding(model="bedrock/amazon.titan-embed-image-v1", input=input)`	hier
Cohere Embeddings - Englisch	`embedding(model="bedrock/cohere.embed-english-v3", input=input)`	hier
Cohere Embeddings - Mehrsprachig	`embedding(model="bedrock/cohere.embed-multilingual-v3", input=input)`	hier

Erweitert - Nicht unterstützte Parameter löschen

Erweitert - Modell-/Provider-spezifische Parameter übergeben

Bilderzeugung

Verwenden Sie dies für Stable Diffusion und Amazon Nova Canvas auf Bedrock

Verwendung

SDK
PROXY

import os
from litellm import image_generation

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = image_generation(
            prompt="A cute baby sea otter",
            model="bedrock/stability.stable-diffusion-xl-v0",
        )
print(f"response: {response}")

Optionale Parameter festlegen

import os
from litellm import image_generation

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = image_generation(
            prompt="A cute baby sea otter",
            model="bedrock/stability.stable-diffusion-xl-v0",
            ### OPENAI-COMPATIBLE ###
            size="128x512", # width=128, height=512
            ### PROVIDER-SPECIFIC ### see `AmazonStabilityConfig` in bedrock.py for all params
            seed=30
        )
print(f"response: {response}")

Konfigurieren Sie config.yaml

model_list:
  - model_name: amazon.nova-canvas-v1:0
    litellm_params:
      model: bedrock/amazon.nova-canvas-v1:0
      aws_region_name: "us-east-1"
      aws_secret_access_key: my-key # OPTIONAL - all boto3 auth params supported
      aws_secret_access_id: my-id # OPTIONAL - all boto3 auth params supported

Proxy starten

litellm --config /path/to/config.yaml

Testen Sie es!

curl -L -X POST 'http://0.0.0.0:4000/v1/images/generations' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer $LITELLM_VIRTUAL_KEY' \
-d '{
    "model": "amazon.nova-canvas-v1:0",
    "prompt": "A cute baby sea otter"
}'

Unterstützte AWS Bedrock Bilderzeugungsmodelle

Modellname	Funktionsaufruf
Stable Diffusion 3 - v0	`embedding(model="bedrock/stability.stability.sd3-large-v1:0", prompt=prompt)`
Stable Diffusion - v0	`embedding(model="bedrock/stability.stable-diffusion-xl-v0", prompt=prompt)`
Stable Diffusion - v0	`embedding(model="bedrock/stability.stable-diffusion-xl-v1", prompt=prompt)`

Rerank API

Verwenden Sie die Rerank-API von Bedrock im Cohere /rerank-Format.

Unterstützte Cohere Rerank-Parameter

model - das Basismodell-ARN
query - die Abfrage, gegen die neu sortiert werden soll
documents - die Liste der zu neu sortierenden Dokumente
top_n - die Anzahl der zurückzugebenden Ergebnisse

SDK
PROXY

from litellm import rerank
import os 

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = rerank(
    model="bedrock/arn:aws:bedrock:us-west-2::foundation-model/amazon.rerank-v1:0", # provide the model ARN - get this here https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/bedrock/client/list_foundation_models.html
    query="hello",
    documents=["hello", "world"],
    top_n=2,
)

print(response)

Konfigurieren Sie config.yaml

model_list:
    - model_name: bedrock-rerank
      litellm_params:
        model: bedrock/arn:aws:bedrock:us-west-2::foundation-model/amazon.rerank-v1:0
        aws_access_key_id: os.environ/AWS_ACCESS_KEY_ID
        aws_secret_access_key: os.environ/AWS_SECRET_ACCESS_KEY
        aws_region_name: os.environ/AWS_REGION_NAME

Proxy-Server starten

litellm --config config.yaml

# RUNNING on http://0.0.0.0:4000

Testen Sie es!

curl http://0.0.0.0:4000/rerank \
  -H "Authorization: Bearer sk-1234" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "bedrock-rerank",
    "query": "What is the capital of the United States?",
    "documents": [
        "Carson City is the capital city of the American state of Nevada.",
        "The Commonwealth of the Northern Mariana Islands is a group of islands in the Pacific Ocean. Its capital is Saipan.",
        "Washington, D.C. is the capital of the United States.",
        "Capital punishment has existed in the United States since before it was a country."
    ],
    "top_n": 3


  }'

Bedrock Application Inference Profile

Verwenden Sie das Bedrock Application Inference Profile, um Kosten für Projekte auf AWS zu verfolgen.

Sie können es entweder im Modellnamen übergeben - model="bedrock/arn:... oder als separaten model_id="arn:.. Parameter.

Eingestellt über `model_id`

SDK
PROXY

from litellm import completion
import os 

os.environ["AWS_ACCESS_KEY_ID"] = ""
os.environ["AWS_SECRET_ACCESS_KEY"] = ""
os.environ["AWS_REGION_NAME"] = ""

response = completion(
    model="bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0",
    messages=[{"role": "user", "content": "Hello, how are you?"}],
    model_id="arn:aws:bedrock:eu-central-1:000000000000:application-inference-profile/a0a0a0a0a0a0",
)

print(response)

Konfigurieren Sie config.yaml

model_list:
  - model_name: anthropic-claude-3-5-sonnet
    litellm_params:
      model: bedrock/anthropic.claude-3-5-sonnet-20240620-v1:0
      # You have to set the ARN application inference profile in the model_id parameter
      model_id: arn:aws:bedrock:eu-central-1:000000000000:application-inference-profile/a0a0a0a0a0a0

Proxy starten

litellm --config /path/to/config.yaml

Testen Sie es!

curl -L -X POST 'http://0.0.0.0:4000/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer $LITELLM_API_KEY' \
-d '{
  "model": "anthropic-claude-3-5-sonnet",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "List 5 important events in the XIX century"
        }
      ]
    }
  ]
}'

Boto3 - Authentifizierung

Anmeldedaten als Parameter übergeben - Completion()

AWS-Anmeldedaten als Parameter an litellm.completion übergeben

import os
from litellm import completion

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=[{ "content": "Hello, how are you?","role": "user"}],
            aws_access_key_id="",
            aws_secret_access_key="",
            aws_region_name="",
)

Zusätzliche Header und benutzerdefinierte API-Endpunkte übergeben

Dies kann verwendet werden, um bestehende Header (z. B. Authorization) zu überschreiben, wenn benutzerdefinierte API-Endpunkte aufgerufen werden

SDK
PROXY

import os
import litellm
from litellm import completion

litellm.set_verbose = True # 👈 SEE RAW REQUEST

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=[{ "content": "Hello, how are you?","role": "user"}],
            aws_access_key_id="",
            aws_secret_access_key="",
            aws_region_name="",
            aws_bedrock_runtime_endpoint="https://my-fake-endpoint.com",
            extra_headers={"key": "value"}
)

Konfigurieren Sie config.yaml

model_list:
    - model_name: bedrock-model
      litellm_params:
        model: bedrock/anthropic.claude-instant-v1
        aws_access_key_id: "",
        aws_secret_access_key: "",
        aws_region_name: "",
        aws_bedrock_runtime_endpoint: "https://my-fake-endpoint.com",
        extra_headers: {"key": "value"}

Proxy starten

litellm --config /path/to/config.yaml --detailed_debug

Testen Sie es!

curl -X POST 'http://0.0.0.0:4000/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-1234' \
-d '{
    "model": "bedrock-model",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful math tutor. Guide the user through the solution step by step."
      },
      {
        "role": "user",
        "content": "how can I solve 8x + 7 = -23"
      }
    ]
}'

Umgebungsvariable AWS_PROFILE festlegen
Bedrock-Abschlussaufruf tätigen

import os
from litellm import completion

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=[{ "content": "Hello, how are you?","role": "user"}]
)

oder aws_profile_name übergeben

import os
from litellm import completion

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=[{ "content": "Hello, how are you?","role": "user"}],
            aws_profile_name="dev-profile",
)

STS (Rollenbasierte Authentifizierung)

aws_role_name und aws_session_name festlegen

LiteLLM-Parameter	Boto3-Parameter	Beschreibung	Boto3-Dokumentation
`aws_access_key_id`	`aws_access_key_id`	AWS-Zugriffsschlüssel, der einem IAM-Benutzer oder einer Rolle zugeordnet ist	Anmeldedaten
`aws_secret_access_key`	`aws_secret_access_key`	AWS-Geheimschlüssel, der dem Zugriffsschlüssel zugeordnet ist	Anmeldedaten
`aws_role_name`	`RoleArn`	Der Amazon Resource Name (ARN) der anzunehmenden Rolle	AssumeRole API
`aws_session_name`	`RoleSessionName`	Ein Bezeichner für die angenommene Rollensitzung	AssumeRole API

Den Bedrock-Abschlussaufruf tätigen

SDK
PROXY

from litellm import completion

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=messages,
            max_tokens=10,
            temperature=0.1,
            aws_role_name=aws_role_name,
            aws_session_name="my-test-session",
        )

Wenn Sie auch dynamisch den AWS-Benutzer festlegen müssen, der auf die Rolle zugreift, fügen Sie die zusätzlichen Argumente in der completion()/embedding()-Funktion hinzu

from litellm import completion

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=messages,
            max_tokens=10,
            temperature=0.1,
            aws_region_name=aws_region_name,
            aws_access_key_id=aws_access_key_id,
            aws_secret_access_key=aws_secret_access_key,
            aws_role_name=aws_role_name,
            aws_session_name="my-test-session",
        )

model_list:
  - model_name: bedrock/*
    litellm_params:
      model: bedrock/*
      aws_role_name: arn:aws:iam::888602223428:role/iam_local_role # AWS RoleArn
      aws_session_name: "bedrock-session" # AWS RoleSessionName
      aws_access_key_id: os.environ/AWS_ACCESS_KEY_ID # [OPTIONAL - not required if using role]
      aws_secret_access_key: os.environ/AWS_SECRET_ACCESS_KEY # [OPTIONAL - not required if using role]

Text zu Bild

curl -L -X POST 'http://0.0.0.0:4000/v1/images/generations' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer $LITELLM_VIRTUAL_KEY' \
-d '{
    "model": "amazon.nova-canvas-v1:0",
    "prompt": "A cute baby sea otter"
}'

Farbgesteuerte Generierung

curl -L -X POST 'http://0.0.0.0:4000/v1/images/generations' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer $LITELLM_VIRTUAL_KEY' \
-d '{
    "model": "amazon.nova-canvas-v1:0",
    "prompt": "A cute baby sea otter",
    "taskType": "COLOR_GUIDED_GENERATION",
    "colorGuidedGenerationParams":{"colors":["#FFFFFF"]}
}'

Modellname	Funktionsaufruf
Stable Diffusion 3 - v0	`image_generation(model="bedrock/stability.stability.sd3-large-v1:0", prompt=prompt)`
Stable Diffusion - v0	`image_generation(model="bedrock/stability.stable-diffusion-xl-v0", prompt=prompt)`
Stable Diffusion - v1	`image_generation(model="bedrock/stability.stable-diffusion-xl-v1", prompt=prompt)`
Amazon Nova Canvas - v0	`image_generation(model="bedrock/amazon.nova-canvas-v1:0", prompt=prompt)`

Übergabe eines externen BedrockRuntime.Client als Parameter - Completion()

Dies ist ein veralteter Workflow. Boto3 ist nicht asynchron. Und boto3.client lässt uns den HTTP-Aufruf nicht über httpx durchführen. Übergeben Sie Ihre AWS-Parameter über die obige Methode 👆. Authentifizierungscode anzeigen Neuen Authentifizierungsfluss hinzufügen

Danger

Experimentell - 23.06.2024: aws_access_key_id, aws_secret_access_key und aws_session_token werden aus boto3.client extrahiert und an den httpx client übergeben

Übergeben Sie ein externes BedrockRuntime.Client-Objekt als Parameter an litellm.completion. Nützlich bei der Verwendung eines AWS-Anmeldeinformationsprofils, einer SSO-Sitzung, einer angenommenen Rollensitzung oder wenn Umgebungsvariablen für die Authentifizierung nicht verfügbar sind.

Client aus Sitzungsanmeldeinformationen erstellen

import boto3
from litellm import completion

bedrock = boto3.client(
            service_name="bedrock-runtime",
            region_name="us-east-1",
            aws_access_key_id="",
            aws_secret_access_key="",
            aws_session_token="",
)

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=[{ "content": "Hello, how are you?","role": "user"}],
            aws_bedrock_client=bedrock,
)

Client aus AWS-Profil in ~/.aws/config erstellen

import boto3
from litellm import completion

dev_session = boto3.Session(profile_name="dev-profile")
bedrock = dev_session.client(
            service_name="bedrock-runtime",
            region_name="us-east-1",
)

response = completion(
            model="bedrock/anthropic.claude-instant-v1",
            messages=[{ "content": "Hello, how are you?","role": "user"}],
            aws_bedrock_client=bedrock,
)

Aufruf über internen Proxy (nicht Bedrock-URL-kompatibel)

Verwenden Sie den Endpunkt bedrock/converse_like/model, um ein Bedrock-Converse-Modell über Ihren internen Proxy aufzurufen.

SDK
LiteLLM Proxy

from litellm import completion

response = completion(
    model="bedrock/converse_like/some-model",
    messages=[{"role": "user", "content": "What's AWS?"}],
    api_key="sk-1234",
    api_base="https://some-api-url/models",
    extra_headers={"test": "hello world"},
)

Konfigurieren Sie config.yaml

model_list:
    - model_name: anthropic-claude
      litellm_params:
        model: bedrock/converse_like/some-model
        api_base: https://some-api-url/models

Proxy-Server starten

litellm --config config.yaml

# RUNNING on http://0.0.0.0:4000

Testen Sie es!

curl -X POST 'http://0.0.0.0:4000/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-1234' \
-d '{
    "model": "anthropic-claude",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful math tutor. Guide the user through the solution step by step."
      },
      { "content": "Hello, how are you?", "role": "user" }
    ]
}'

Erwartete Ausgabeb-URL

https://some-api-url/models

AWS Bedrock

Verwendung​

LiteLLM Proxy-Nutzung​

1. config.yaml einrichten​

2. Proxy starten​

3. Testen​

Temperatur, Top-p usw. einstellen​

Provider-spezifische Parameter übergeben​

Verwendung - Funktionsaufrufe / Tool-Aufrufe​

Verwendung - Vision​

Verwendung - 'Denk'- / 'Reasoning-Inhalt'​

Übergib thinking an Anthropic-Modelle​

Verwendung - Strukturierte Ausgabe / JSON-Modus​

Verwendung - Latenzoptimierte Inferenz​

Verwendung - Bedrock Guardrails​

Verwendung - "Assistant Pre-fill"​

Beispiel-Prompt an Claude gesendet​

Verwendung - "System"-Nachrichten​

Beispiel-Prompt an Claude gesendet​

Verwendung - Streaming​

Beispiel-Streaming-Ausgabe-Chunk​

Cross-Region-Inferenz​

1. config.yaml einrichten​

2. Proxy starten​

3. Testen​

Route 'converse' / 'invoke' festlegen​

Abwechselnde Benutzer-/Assistentennachrichten​

Verwendung - PDF / Dokumentenverständnis​

URL​

base64​

Bedrock Importierte Modelle (Deepseek, Deepseek R1)​

Deepseek R1​

Deepseek (nicht R1)​

Provisioned Throughput Modelle​

Unterstützte AWS Bedrock Modelle​

Bedrock Embedding​

API-Schlüssel​

Verwendung​

Unterstützte AWS Bedrock Embedding-Modelle​

Erweitert - Nicht unterstützte Parameter löschen​

Erweitert - Modell-/Provider-spezifische Parameter übergeben​

Bilderzeugung​

Verwendung​

Unterstützte AWS Bedrock Bilderzeugungsmodelle​

Rerank API​

Bedrock Application Inference Profile​

Eingestellt über model_id​

Boto3 - Authentifizierung​

Anmeldedaten als Parameter übergeben - Completion()​

Zusätzliche Header und benutzerdefinierte API-Endpunkte übergeben​

SSO-Login (AWS-Profil)​

STS (Rollenbasierte Authentifizierung)​

Übergabe eines externen BedrockRuntime.Client als Parameter - Completion()​

Aufruf über internen Proxy (nicht Bedrock-URL-kompatibel)​

Verwendung

LiteLLM Proxy-Nutzung

1. config.yaml einrichten

2. Proxy starten

3. Testen

Temperatur, Top-p usw. einstellen

Provider-spezifische Parameter übergeben

Verwendung - Funktionsaufrufe / Tool-Aufrufe

Verwendung - Vision

Verwendung - 'Denk'- / 'Reasoning-Inhalt'

Übergib `thinking` an Anthropic-Modelle

Verwendung - Strukturierte Ausgabe / JSON-Modus

Verwendung - Latenzoptimierte Inferenz

Verwendung - Bedrock Guardrails

Verwendung - "Assistant Pre-fill"

Beispiel-Prompt an Claude gesendet

Verwendung - "System"-Nachrichten

Beispiel-Prompt an Claude gesendet

Verwendung - Streaming

Beispiel-Streaming-Ausgabe-Chunk

Cross-Region-Inferenz

1. config.yaml einrichten

2. Proxy starten

3. Testen

Route 'converse' / 'invoke' festlegen

Abwechselnde Benutzer-/Assistentennachrichten

Verwendung - PDF / Dokumentenverständnis

URL

base64

Bedrock Importierte Modelle (Deepseek, Deepseek R1)

Deepseek R1

Deepseek (nicht R1)

Provisioned Throughput Modelle

Unterstützte AWS Bedrock Modelle

Bedrock Embedding

API-Schlüssel

Verwendung

Unterstützte AWS Bedrock Embedding-Modelle

Erweitert - Nicht unterstützte Parameter löschen

Erweitert - Modell-/Provider-spezifische Parameter übergeben

Bilderzeugung

Verwendung

Unterstützte AWS Bedrock Bilderzeugungsmodelle

Rerank API

Bedrock Application Inference Profile

Eingestellt über `model_id`

Boto3 - Authentifizierung

Anmeldedaten als Parameter übergeben - Completion()

Zusätzliche Header und benutzerdefinierte API-Endpunkte übergeben

SSO-Login (AWS-Profil)

STS (Rollenbasierte Authentifizierung)

Übergabe eines externen BedrockRuntime.Client als Parameter - Completion()

Aufruf über internen Proxy (nicht Bedrock-URL-kompatibel)