Amazon SageMaker

配置 Amazon SageMaker 与 Continue 集成,以使用部署的 LLM 端点进行聊天和嵌入模型调用,支持通过 AWS 凭证进行 LMI 和 HuggingFace TEI 部署

SageMaker 可同时用于聊天和嵌入模型。聊天模型支持使用 LMI 部署的端点,嵌入模型支持使用 HuggingFace TEI 部署的端点
以下是一个 SageMaker 配置设置示例
name: My Config
version: 0.0.1
schema: v1

models:
  - name: deepseek-6.7b-instruct
    provider: sagemaker
    model: lmi-model-deepseek-coder-xxxxxxx
    region: us-west-2
    roles:
      - chat
  - name: mxbai-embed
    provider: sagemaker
    model: mxbai-embed-large-v1-endpoint
    roles:
      - embed
model 中的值应为您所部署的 SageMaker 端点名称。
认证将通过 ~/.aws/credentials 中名为 "sagemaker" 的配置文件内的临时或长期凭证进行。
[sagemaker]
aws_access_key_id = abcdefg
aws_secret_access_key = hijklmno
aws_session_token = pqrstuvwxyz # Optional: means short term creds.