嵌入角色

嵌入模型角色

“嵌入模型”(Embeddings model)经过训练,可以将一段文本转换为向量,随后可以快速将其与其他向量进行比较,以确定文本片段之间的相似度。嵌入模型通常比大语言模型(LLM)小得多,并且相比之下速度极快且成本低廉。
在 Continue 中,嵌入是在索引过程中生成的,并由代码库感知功能使用,以便在你的代码库中执行相似性搜索。
你可以将 embed 添加到模型的 roles 中,以指定该模型可用于嵌入。
[内置模型(仅限 VS Code)] transformers.js 在 VS Code 中作为内置嵌入模型使用。在 JetBrains 中,目前没有内置的嵌入器。
查看我们的综合模型推荐,了解最佳嵌入模型对比。
如果你可以使用任何模型,我们推荐 voyage-code-3,它与下方的其他嵌入模型选项一起列出。
如果你想在本地生成嵌入,我们建议将 nomic-embed-textOllama 配合使用。

Voyage AI

此处获取 API 密钥后,你可以按如下方式进行配置

Ollama

请参阅此处了解如何使用 Ollama 进行嵌入的说明。

Transformers.js(目前仅限 VS Code)

Transformers.js 是流行的 Transformers 库的 JavaScript 移植版本。它允许完全在本地计算嵌入。所使用的模型是 all-MiniLM-L6-v2,它随 Continue 扩展一同发布。
name: My Config
version: 0.0.1
schema: v1

models:
  - name: default-transformers
    provider: transformers.js
    roles:
      - embed

Text Embeddings Inference

Hugging Face Text Embeddings Inference 使你能够托管自己的嵌入端点。你可以按如下方式配置嵌入以使用你的端点
name: My Config
version: 0.0.1
schema: v1

models:
  - name: Huggingface TEI Embedder
    provider: huggingface-tei
    apiBase: http://:8080
    apiKey: <YOUR_TEI_API_KEY>
    roles: [embed]

OpenAI

请参阅此处了解如何使用 OpenAI 进行嵌入的说明。

Cohere

请参阅此处了解如何使用 Cohere 进行嵌入的说明。

Gemini

请参阅此处了解如何使用 Gemini 进行嵌入的说明。

Vertex

请参阅此处了解如何使用 Vertex 进行嵌入的说明。

Mistral

请参阅此处了解如何使用 Mistral 进行嵌入的说明。

NVIDIA

请参阅此处了解如何使用 NVIDIA 进行嵌入的说明。

Bedrock

请参阅此处了解如何使用 Bedrock 进行嵌入的说明。

WatsonX

请参阅此处了解如何使用 WatsonX 进行嵌入的说明。

LMStudio

请参阅此处了解如何使用 LMStudio 进行嵌入的说明。