嵌入角色
“嵌入模型”经过训练,可以将一段文本转换为向量,随后可以与其他向量进行快速比较,以确定文本段之间的相似性。嵌入模型通常比大型语言模型(LLM)小得多,相比之下速度极快且成本低廉。
在 Continue 中,嵌入在索引期间生成,然后由 @Codebase 用于对您的代码库执行相似性搜索。
您可以将 embed
添加到模型的 roles
中,以指定该模型可用于嵌入。
transformers.js
在 VS Code 中用作内置嵌入模型。在 JetBrains 中,目前没有内置的嵌入器。
推荐的嵌入模型
如果您可以使用任何模型,我们推荐 voyage-code-3
,该模型与其他嵌入模型选项一起列在下方。
如果您想在本地生成嵌入,我们建议使用 nomic-embed-text
和 Ollama。
Voyage AI
从此处获取 API 密钥后,您可以像这样配置
- 中心
- YAML
- JSON
models:
- name: Voyage Code 3
provider: voyage
model: voyage-code-3
apiKey: <YOUR_VOYAGE_API_KEY>
roles:
- embed
{
"embeddingsProvider": {
"provider": "voyage",
"model": "voyage-code-3",
"apiKey": "<YOUR_VOYAGE_API_KEY>"
}
}
Ollama
请参阅此处,了解如何使用 Ollama 进行嵌入的说明。
Transformers.js(目前仅限 VS Code)
Transformers.js 是流行的 Transformers 库的 JavaScript 移植版本。它允许在本地完全计算嵌入。使用的模型是 all-MiniLM-L6-v2
,该模型随 Continue 扩展一起发布。
- YAML
- JSON
models:
- name: default-transformers
provider: transformers.js
roles:
- embed
{
"embeddingsProvider": {
"provider": "transformers.js"
}
}
文本嵌入推理
Hugging Face 文本嵌入推理 使您能够托管自己的嵌入端点。您可以按如下方式配置嵌入以使用您的端点
- YAML
- JSON
models:
- name: Huggingface TEI Embedder
provider: huggingface-tei
apiBase: http://localhost:8080
apiKey: <YOUR_TEI_API_KEY>
roles: [embed]
{
"embeddingsProvider": {
"provider": "huggingface-tei",
"apiBase": "http://localhost:8080",
"apiKey": "<YOUR_TEI_API_KEY>"
}
}
OpenAI
请参阅此处,了解如何使用 OpenAI 进行嵌入的说明。
Cohere
请参阅此处,了解如何使用 Cohere 进行嵌入的说明。
Gemini
请参阅此处,了解如何使用 Gemini 进行嵌入的说明。
Vertex
请参阅此处,了解如何使用 Vertex 进行嵌入的说明。
Mistral
请参阅此处,了解如何使用 Mistral 进行嵌入的说明。
NVIDIA
请参阅此处,了解如何使用 NVIDIA 进行嵌入的说明。
Bedrock
请参阅此处,了解如何使用 Bedrock 进行嵌入的说明。
WatsonX
请参阅此处,了解如何使用 WatsonX 进行嵌入的说明。
LMStudio
请参阅此处,了解如何使用 LMStudio 进行嵌入的说明。