嵌入角色
嵌入模型角色
“嵌入模型”(Embeddings model)经过训练,可以将一段文本转换为向量,随后可以快速将其与其他向量进行比较,以确定文本片段之间的相似度。嵌入模型通常比大语言模型(LLM)小得多,并且相比之下速度极快且成本低廉。
在 Continue 中,嵌入是在索引过程中生成的,并由代码库感知功能使用,以便在你的代码库中执行相似性搜索。
你可以将
embed 添加到模型的 roles 中,以指定该模型可用于嵌入。[内置模型(仅限 VS Code)]
transformers.js 在 VS Code 中作为内置嵌入模型使用。在 JetBrains 中,目前没有内置的嵌入器。推荐的嵌入模型
查看我们的综合模型推荐,了解最佳嵌入模型对比。
如果你可以使用任何模型,我们推荐
voyage-code-3,它与下方的其他嵌入模型选项一起列出。如果你想在本地生成嵌入,我们建议将
nomic-embed-text 与 Ollama 配合使用。Voyage AI
在此处获取 API 密钥后,你可以按如下方式进行配置
Ollama
请参阅此处了解如何使用 Ollama 进行嵌入的说明。
Transformers.js(目前仅限 VS Code)
Transformers.js 是流行的 Transformers 库的 JavaScript 移植版本。它允许完全在本地计算嵌入。所使用的模型是
all-MiniLM-L6-v2,它随 Continue 扩展一同发布。name: My Config
version: 0.0.1
schema: v1
models:
- name: default-transformers
provider: transformers.js
roles:
- embed
Text Embeddings Inference
Hugging Face Text Embeddings Inference 使你能够托管自己的嵌入端点。你可以按如下方式配置嵌入以使用你的端点
name: My Config
version: 0.0.1
schema: v1
models:
- name: Huggingface TEI Embedder
provider: huggingface-tei
apiBase: http://:8080
apiKey: <YOUR_TEI_API_KEY>
roles: [embed]
OpenAI
请参阅此处了解如何使用 OpenAI 进行嵌入的说明。
Cohere
请参阅此处了解如何使用 Cohere 进行嵌入的说明。
Gemini
请参阅此处了解如何使用 Gemini 进行嵌入的说明。
Vertex
请参阅此处了解如何使用 Vertex 进行嵌入的说明。
Mistral
请参阅此处了解如何使用 Mistral 进行嵌入的说明。
NVIDIA
请参阅此处了解如何使用 NVIDIA 进行嵌入的说明。
Bedrock
请参阅此处了解如何使用 Bedrock 进行嵌入的说明。
WatsonX
请参阅此处了解如何使用 WatsonX 进行嵌入的说明。
LMStudio
请参阅此处了解如何使用 LMStudio 进行嵌入的说明。