Embeddings API

将文本转换为向量表示,支持语义搜索、文本聚类等应用

接口说明

Embeddings API 用于将文本转换为向量表示,可用于语义搜索、文本相似度计算、聚类等场景。

请求方式 POST
请求地址 /v1/embeddings
认证方式 Authorization: Bearer <API_KEY>

请求参数

参数名 类型 必填 说明
model string 模型名称,如 text-embedding-3-small
input string 要嵌入的文本内容
encoding_format string 编码格式:float / base64

请求示例

curl
curl https://api.lingyuncx.com/v1/embeddings \
  -H "Authorization: Bearer sk-xxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "今天天气真好,适合出去玩"
  }'
Python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.lingyuncx.com/v1",
    api_key="sk-xxxxxxxx"
)

response = client.embeddings.create(
    model="text-embedding-3-small",
    input="今天天气真好,适合出去玩"
)

print(response.data[0].embedding)

返回示例

JSON
{
  "object": "list",
  "data": [{
    "object": "embedding",
    "embedding": [0.0023, -0.0156, 0.0321, ...],
    "index": 0
  }],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 12,
    "total_tokens": 12
  }
}

应用场景

语义搜索

将文档和查询转换为向量,通过计算向量相似度实现语义搜索。

文本聚类

将大量文本向量化后进行聚类分析,发现文本间的潜在关联。

推荐系统

计算用户历史行为和候选内容的向量相似度,实现个性化推荐。

RAG 应用

构建向量知识库,为大模型提供外部知识,减少幻觉。

支持模型

模型 维度 最大输入 价格
text-embedding-3-small 1536 8191 tokens ¥0.02 / 1M tokens
text-embedding-3-large 3072 8191 tokens ¥0.13 / 1M tokens
bge-large-zh 1024 512 tokens ¥0.01 / 1M tokens

📚 相关阅读

API 认证指南 | 模型列表