Rerank 接口 — Ling.AI

接口说明

Rerank 模型接收一个 query 和一组 documents，返回按相关性排序后的 results。Ling.AI 对外暴露 POST /v1/rerank，同时兼容 /v1/reranks，并纳入统一鉴权、限流、计费和 usage_logs 链路。

请求方式 POST

请求地址 /v1/rerank

认证方式 Authorization / x-api-key / x-goog-api-key

与 Embeddings 的区别

/v1/embeddings 返回向量；/v1/rerank 返回候选文档的 relevance_score。例如 qwen3-rerank 应配置为 rerank 类型，不应配置为 embedding 类型。

请求参数

参数名	类型	必填	说明
`model`	string	是	例如 `qwen3-rerank`
`query`	string	是	查询文本
`documents`	array<string>	是	待排序候选文本列表，不能为空
`top_n`	integer	否	返回前 N 条结果；不传时按上游默认返回
`instruct`	string	否	排序任务说明，适用于支持该字段的上游模型

请求示例

curl

curl https://api.lingyuncx.com/v1/rerank \
  -H "Authorization: Bearer sk-xxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-rerank",
    "query": "什么是 Ling.AI 模型目录",
    "documents": [
      "Ling.AI 模型目录展示可用模型、能力标签、协议和价格摘要。",
      "天气预报用于查看未来几天的气温和降雨概率。"
    ],
    "top_n": 1
  }'

响应格式

json

{
  "object": "list",
  "results": [
    {
      "index": 0,
      "relevance_score": 0.9334521178273196
    }
  ],
  "model": "qwen3-rerank",
  "id": "85ba5752-1900-47d2-8896-23f99b13f6e1",
  "usage": {
    "total_tokens": 79
  }
}

上游地址

百炼 qwen3-rerank 的真实上游地址是 https://dashscope.aliyuncs.com/compatible-api/v1/reranks。后台模型的 base_url 可以显式填该完整地址；如果留空或只填普通百炼默认地址，网关会按 rerank 类型选择内置上游地址。

Rerank API

接口说明

与 Embeddings 的区别

请求参数

请求示例

响应格式

上游地址