Rerank API

对召回候选文档按查询相关性重新排序;重排序模型使用独立入口,不走 Embeddings API。

接口说明

Rerank 模型接收一个 query 和一组 documents,返回按相关性排序后的 results。Ling.AI 对外暴露 POST /v1/rerank,同时兼容 /v1/reranks,并纳入统一鉴权、限流、计费和 usage_logs 链路。

请求方式 POST
请求地址 /v1/rerank
认证方式 Authorization / x-api-key / x-goog-api-key

与 Embeddings 的区别

/v1/embeddings 返回向量;/v1/rerank 返回候选文档的 relevance_score。例如 qwen3-rerank 应配置为 rerank 类型,不应配置为 embedding 类型。

请求参数

参数名 类型 必填 说明
model string 例如 qwen3-rerank
query string 查询文本
documents array<string> 待排序候选文本列表,不能为空
top_n integer 返回前 N 条结果;不传时按上游默认返回
instruct string 排序任务说明,适用于支持该字段的上游模型

请求示例

curl
curl https://api.lingyuncx.com/v1/rerank \
  -H "Authorization: Bearer sk-xxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-rerank",
    "query": "什么是 Ling.AI 模型目录",
    "documents": [
      "Ling.AI 模型目录展示可用模型、能力标签、协议和价格摘要。",
      "天气预报用于查看未来几天的气温和降雨概率。"
    ],
    "top_n": 1
  }'

响应格式

json
{
  "object": "list",
  "results": [
    {
      "index": 0,
      "relevance_score": 0.9334521178273196
    }
  ],
  "model": "qwen3-rerank",
  "id": "85ba5752-1900-47d2-8896-23f99b13f6e1",
  "usage": {
    "total_tokens": 79
  }
}

上游地址

百炼 qwen3-rerank 的真实上游地址是 https://dashscope.aliyuncs.com/compatible-api/v1/reranks。后台模型的 base_url 可以显式填该完整地址;如果留空或只填普通百炼默认地址,网关会按 rerank 类型选择内置上游地址。