接口说明
Rerank 模型接收一个 query 和一组 documents,返回按相关性排序后的 results。Ling.AI 对外暴露 POST /v1/rerank,同时兼容 /v1/reranks,并纳入统一鉴权、限流、计费和 usage_logs 链路。
请求方式
POST
请求地址
/v1/rerank
认证方式
Authorization / x-api-key / x-goog-api-key
与 Embeddings 的区别
/v1/embeddings 返回向量;/v1/rerank 返回候选文档的 relevance_score。例如 qwen3-rerank 应配置为 rerank 类型,不应配置为 embedding 类型。
请求参数
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
model |
string | 是 | 例如 qwen3-rerank |
query |
string | 是 | 查询文本 |
documents |
array<string> | 是 | 待排序候选文本列表,不能为空 |
top_n |
integer | 否 | 返回前 N 条结果;不传时按上游默认返回 |
instruct |
string | 否 | 排序任务说明,适用于支持该字段的上游模型 |
请求示例
curl
curl https://api.lingyuncx.com/v1/rerank \
-H "Authorization: Bearer sk-xxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-rerank",
"query": "什么是 Ling.AI 模型目录",
"documents": [
"Ling.AI 模型目录展示可用模型、能力标签、协议和价格摘要。",
"天气预报用于查看未来几天的气温和降雨概率。"
],
"top_n": 1
}'
响应格式
json
{
"object": "list",
"results": [
{
"index": 0,
"relevance_score": 0.9334521178273196
}
],
"model": "qwen3-rerank",
"id": "85ba5752-1900-47d2-8896-23f99b13f6e1",
"usage": {
"total_tokens": 79
}
}
上游地址
百炼 qwen3-rerank 的真实上游地址是 https://dashscope.aliyuncs.com/compatible-api/v1/reranks。后台模型的 base_url 可以显式填该完整地址;如果留空或只填普通百炼默认地址,网关会按 rerank 类型选择内置上游地址。