用量追踪

查看请求、Token、缓存与费用统计,并追踪每次调用明细

概述

用量追踪功能基于 UsageLog 与统计服务构建,用于查看请求总量、成功率、延迟、Token 使用、缓存命中、费用构成以及每次调用的详细资源消耗。

用量维度

1. 基础统计

统计页会聚合以下核心指标:

  • 请求指标:总请求数、成功数、失败数、成功率、每小时/每天请求量
  • 性能指标:平均延迟
  • Token 指标:总 Token、输入 Token、输出 Token、缓存 Token
  • 缓存指标:缓存命中率(由缓存 Token 与输入 Token 计算)

2. 按模型与 API Key 统计

支持按模型和 API Key 聚合请求量与成本,适合多项目、多环境共用一个账户时做拆分核算。

3. 请求明细

明细页会展示每次调用的请求类型、状态、计费方式、请求时间,以及 token / 图像 / 视频 / 工具费用等资源字段。

筛选条件

  • 时间范围:支持开始日期、结束日期与不同统计周期
  • 模型:按 model_id 过滤
  • API Key:按 Key 过滤,便于项目拆分
  • 状态:活动明细支持按成功/失败过滤

导出报表

当前支持导出 CSV 格式的请求明细报表,导出接口为 /user/analytics/activity/export,且单次导出日期范围不能超过 31 天。

明细字段

导出和明细列表重点关注以下字段:

  • 请求基本信息:模型、请求类型、状态、计费方式、请求时间
  • Token 明细:输入/输出/缓存/总 Token
  • 资源明细:图片数量、图片质量、视频时长、视频分辨率、是否带音频
  • 费用明细:输入/输出/缓存写入/工具费用与最终费用
  • 扣减明细:免费额度、赠送余额、奖励余额、充值余额的使用情况

💡 提示

如果您在统计页看到缓存命中率,请注意该值来自 prompt_cached_tokens / prompt_tokens 的聚合计算,而不是来自前台单独配置的缓存开关。