用量追踪

查看请求、Token、缓存与费用统计，并追踪每次调用明细

概述

用量追踪功能基于 UsageLog 与统计服务构建，用于查看请求总量、成功率、延迟、Token 使用、缓存命中、费用构成以及每次调用的详细资源消耗。

用量维度

1. 基础统计

统计页会聚合以下核心指标：

请求指标：总请求数、成功数、失败数、成功率、每小时/每天请求量
性能指标：平均延迟
Token 指标：总 Token、输入 Token、输出 Token、缓存 Token
缓存指标：缓存命中率（由缓存 Token 与输入 Token 计算）

2. 按模型与 API Key 统计

支持按模型和 API Key 聚合请求量与成本，适合多项目、多环境共用一个账户时做拆分核算。

3. 请求明细

明细页会展示每次调用的请求类型、状态、计费方式、请求时间，以及 token / 图像 / 视频 / 工具费用等资源字段。

筛选条件

时间范围：支持开始日期、结束日期与不同统计周期
模型：按 model_id 过滤
API Key：按 Key 过滤，便于项目拆分
状态：活动明细支持按成功/失败过滤

导出报表

当前支持导出 CSV 格式的请求明细报表，导出接口为 /user/analytics/activity/export，且单次导出日期范围不能超过 31 天。

明细字段

导出和明细列表重点关注以下字段：

请求基本信息：模型、请求类型、状态、计费方式、请求时间
Token 明细：输入/输出/缓存/总 Token
资源明细：图片数量、图片质量、视频时长、视频分辨率、是否带音频
费用明细：输入/输出/缓存写入/工具费用与最终费用
扣减明细：免费额度、赠送余额、奖励余额、充值余额的使用情况

💡 提示

如果您在统计页看到缓存命中率，请注意该值来自 prompt_cached_tokens / prompt_tokens 的聚合计算，而不是来自前台单独配置的缓存开关。