计费方式说明
模型 API 提供 Token 套餐 与 按量调用 两种计费方式,在创建 API 密钥时选定。
::: info 首次使用建议先阅读 模型与 Token 入门,了解 Token、输入/输出、上下文等概念,再选择套餐或按量计费方式。 :::
方式对比
| 项目 | Token 套餐 | 按量调用 |
|---|---|---|
| 预付 | 购买套餐(人民币) | 账户充值(人民币) |
| 扣什么 | 套餐内 Token 数量 | 账户 余额(元) |
| 密钥要求 | 必须 绑定 一笔「套餐管理」中的可用套餐 | 无需绑定套餐 |
| 调用前 | 套餐未过期、有剩余 Token、模型在套餐适用范围内 | 账户有余额;可设日/月消费上限(元) |
| 调用后 | 立即 扣减套餐剩余 Token | 先记录本次费用,再 定期汇总 从余额扣除(后付费) |
| 在哪里查账 | 订单列表(套餐订单) | 收支明细(余额扣费记录) |
| 限购 | 单笔订单每次只能买 1 份套餐 | — |
| 适合 | 预算固定、活动包、试用 | 用量波动、与云资源共用余额 |
WARNING
计费方式在 创建密钥时 确定。不能将按量密钥改为扣套餐,需 新建密钥 并重新选择计费方式。
调用与扣费流程
Token 套餐
发起请求 → 平台校验通过 → 返回模型结果 → 按 Token 数扣减套餐剩余额度
按量调用(后付费)
发起请求(要求当时余额 > 0)→ 返回模型结果 → 记录本次费用(元)
↓
系统定期汇总,在【收支明细】扣减账户余额
Token 套餐
套餐包含什么
| 说明项 | 含义 |
|---|---|
| Token 总量 | 购买后获得的可用 Token 额度 |
| 售价 | 套餐价格(元) |
| 有效期 | 购买后多少天内有效 |
| 库存 / 限购 | 售完即止;每用户可购次数上限(若有) |
| 适用模型 | 若限定模型,仅列出的模型可用该套餐;未限定则表示全部已上架模型 |
购买与使用
- 控制台 套餐订阅 选购并支付。
- 在 套餐管理 查看剩余 Token、过期时间、状态(可用 / 已用完 / 已过期)。
- 创建 API 密钥,选择 套餐计费,并绑定对应套餐。
- 使用密钥调用模型 API;每次成功调用按返回的 总 Token 数 扣减套餐额度。
TIP
套餐模式下,扣的是 Token 个数,不是每次再按单价折算人民币。您购买时支付的金额,对应整包 Token 额度。
扣减规则摘要
- 套餐须处于 可用 且 未过期。
- 若本次消耗 不超过 剩余 Token:按实际消耗扣除。
- 若本次消耗 超过 剩余 Token:仅扣光剩余部分,套餐变为 已用完;当次对话结果仍会返回,但后续调用需新购套餐或更换密钥。
- 在 套餐管理 查看剩余额度;单次扣减可在 调用统计 或套餐相关用量明细中核对(以控制台为准)。
套餐与模型的关系
| 套餐配置 | 行为 |
|---|---|
| 未限定模型 | 可用于当前已上架的文本对话模型(以平台规则为准) |
| 限定了适用模型 | 仅列出的模型可用该套餐;其他模型需换套餐或按量密钥 |
创建 套餐密钥 时必须 绑定 一笔可用套餐;一把密钥对应一种计费绑定关系。
按量调用
Token 用量指什么
每次成功调用后,平台会记录本次对话的 Token 用量(可在 调用统计 查看),一般包括:
| 类型 | 含义 |
|---|---|
| 输入 Token | 您发送的提示、历史对话等占用的 Token |
| 输出 Token | 模型生成回复占用的 Token |
| 缓存 Token | 部分模型支持的上下文缓存命中(若该次返回中有统计) |
| 合计 | 用于套餐扣减或按量计价 |
OpenAI 方式可在响应 usage 中查看;Anthropic 方式见 usage.input_tokens / output_tokens。
如何计价
按 输入 Token、输出 Token、缓存 Token(若适用)分别计费后相加:
单项费用(元) =(该项 Token 数 ÷ 1,000,000)× 该项单价(元/百万 Token)× 计费倍率
- 单价按模型 分档 配置:上下文越长,可能适用不同档位(以控制台展示为准)。
- 每项金额 向上取整到 0.01 元;大于 0 但不足 0.01 元时,按 0.01 元 计。
示例(单档、倍率为 1):输入 1200 Token、输出 800 Token;输入单价 2 元/百万、输出单价 6 元/百万:
| 项目 | 说明 | 费用 |
|---|---|---|
| 输入 | 1200 ÷ 1000000 × 2 | 0.01 元 |
| 输出 | 800 ÷ 1000000 × 6 | 0.01 元 |
| 合计 | 0.02 元 |
调用前:余额必须大于 0
使用 按量 方式发起新的调用前,系统会检查 账户余额是否大于 0。若余额已用完(小于等于 0),将无法开始新的调用,并提示充值。
若密钥设置了 每日 / 每月消费上限(元),超过上限后同样无法继续调用(0 表示不限制)。
调用中:已发出的请求
若某次调用 已经开始处理,即使随后汇总扣费导致余额变为负数,当次请求通常仍会正常返回完整结果。
但结算完成后,只要余额 小于等于 0,下一次 按量调用将无法发起,直至您充值使余额恢复为大于 0。
调用后与账单(后付费、汇总出账)
| 说明 | 内容 |
|---|---|
| 计费性质 | 后付费:先产生用量与费用记录,再汇总从余额扣除 |
| 出账方式 | 系统 定期汇总 按量消费(按量小时结算),不是每请求立刻扣余额 |
| 哪里查看 | 控制台 收支明细;调用统计 可看单次 Token 与用量 |
| 与套餐区别 | 套餐购买记录看 订单列表,不按量扣余额流水 |
::: info 按量模式下:页面显示调用成功时,余额可能尚未扣减;最终以 收支明细 为准。 :::
密钥通用规则
| 规则 | 说明 |
|---|---|
| 密钥格式 | sk- 开头,创建时随机生成 |
| 请求头 | X-API-Key,或 Authorization: Bearer sk-... |
| 状态 | 有效 可调用;作废 后立即失效,不可恢复同一串密钥 |
| 编辑 | 可改名称、按量日/月限额、套餐绑定等;计费类型(套餐/按量)需新建密钥 |
| 删除 | 一般用于清理已作废记录 |
| 安全 | 仅创建时展示完整密钥;泄露请作废重建 |
按量密钥的消费上限
| 字段 | 说明 |
|---|---|
| 每日上限(元) | 自然日内,该密钥产生的按量费用合计达到上限后,当日不可再调 |
| 每月上限(元) | 自然月内同理 |
| 填 0 | 表示 不限制 |
统计的是该密钥关联的 按量费用(元),不是 Token 个数。
控制台对账
| 页面 | 用途 |
|---|---|
| 订单列表 | 已购买的 Token 套餐 订单 |
| 收支明细 | 按量 从账户余额扣费的记录 |
| 调用统计 | 调用次数、Token 用量(套餐与按量均可查) |
| 套餐管理 | 套餐剩余 Token、有效期 |
与云主机计费的关系
- 云主机、容器、裸金属等费用与模型 API 分开核算。
- 按量模型 API 使用 同一账户余额,充值见 充值与计费。
- Token 套餐 仅用于模型 API,不能抵扣 GPU 实例费用。
