计费方式说明

模型 API 提供 Token 套餐按量调用 两种计费方式,在创建 API 密钥时选定。

::: info 首次使用建议先阅读 模型与 Token 入门,了解 Token、输入/输出、上下文等概念,再选择套餐或按量计费方式。 :::


方式对比

项目Token 套餐按量调用
预付购买套餐(人民币)账户充值(人民币)
扣什么套餐内 Token 数量账户 余额(元)
密钥要求必须 绑定 一笔「套餐管理」中的可用套餐无需绑定套餐
调用前套餐未过期、有剩余 Token、模型在套餐适用范围内账户有余额;可设日/月消费上限(元)
调用后立即 扣减套餐剩余 Token先记录本次费用,再 定期汇总 从余额扣除(后付费)
在哪里查账订单列表(套餐订单)收支明细(余额扣费记录)
限购单笔订单每次只能买 1 份套餐
适合预算固定、活动包、试用用量波动、与云资源共用余额

WARNING

计费方式在 创建密钥时 确定。不能将按量密钥改为扣套餐,需 新建密钥 并重新选择计费方式。


调用与扣费流程

Token 套餐

发起请求 → 平台校验通过 → 返回模型结果 → 按 Token 数扣减套餐剩余额度

按量调用(后付费)

发起请求(要求当时余额 > 0)→ 返回模型结果 → 记录本次费用(元)
                                              ↓
                              系统定期汇总,在【收支明细】扣减账户余额

Token 套餐

套餐包含什么

说明项含义
Token 总量购买后获得的可用 Token 额度
售价套餐价格(元)
有效期购买后多少天内有效
库存 / 限购售完即止;每用户可购次数上限(若有)
适用模型若限定模型,仅列出的模型可用该套餐;未限定则表示全部已上架模型

购买与使用

  1. 控制台 套餐订阅 选购并支付。
  2. 套餐管理 查看剩余 Token、过期时间、状态(可用 / 已用完 / 已过期)。
  3. 创建 API 密钥,选择 套餐计费,并绑定对应套餐。
  4. 使用密钥调用模型 API;每次成功调用按返回的 总 Token 数 扣减套餐额度。

TIP

套餐模式下,扣的是 Token 个数,不是每次再按单价折算人民币。您购买时支付的金额,对应整包 Token 额度。

扣减规则摘要

  • 套餐须处于 可用未过期
  • 若本次消耗 不超过 剩余 Token:按实际消耗扣除。
  • 若本次消耗 超过 剩余 Token:仅扣光剩余部分,套餐变为 已用完当次对话结果仍会返回,但后续调用需新购套餐或更换密钥。
  • 套餐管理 查看剩余额度;单次扣减可在 调用统计 或套餐相关用量明细中核对(以控制台为准)。

套餐与模型的关系

套餐配置行为
未限定模型可用于当前已上架的文本对话模型(以平台规则为准)
限定了适用模型仅列出的模型可用该套餐;其他模型需换套餐或按量密钥

创建 套餐密钥 时必须 绑定 一笔可用套餐;一把密钥对应一种计费绑定关系。


按量调用

Token 用量指什么

每次成功调用后,平台会记录本次对话的 Token 用量(可在 调用统计 查看),一般包括:

类型含义
输入 Token您发送的提示、历史对话等占用的 Token
输出 Token模型生成回复占用的 Token
缓存 Token部分模型支持的上下文缓存命中(若该次返回中有统计)
合计用于套餐扣减或按量计价

OpenAI 方式可在响应 usage 中查看;Anthropic 方式见 usage.input_tokens / output_tokens

如何计价

输入 Token、输出 Token、缓存 Token(若适用)分别计费后相加:

单项费用(元) =(该项 Token 数 ÷ 1,000,000)× 该项单价(元/百万 Token)× 计费倍率

  • 单价按模型 分档 配置:上下文越长,可能适用不同档位(以控制台展示为准)。
  • 每项金额 向上取整到 0.01 元;大于 0 但不足 0.01 元时,按 0.01 元 计。

示例(单档、倍率为 1):输入 1200 Token、输出 800 Token;输入单价 2 元/百万、输出单价 6 元/百万:

项目说明费用
输入1200 ÷ 1000000 × 20.01 元
输出800 ÷ 1000000 × 60.01 元
合计0.02 元

调用前:余额必须大于 0

使用 按量 方式发起新的调用前,系统会检查 账户余额是否大于 0。若余额已用完(小于等于 0),将无法开始新的调用,并提示充值。

若密钥设置了 每日 / 每月消费上限(元),超过上限后同样无法继续调用(0 表示不限制)。

调用中:已发出的请求

若某次调用 已经开始处理,即使随后汇总扣费导致余额变为负数,当次请求通常仍会正常返回完整结果

但结算完成后,只要余额 小于等于 0下一次 按量调用将无法发起,直至您充值使余额恢复为大于 0。

调用后与账单(后付费、汇总出账)

说明内容
计费性质后付费:先产生用量与费用记录,再汇总从余额扣除
出账方式系统 定期汇总 按量消费(按量小时结算),不是每请求立刻扣余额
哪里查看控制台 收支明细调用统计 可看单次 Token 与用量
与套餐区别套餐购买记录看 订单列表,不按量扣余额流水

::: info 按量模式下:页面显示调用成功时,余额可能尚未扣减;最终以 收支明细 为准。 :::


密钥通用规则

规则说明
密钥格式sk- 开头,创建时随机生成
请求头X-API-Key,或 Authorization: Bearer sk-...
状态有效 可调用;作废 后立即失效,不可恢复同一串密钥
编辑可改名称、按量日/月限额、套餐绑定等;计费类型(套餐/按量)需新建密钥
删除一般用于清理已作废记录
安全仅创建时展示完整密钥;泄露请作废重建

按量密钥的消费上限

字段说明
每日上限(元)自然日内,该密钥产生的按量费用合计达到上限后,当日不可再调
每月上限(元)自然月内同理
填 0表示 不限制

统计的是该密钥关联的 按量费用(元),不是 Token 个数。


控制台对账

页面用途
订单列表已购买的 Token 套餐 订单
收支明细按量 从账户余额扣费的记录
调用统计调用次数、Token 用量(套餐与按量均可查)
套餐管理套餐剩余 Token、有效期

与云主机计费的关系

  • 云主机、容器、裸金属等费用与模型 API 分开核算
  • 按量模型 API 使用 同一账户余额,充值见 充值与计费
  • Token 套餐 仅用于模型 API,不能抵扣 GPU 实例费用。

相关文档

复制 MD