常见问题

产品说明

Token 是什么？和字数一样吗？

Token 是衡量模型处理文字用量的 计费单位，不完全等于「字数」。中文、英文、标点占用的 Token 可能不同，以 调用统计 或接口返回的用量为准。详见 模型与 Token 入门。

知识库、RAG、Agent、MCP、Skill 分别是什么？

见 AI 应用概念入门。捷智算 模型 API 提供大模型对话能力；知识库与 RAG 通常在 Dify 等平台或自研系统中实现；MCP 用于连接外部工具；Skill 指可复用的单类任务能力配置。

OpenClaw 镜像怎么用捷智算模型？

购买云主机时选 ubuntu22-openclaw 镜像，按 OpenClaw 部署指南开机。要在 OpenClaw 里使用控制台的多模型 API，请在控制台创建 sk- 密钥，并按智能体与 OpenClaw 将 https://mass.gogpu.cn/v1 配入 openclaw.json。也可选用实例内 Ollama 本地模型，与模型 API 可并存。

Hermes 和 OpenClaw 有什么区别？

OpenClaw 侧重多渠道助手网关（捷智算提供 ubuntu22-openclaw 镜像）；Hermes Agent 侧重 智能体运行时 与任务执行，二者可组合使用。详见智能体与 OpenClaw、AI 应用概念入门。

捷智算是否提供知识库或 RAG？

捷智算 模型 API 提供大模型 对话能力。知识库、检索、工作流编排需在 Dify、自研应用等系统中自行搭建，并在该系统中配置 https://mass.gogpu.cn 与 API 密钥作为模型服务。

模型 API、MASS、Token 服务有什么区别？

没有区别，都是指通过 https://mass.gogpu.cn 调用捷智算大模型。控制台菜单名称可能略有不同。

和模型广场一样吗？

要分清 两个「模型广场」：

	控制台 · 模型 API · 模型广场	平台 · GPU 模型广场
用途	看 API 已上架模型、按量参考价、网页体验、进 API 文档	买 GPU 云主机并部署开源模型镜像
调用方式	`https://mass.gogpu.cn` + API 密钥	在自有实例上运行，非 mass 地址

控制台里 模型 API 服务 自带 模型广场，与模型 API 服务简介 · 和「模型广场」有什么不同说明一致。平台侧 GPU 部署见模型广场简介。

买云主机、充值、管密钥要去哪里？

请登录捷智算控制台open in new window。模型对话 的地址是 https://mass.gogpu.cn，与控制台网址不同，请勿混淆。

计费

两种计费方式怎么选？

方式	适合	扣费
Token 套餐	预算固定	扣套餐剩余 Token
按量	用量不定	扣账户余额（元）

套餐是按钱扣还是按 Token 扣？

买套餐时付人民币，得到一包 Token。每次调用按实际使用的 Token 数量 从套餐里扣，不再按次另算人民币。

按量为什么调用成功了余额还没变？

按量属于 后付费：先记用量，再由系统 定期汇总 从余额扣除。请稍后在控制台 收支明细 查看；单次用量可在 调用统计 查看。

余额为 0 或负数还能用按量吗？

余额	能否发起新的按量调用
大于 0	可以
小于等于 0	不可以，需先充值

若调用过程中因汇总扣费导致余额变为负数，当次已在进行 的请求一般仍能完成；完成后须充值才能再次按量调用。

套餐订单和按量扣费分别在哪看？

订单列表：购买的 Token 套餐订单。
收支明细：按量调用从账户余额扣除的记录。

价格怎么算？

按输入、输出等 Token 数量，结合控制台公示的单价计算。详见计费方式说明。

密钥

密钥丢了怎么办？

无法找回，请在控制台作废后新建，并在您的工具里更新为新密钥。

可以把密钥写在网页里吗？

不建议。密钥应保存在您信任的环境（如自己的电脑脚本、服务器），避免他人盗用产生费用。

作废和删除有什么区别？

作废后密钥立刻不能调用，但记录仍保留便于对账；删除多用于清理已作废项。无论哪种，原密钥串 无法再次启用，只能新建。

能把按量密钥改成套餐密钥吗？

不能通过编辑切换计费方式。请新建密钥并选择对应方式，再在业务里更换为新 sk-。

日/月消费上限怎么算？

按 自然日、自然月 统计该密钥已产生的 按量费用（元）。填 0 表示不限制。仅对按量密钥生效。

调用

模型名称填什么？

必须与控制台 接口模型名称 完全一致。也可在请求头携带 API 密钥后访问 GET https://mass.gogpu.cn/v1/models 查看列表，或在 模型广场 查看。名称 区分大小写，请勿多空格或使用展示名代替接口名。

OpenAI 和 Anthropic 两种方式怎么选？

每个模型通常只支持其中一种。请按 模型广场 该模型的 API 说明选择地址，不要对同一模型混用两种路径。

调用时要不要登录控制台？

不需要。只需在请求头携带 API 密钥（X-API-Key 或 Bearer sk-...）。

返回里有 code: 7 是什么意思？

表示请求未通过平台校验或业务规则拒绝。请查看 msg 中文说明（如余额不足、密钥无效），对照 API 调用指南 · 常见报错对照。

支持逐字输出吗？

支持。开放 API 在请求里设置 stream: true 即可，费用仍按实际 Token 计算。

流式和非流式价格一样吗？

一样，均按本次实际 Token（含输入、输出等分项）计费，见计费方式说明。

一次对话里 messages 要传几条？

至少一条有效用户内容。多轮对话按时间顺序传入历史 user / assistant，最后一条一般为 user。

套餐 Token 不够了，这次还会返回吗？

若当次消耗超过剩余 Token，平台会 扣光剩余额度 并标记套餐用完，当次结果一般会正常返回；之后需新购套餐或换按量密钥才能继续。

一直超时怎么办？

可尝试缩短提问、降低 max_tokens，或在客户端把超时调到 60 秒以上。若 调用统计 已有记录，说明请求已到达平台；仍失败请联系客服并说明时间段与模型名（勿发完整密钥）。

图片、视频模型能用 API 吗？

当前 https://mass.gogpu.cn 仅开放文本对话类 API。图片/视频若控制台有入口，请以控制台功能为准，API 未开放前请勿按文本接口硬调。

控制台

为什么选不到某个套餐密钥？

可能该套餐 不支持当前模型，或套餐已过期、Token 已用完。可换套餐或使用按量密钥。

如何查花了多少钱？

在控制台查看 调用统计；按量用户还可查 收支明细，套餐用户可查 订单列表。

合规

使用须遵守服务条款、平台安全管控规则。

仍无法解决？

联系客服时请说明：大致时间、使用的模型名称、密钥名称（不要发送完整 sk- 密钥）、页面上的报错原文。

文档索引