常见问题
产品说明
Token 是什么?和字数一样吗?
Token 是衡量模型处理文字用量的 计费单位,不完全等于「字数」。中文、英文、标点占用的 Token 可能不同,以 调用统计 或接口返回的用量为准。详见 模型与 Token 入门。
知识库、RAG、Agent、MCP、Skill 分别是什么?
见 AI 应用概念入门。捷智算 模型 API 提供大模型对话能力;知识库与 RAG 通常在 Dify 等平台或自研系统中实现;MCP 用于连接外部工具;Skill 指可复用的单类任务能力配置。
OpenClaw 镜像怎么用捷智算模型?
购买云主机时选 ubuntu22-openclaw 镜像,按 OpenClaw 部署指南 开机。要在 OpenClaw 里使用控制台的多模型 API,请在控制台创建 sk- 密钥,并按 智能体与 OpenClaw 将 https://mass.gogpu.cn/v1 配入 openclaw.json。也可选用实例内 Ollama 本地模型,与模型 API 可并存。
Hermes 和 OpenClaw 有什么区别?
OpenClaw 侧重多渠道助手 网关(捷智算提供 ubuntu22-openclaw 镜像);Hermes Agent 侧重 智能体运行时 与任务执行,二者可组合使用。详见 智能体与 OpenClaw、AI 应用概念入门。
捷智算是否提供知识库或 RAG?
捷智算 模型 API 提供大模型 对话能力。知识库、检索、工作流编排需在 Dify、自研应用等系统中自行搭建,并在该系统中配置 https://mass.gogpu.cn 与 API 密钥作为模型服务。
模型 API、MASS、Token 服务有什么区别?
没有区别,都是指通过 https://mass.gogpu.cn 调用捷智算大模型。控制台菜单名称可能略有不同。
和模型广场一样吗?
要分清 两个「模型广场」:
| 控制台 · 模型 API · 模型广场 | 平台 · GPU 模型广场 | |
|---|---|---|
| 用途 | 看 API 已上架模型、按量参考价、网页 体验、进 API 文档 | 买 GPU 云主机并 部署开源模型镜像 |
| 调用方式 | https://mass.gogpu.cn + API 密钥 | 在自有实例上运行,非 mass 地址 |
控制台里 模型 API 服务 自带 模型广场,与 模型 API 服务简介 · 和「模型广场」有什么不同 说明一致。平台侧 GPU 部署见 模型广场简介。
买云主机、充值、管密钥要去哪里?
请登录 捷智算控制台。模型对话 的地址是 https://mass.gogpu.cn,与控制台网址不同,请勿混淆。
计费
两种计费方式怎么选?
| 方式 | 适合 | 扣费 |
|---|---|---|
| Token 套餐 | 预算固定 | 扣套餐剩余 Token |
| 按量 | 用量不定 | 扣账户余额(元) |
套餐是按钱扣还是按 Token 扣?
买套餐时付人民币,得到一包 Token。每次调用按实际使用的 Token 数量 从套餐里扣,不再按次另算人民币。
按量为什么调用成功了余额还没变?
按量属于 后付费:先记用量,再由系统 定期汇总 从余额扣除。请稍后在控制台 收支明细 查看;单次用量可在 调用统计 查看。
余额为 0 或负数还能用按量吗?
| 余额 | 能否发起新的按量调用 |
|---|---|
| 大于 0 | 可以 |
| 小于等于 0 | 不可以,需先充值 |
若调用过程中因汇总扣费导致余额变为负数,当次已在进行 的请求一般仍能完成;完成后须充值才能再次按量调用。
套餐订单和按量扣费分别在哪看?
- 订单列表:购买的 Token 套餐订单。
- 收支明细:按量调用从账户余额扣除的记录。
价格怎么算?
按输入、输出等 Token 数量,结合控制台公示的单价计算。详见 计费方式说明。
密钥
密钥丢了怎么办?
无法找回,请在控制台 作废 后新建,并在您的工具里更新为新密钥。
可以把密钥写在网页里吗?
不建议。密钥应保存在您信任的环境(如自己的电脑脚本、服务器),避免他人盗用产生费用。
作废和删除有什么区别?
作废后密钥立刻不能调用,但记录仍保留便于对账;删除多用于清理已作废项。无论哪种,原密钥串 无法再次启用,只能新建。
能把按量密钥改成套餐密钥吗?
不能通过编辑切换计费方式。请 新建 密钥并选择对应方式,再在业务里更换为新 sk-。
日/月消费上限怎么算?
按 自然日、自然月 统计该密钥已产生的 按量费用(元)。填 0 表示不限制。仅对 按量 密钥生效。
调用
模型名称填什么?
必须与控制台 接口模型名称 完全一致。也可在请求头携带 API 密钥后访问 GET https://mass.gogpu.cn/v1/models 查看列表,或在 模型广场 查看。名称 区分大小写,请勿多空格或使用展示名代替接口名。
OpenAI 和 Anthropic 两种方式怎么选?
每个模型通常只支持其中一种。请按 模型广场 该模型的 API 说明选择地址,不要对同一模型混用两种路径。
调用时要不要登录控制台?
不需要。只需在请求头携带 API 密钥(X-API-Key 或 Bearer sk-...)。
返回里有 code: 7 是什么意思?
表示请求未通过平台校验或业务规则拒绝。请查看 msg 中文说明(如余额不足、密钥无效),对照 API 调用指南 · 常见报错对照。
支持逐字输出吗?
支持。开放 API 在请求里设置 stream: true 即可,费用仍按实际 Token 计算。
流式和非流式价格一样吗?
一样,均按本次实际 Token(含输入、输出等分项)计费,见 计费方式说明。
一次对话里 messages 要传几条?
至少一条有效 用户 内容。多轮对话按时间顺序传入历史 user / assistant,最后一条一般为 user。
套餐 Token 不够了,这次还会返回吗?
若当次消耗超过剩余 Token,平台会 扣光剩余额度 并标记套餐用完,当次结果一般会正常返回;之后需新购套餐或换按量密钥才能继续。
一直超时怎么办?
可尝试缩短提问、降低 max_tokens,或在客户端把超时调到 60 秒以上。若 调用统计 已有记录,说明请求已到达平台;仍失败请联系客服并说明时间段与模型名(勿发完整密钥)。
图片、视频模型能用 API 吗?
当前 https://mass.gogpu.cn 仅开放文本对话类 API。图片/视频若控制台有入口,请以控制台功能为准,API 未开放前请勿按文本接口硬调。
控制台
为什么选不到某个套餐密钥?
可能该套餐 不支持当前模型,或套餐已过期、Token 已用完。可换套餐或使用按量密钥。
如何查花了多少钱?
在控制台查看 调用统计;按量用户还可查 收支明细,套餐用户可查 订单列表。
合规
仍无法解决?
联系客服时请说明:大致时间、使用的模型名称、密钥名称(不要发送完整 sk- 密钥)、页面上的报错原文。
