常见问题


产品说明

Token 是什么?和字数一样吗?

Token 是衡量模型处理文字用量的 计费单位,不完全等于「字数」。中文、英文、标点占用的 Token 可能不同,以 调用统计 或接口返回的用量为准。详见 模型与 Token 入门

知识库、RAG、Agent、MCP、Skill 分别是什么?

AI 应用概念入门。捷智算 模型 API 提供大模型对话能力;知识库与 RAG 通常在 Dify 等平台或自研系统中实现;MCP 用于连接外部工具;Skill 指可复用的单类任务能力配置。

OpenClaw 镜像怎么用捷智算模型?

购买云主机时选 ubuntu22-openclaw 镜像,按 OpenClaw 部署指南 开机。要在 OpenClaw 里使用控制台的多模型 API,请在控制台创建 sk- 密钥,并按 智能体与 OpenClawhttps://mass.gogpu.cn/v1 配入 openclaw.json。也可选用实例内 Ollama 本地模型,与模型 API 可并存。

Hermes 和 OpenClaw 有什么区别?

OpenClaw 侧重多渠道助手 网关(捷智算提供 ubuntu22-openclaw 镜像);Hermes Agent 侧重 智能体运行时 与任务执行,二者可组合使用。详见 智能体与 OpenClawAI 应用概念入门

捷智算是否提供知识库或 RAG?

捷智算 模型 API 提供大模型 对话能力。知识库、检索、工作流编排需在 Dify、自研应用等系统中自行搭建,并在该系统中配置 https://mass.gogpu.cn 与 API 密钥作为模型服务。

模型 API、MASS、Token 服务有什么区别?

没有区别,都是指通过 https://mass.gogpu.cn 调用捷智算大模型。控制台菜单名称可能略有不同。

和模型广场一样吗?

要分清 两个「模型广场」

控制台 · 模型 API · 模型广场平台 · GPU 模型广场
用途看 API 已上架模型、按量参考价、网页 体验、进 API 文档买 GPU 云主机并 部署开源模型镜像
调用方式https://mass.gogpu.cn + API 密钥在自有实例上运行,非 mass 地址

控制台里 模型 API 服务 自带 模型广场,与 模型 API 服务简介 · 和「模型广场」有什么不同 说明一致。平台侧 GPU 部署见 模型广场简介

买云主机、充值、管密钥要去哪里?

请登录 捷智算控制台open in new window模型对话 的地址是 https://mass.gogpu.cn,与控制台网址不同,请勿混淆。


计费

两种计费方式怎么选?

方式适合扣费
Token 套餐预算固定扣套餐剩余 Token
按量用量不定扣账户余额(元)

套餐是按钱扣还是按 Token 扣?

买套餐时付人民币,得到一包 Token。每次调用按实际使用的 Token 数量 从套餐里扣,不再按次另算人民币。

按量为什么调用成功了余额还没变?

按量属于 后付费:先记用量,再由系统 定期汇总 从余额扣除。请稍后在控制台 收支明细 查看;单次用量可在 调用统计 查看。

余额为 0 或负数还能用按量吗?

余额能否发起新的按量调用
大于 0可以
小于等于 0不可以,需先充值

若调用过程中因汇总扣费导致余额变为负数,当次已在进行 的请求一般仍能完成;完成后须充值才能再次按量调用。

套餐订单和按量扣费分别在哪看?

  • 订单列表:购买的 Token 套餐订单。
  • 收支明细:按量调用从账户余额扣除的记录。

价格怎么算?

按输入、输出等 Token 数量,结合控制台公示的单价计算。详见 计费方式说明


密钥

密钥丢了怎么办?

无法找回,请在控制台 作废 后新建,并在您的工具里更新为新密钥。

可以把密钥写在网页里吗?

不建议。密钥应保存在您信任的环境(如自己的电脑脚本、服务器),避免他人盗用产生费用。

作废和删除有什么区别?

作废后密钥立刻不能调用,但记录仍保留便于对账;删除多用于清理已作废项。无论哪种,原密钥串 无法再次启用,只能新建。

能把按量密钥改成套餐密钥吗?

不能通过编辑切换计费方式。请 新建 密钥并选择对应方式,再在业务里更换为新 sk-

日/月消费上限怎么算?

自然日、自然月 统计该密钥已产生的 按量费用(元)。填 0 表示不限制。仅对 按量 密钥生效。


调用

模型名称填什么?

必须与控制台 接口模型名称 完全一致。也可在请求头携带 API 密钥后访问 GET https://mass.gogpu.cn/v1/models 查看列表,或在 模型广场 查看。名称 区分大小写,请勿多空格或使用展示名代替接口名。

OpenAI 和 Anthropic 两种方式怎么选?

每个模型通常只支持其中一种。请按 模型广场 该模型的 API 说明选择地址,不要对同一模型混用两种路径。

调用时要不要登录控制台?

不需要。只需在请求头携带 API 密钥X-API-KeyBearer sk-...)。

返回里有 code: 7 是什么意思?

表示请求未通过平台校验或业务规则拒绝。请查看 msg 中文说明(如余额不足、密钥无效),对照 API 调用指南 · 常见报错对照

支持逐字输出吗?

支持。开放 API 在请求里设置 stream: true 即可,费用仍按实际 Token 计算。

流式和非流式价格一样吗?

一样,均按本次实际 Token(含输入、输出等分项)计费,见 计费方式说明

一次对话里 messages 要传几条?

至少一条有效 用户 内容。多轮对话按时间顺序传入历史 user / assistant,最后一条一般为 user

套餐 Token 不够了,这次还会返回吗?

若当次消耗超过剩余 Token,平台会 扣光剩余额度 并标记套餐用完,当次结果一般会正常返回;之后需新购套餐或换按量密钥才能继续。

一直超时怎么办?

可尝试缩短提问、降低 max_tokens,或在客户端把超时调到 60 秒以上。若 调用统计 已有记录,说明请求已到达平台;仍失败请联系客服并说明时间段与模型名(勿发完整密钥)。

图片、视频模型能用 API 吗?

当前 https://mass.gogpu.cn 仅开放文本对话类 API。图片/视频若控制台有入口,请以控制台功能为准,API 未开放前请勿按文本接口硬调。


控制台

为什么选不到某个套餐密钥?

可能该套餐 不支持当前模型,或套餐已过期、Token 已用完。可换套餐或使用按量密钥。

如何查花了多少钱?

在控制台查看 调用统计;按量用户还可查 收支明细,套餐用户可查 订单列表


合规

使用须遵守 服务条款平台安全管控规则


仍无法解决?

联系客服时请说明:大致时间、使用的模型名称、密钥名称(不要发送完整 sk- 密钥)、页面上的报错原文。


文档索引

复制 MD