模型 API 服务
捷智算模型 API · 兼容 OpenAI / Anthropic 调用方式 · Token 套餐 + 按量
通过模型 API 服务,您可以在自己的软件、脚本或 Cursor 等工具里调用捷智算提供的大模型,无需购买 GPU 云主机。在 控制台 创建 API 密钥 后,将调用地址设置为 https://mass.gogpu.cn 即可使用。
TIP
首次使用建议先阅读 模型与 Token 入门,了解大模型、Token 与计费方式,再阅读计费与 API 相关文档。
核心能力
| 能力 | 说明 |
|---|---|
| 对话与文本能力 | 问答、写作、摘要、代码辅助等(以控制台已上架模型为准) |
| 常用工具可用 | 支持 OpenAI、Anthropic 两种常见调用方式,多数 AI 客户端改地址和密钥即可使用 |
| 两种付费方式 | Token 套餐:先买额度再调用;按量:用多少从账户余额扣多少 |
| 用量可查 | 调用统计 看用量;套餐订单看 订单列表,按量扣费看 收支明细 |
| 密钥管控 | 控制台创建与管理 sk- 密钥;按量密钥可设 日/月消费上限(元) |
适用场景
| 场景 | 是否适合 |
|---|---|
| 在自己的网站、App、企业系统里接大模型 | 适合 |
| 在 Cursor、Dify、FastGPT 等工具里换 API 地址使用 | 适合 |
| 在 OpenClaw 云主机镜像里当在线模型源 | 适合,见 智能体与 OpenClaw |
| 用脚本批量处理文案、客服、知识库问答 | 适合 |
| 需要自己在 GPU 上部署、微调特定开源权重 | 更适合平台 GPU 模型广场(需购买云主机) |
开放范围说明
| 能力 | 开放 API(mass.gogpu.cn) | 控制台 |
|---|---|---|
| 文本对话 | 支持 | 模型广场、文本对话、API 调用 |
| 图片 / 视频生成 | 当前 未提供 开放 API | 若菜单已展示,以控制台实际上线功能为准 |
通过 API 调用时,请使用 文本对话类 模型;请求参数 model 须与控制台 接口模型名称 一致(与 GET /v1/models 返回的 id 相同)。
调用地址
在程序或 AI 工具中填写以下地址(请勿使用测试或旧地址,以本文为准):
| 用途 | 地址 |
|---|---|
| 对话(OpenAI 方式) | https://mass.gogpu.cn/v1/chat/completions |
| 对话(Anthropic 方式) | https://mass.gogpu.cn/anthropic/v1/messages |
| 查看可用模型 | https://mass.gogpu.cn/v1/models(须携带 API 密钥) |
若在工具里只需填「接口根地址」,一般填:
- OpenAI 类工具:
https://mass.gogpu.cn/v1 - Anthropic 类工具:
https://mass.gogpu.cn/anthropic
和「模型广场」有什么不同?
平台上容易遇到 两个都叫「模型广场」的入口,含义不同,请勿混淆:
| 控制台 · 模型 API · 模型广场 | 平台 · GPU 模型广场 | |
|---|---|---|
| 在哪里 | 控制台 → 模型 API 服务 侧栏 → 模型广场 | 捷智算主站/文档中的 GPU 模型广场 |
| 做什么 | 浏览 API 已上架 的模型;查看 按量参考价;体验(跳转 文本对话 网页试用);进入各模型的 API 文档 与帮助 | 选购 GPU 云主机 并 部署开源模型镜像(如 YOLO、Llama、ComfyUI 等) |
| 怎么用 | 创建 API 密钥 后,在程序或工具里调用 https://mass.gogpu.cn;也可仅在控制台试用 | 购买实例、选镜像,在 您自己的 GPU 上运行模型 |
| 怎么计费 | Token 套餐 或 按量(模型 API 计费体系) | 主要按 云主机使用时长 等资源计费 |
简要对照
- 只想 接 API、网页试一句、查价格和文档 → 用控制台 模型 API 下的 模型广场(与本文档、 控制台使用指南 一致)。
- 要在 自己的 GPU 机器里跑特定开源权重、做训练或私有化部署 → 用平台 GPU 模型广场。
下文凡写「在 模型广场 查看模型名称、价格、API 文档」,均指 控制台模型 API 菜单里的模型广场,除非特别说明为 GPU 模型广场。
一次调用是怎样完成的?
您发起 HTTPS 请求(请求头带 API 密钥)
↓
捷智算校验:密钥有效 → 模型已上架 → 计费方式可用(套餐有余量 / 按量余额>0 等)
↓
完成对话并返回结果(支持流式)
↓
按实际 Token 记账:套餐立即扣 Token;按量先记费用,再定期从余额汇总扣除
| 步骤 | 说明 |
|---|---|
| 鉴权 | 使用控制台创建的 sk- 密钥,在请求头携带即可;无需在 API 请求里传控制台登录密码 |
| 选模型 | 请求体 model 与 接口模型名称 完全一致(区分大小写) |
| 选地址 | 该模型支持 OpenAI 方式 或 Anthropic 方式 之一,须与文档/控制台说明一致,不可混用 |
| 计费 | 由密钥绑定的计费方式决定:套餐扣 Token,按量扣账户余额(后付费) |
快速上手
可选模型(节选)
以控制台 模型广场 实际上架为准,例如:
| 类型 | 示例(控制台展示名) |
|---|---|
| 国产对话 | 通义、混元、豆包、DeepSeek、智谱、Kimi 等 |
| 其他 | MiniMax、Yi、百川等 |
部分模型支持 OpenAI 方式调用,部分支持 Anthropic 方式,请在 模型广场 查看该模型的 API 文档入口或说明。参数表见 请求参数说明。
如何快速确认调用方式
- 打开 模型广场 → 目标模型 → API 文档。
- 或先
GET https://mass.gogpu.cn/v1/models(请求头携带 API 密钥)确认模型 id,再按文档选用/v1/chat/completions或/anthropic/v1/messages。
文档导航
左侧目录按 先概念、再上手、后开发 分组,建议按需阅读:
| 分组 | 文档 | 内容 |
|---|---|---|
| 基础概念 | 模型与 Token 入门 | 大模型、Token、上下文 |
| AI 应用概念入门 | 知识库、RAG、Agent、MCP、Skill | |
| 上手与计费 | 快速开始 | 5 分钟完成首次调用 |
| 智能体与 OpenClaw | OpenClaw 镜像、Hermes、接入模型 API | |
| 控制台使用指南 | 买套餐、密钥、查用量 | |
| 计费方式说明 | 套餐与按量怎么扣费 | |
| API 开发 | API 调用指南 | 示例命令与工具配置 |
| 请求参数说明 | OpenAI / Anthropic 请求字段 | |
| 其他 | 常见问题 | 常见疑问与排错 |
使用前请确认
- [ ] 已购买套餐或账户有余额(按量)
- [ ] 已保存 API 密钥
- [ ] 调用时填写的 模型名称 与控制台 接口模型名称 完全一致
- [ ] 调用地址为
https://mass.gogpu.cn(见上文表格)
相关链接
| 名称 | 地址 |
|---|---|
| 用户控制台 | https://console.gogpu.cn/ |
| 捷智算官网 | https://www.gogpu.cn/ |
| 模型 API 调用 | https://mass.gogpu.cn |
