API 调用指南

本文说明如何填写 调用地址、API 密钥 和 模型名称，在您的环境（命令行、Python、Cursor 等）中成功调用捷智算模型 API。

::: info 请求参数详解当前仅支持 文本对话 模型。各字段含义与 JSON 示例见 请求参数说明。 :::

调用地址一览

用途	方法	完整地址	是否需要密钥
查看可用模型	GET	https://mass.gogpu.cn/v1/models	是
对话（OpenAI 方式）	POST	https://mass.gogpu.cn/v1/chat/completions	是
对话（Anthropic 方式）	POST	https://mass.gogpu.cn/anthropic/v1/messages	是

在 AI 工具里填写的根地址

工具类型	根地址
OpenAI 类（含多数国产客户端）	https://mass.gogpu.cn/v1
Anthropic 类	https://mass.gogpu.cn/anthropic

接入前检查清单

检查项	说明
密钥	已在控制台 API KEY 创建，并保存完整 `sk-` 字符串
计费	套餐密钥已绑定可用套餐；按量用户账户余额 > 0
模型名	与控制台接口模型名称或 `/v1/models` 的 `id` 完全一致
地址	OpenAI 类用 `/v1/chat/completions`；Anthropic 类用 `/anthropic/v1/messages`
协议	HTTPS + `Content-Type: application/json`

API 密钥

在控制台open in new window 创建密钥（sk- 开头），在每次请求的请求头中携带：

填写方式	示例
推荐	`X-API-Key: sk-你的密钥`
兼容	`Authorization: Bearer sk-你的密钥`

TIP

开放 API 只认 API 密钥，不需要控制台登录态 Cookie；包括 GET /v1/models 在内的接口均须在请求头携带密钥。密钥与您的账号绑定，请妥善保管。

每次调用前，平台会依次检查（摘要）

检查项	套餐密钥	按量密钥
密钥未作废	是	是
套餐未过期、有剩余 Token、模型在套餐适用范围内	是	—
账户余额大于 0	—	是
未超过该密钥设置的日/月消费上限（元）	可选	可选

上限为 0 表示不限制；统计范围为 自然日 / 自然月 内该密钥已产生的按量费用（元）。

查看可用模型

在终端执行：

curl -sS https://mass.gogpu.cn/v1/models \
  -H "X-API-Key: sk-你的密钥"

记下要用的模型 id，须与控制台 接口模型名称 一致，后续请求里的 model 字段照抄即可。

返回示例（结构示意）：

{
  "object": "list",
  "data": [
    {"id": "deepseek-v4-pro", "object": "model", "owned_by": "system"}
  ]
}

仅 已上架 的模型会出现在列表中；下架或维护中的模型无法调用。

对话示例（OpenAI 方式）

普通对话

curl https://mass.gogpu.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "X-API-Key: sk-你的密钥" \
  -d '{
    "model": "你的模型名称",
    "messages": [
      {"role": "user", "content": "你好"}
    ]
  }'

逐字输出（流式）

在请求里加上 "stream": true，回复会一段段返回；计费与普通对话相同，按实际 Token 计算。

curl -N https://mass.gogpu.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-你的密钥" \
  -d '{
    "model": "你的模型名称",
    "messages": [{"role": "user", "content": "讲个笑话"}],
    "stream": true
  }'

temperature、max_tokens、stream 等字段说明见 请求参数说明。

对话示例（Anthropic 方式）

仅适用于控制台标明支持该方式的模型：

curl https://mass.gogpu.cn/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "X-API-Key: sk-你的密钥" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "你的模型名称",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Hello"}
    ]
  }'

TIP

每个模型只使用其对应的一种调用方式，请勿混用两种地址。

Python 示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-你的密钥",
    base_url="https://mass.gogpu.cn/v1",
)

resp = client.chat.completions.create(
    model="你的模型名称",
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)

常见 AI 工具如何填写

工具	接口地址	密钥
Cursor / Continue 等	https://mass.gogpu.cn/v1	控制台创建的 sk- 密钥
Dify、FastGPT 等	选 OpenAI 兼容，地址填 https://mass.gogpu.cn/v1	同上

具体菜单名称因工具而异，一般在「API 设置」「模型提供商」中修改。

成功与失败时响应长什么样

调用成功时，响应体一般为标准 OpenAI 或 Anthropic 格式（含 choices / content 与 usage 等字段），便于直接用官方 SDK 解析。

校验失败或业务拒绝时，HTTP 状态码仍可能为 200，但 JSON 中会包含业务错误信息，形如：

{
  "code": 7,
  "data": {},
  "msg": "账户余额不足，请充值"
}

请读取 msg 字段排查；使用 OpenAI SDK 时，请关注异常信息中的服务端返回内容。

常见报错对照

返回信息（msg，节选）	含义	处理建议
请在请求头携带 API 密钥	未传密钥	添加 `X-API-Key` 或 `Authorization: Bearer sk-...`
API密钥无效或不可用	密钥错误、已作废或不存在	控制台核对密钥，必要时作废重建
模型名称不能为空	未传 `model`	补全请求体
模型对话不能为空	`messages` 为空或最后一条无文本	补全对话内容
模型不可用或不存在	名称错误或模型已下架	对照 `/v1/models` 与控制台
当前模型类型暂不支持对话接口…	非文本对话类模型	换文本模型或仅用控制台对应功能
关联套餐已无可用 Token	套餐 Token 用尽	新购套餐或换按量密钥
用户套餐不存在、已过期或当前模型不在套餐可用范围内	套餐与模型不匹配	换支持该模型的套餐或改用按量
账户余额不足，请充值	按量且余额 ≤ 0	充值
已超过本密钥当日/当月消费上限 X 元	触发密钥限额	调高限额或换密钥
请求失败，原因：…	其他业务错误	根据冒号后说明处理；仍失败请联系客服

更多见常见问题。

多轮对话与系统提示

OpenAI 方式下，把系统指令放在 messages 第一条、role 为 system：

curl https://mass.gogpu.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "X-API-Key: sk-你的密钥" \
  -d '{
    "model": "你的模型名称",
    "messages": [
      {"role": "system", "content": "你是简洁的中文技术助手。"},
      {"role": "user", "content": "解释什么是 Token 计费"}
    ],
    "temperature": 0.7,
    "max_tokens": 2048
  }'

Anthropic 方式请使用顶层 system 字段，详见请求参数说明。

流式调用注意

请求体设置 "stream": true 后，响应为 SSE（text/event-stream），以 data: [DONE] 结束。
计费与非流式相同，以最终统计的 Token 为准（输入、输出、缓存等分项见计费方式说明）。
客户端请使用支持流式读取的库，并关闭代理缓冲（部分网关需配置 X-Accel-Buffering: no）。
若流式过程中断，可能仍会产生部分用量记录，请在 调用统计 中核对。

超时与长任务

单次请求的处理时间受 模型响应速度 与 生成长度 影响。若客户端过早断开，可能收不到完整结果。

建议	说明
控制 `max_tokens`	避免一次生成过长
拆分任务	长文档可分段提问
客户端超时	建议不低于 60 秒；流式可适当加长
仍频繁失败	缩短输入、换模型，或联系客服并提供调用统计中的时间范围

Node.js 示例

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MASS_API_KEY,
  baseURL: "https://mass.gogpu.cn/v1",
});

const resp = await client.chat.completions.create({
  model: "你的模型名称",
  messages: [{ role: "user", content: "你好" }],
});
console.log(resp.choices[0].message.content);

环境变量示例：export MASS_API_KEY=sk-你的密钥

多密钥与多环境

做法	说明
按环境分密钥	如 `dev` / `prod` 各建一个，便于单独作废
按项目设消费上限	按量密钥可为测试环境设置较低日限额
套餐与按量分离	测试用套餐包、生产用按量，避免互相耗尽额度
密钥泄露	立即作废，全量更换业务配置中的密钥

WARNING

创建密钥时选择的 套餐 / 按量 方式之后 不能通过编辑改为另一种；需 新建密钥 并更新业务配置。

购买套餐与查账单

购买 Token 套餐、创建/作废密钥、查看用量和账单，请登录控制台open in new window 操作，无需记忆其他域名。