API 调用指南
本文说明如何填写 调用地址、API 密钥 和 模型名称,在您的环境(命令行、Python、Cursor 等)中成功调用捷智算模型 API。
::: info 请求参数详解 当前仅支持 文本对话 模型。各字段含义与 JSON 示例见 请求参数说明。 :::
调用地址一览
| 用途 | 方法 | 完整地址 | 是否需要密钥 |
|---|---|---|---|
| 查看可用模型 | GET | https://mass.gogpu.cn/v1/models | 是 |
| 对话(OpenAI 方式) | POST | https://mass.gogpu.cn/v1/chat/completions | 是 |
| 对话(Anthropic 方式) | POST | https://mass.gogpu.cn/anthropic/v1/messages | 是 |
在 AI 工具里填写的根地址
| 工具类型 | 根地址 |
|---|---|
| OpenAI 类(含多数国产客户端) | https://mass.gogpu.cn/v1 |
| Anthropic 类 | https://mass.gogpu.cn/anthropic |
接入前检查清单
| 检查项 | 说明 |
|---|---|
| 密钥 | 已在控制台 API KEY 创建,并保存完整 sk- 字符串 |
| 计费 | 套餐密钥已绑定可用套餐;按量用户 账户余额 > 0 |
| 模型名 | 与控制台 接口模型名称 或 /v1/models 的 id 完全一致 |
| 地址 | OpenAI 类用 /v1/chat/completions;Anthropic 类用 /anthropic/v1/messages |
| 协议 | HTTPS + Content-Type: application/json |
API 密钥
在 控制台 创建密钥(sk- 开头),在每次请求的请求头中携带:
| 填写方式 | 示例 |
|---|---|
| 推荐 | X-API-Key: sk-你的密钥 |
| 兼容 | Authorization: Bearer sk-你的密钥 |
TIP
开放 API 只认 API 密钥,不需要控制台登录态 Cookie;包括 GET /v1/models 在内的接口均须在请求头携带密钥。密钥与您的账号绑定,请妥善保管。
每次调用前,平台会依次检查(摘要)
| 检查项 | 套餐密钥 | 按量密钥 |
|---|---|---|
| 密钥未作废 | 是 | 是 |
| 套餐未过期、有剩余 Token、模型在套餐适用范围内 | 是 | — |
| 账户余额 大于 0 | — | 是 |
| 未超过该密钥设置的 日/月消费上限(元) | 可选 | 可选 |
上限为 0 表示不限制;统计范围为 自然日 / 自然月 内该密钥已产生的按量费用(元)。
查看可用模型
在终端执行:
curl -sS https://mass.gogpu.cn/v1/models \
-H "X-API-Key: sk-你的密钥"
记下要用的模型 id,须与控制台 接口模型名称 一致,后续请求里的 model 字段照抄即可。
返回示例(结构示意):
{
"object": "list",
"data": [
{"id": "deepseek-v4-pro", "object": "model", "owned_by": "system"}
]
}
仅 已上架 的模型会出现在列表中;下架或维护中的模型无法调用。
对话示例(OpenAI 方式)
普通对话
curl https://mass.gogpu.cn/v1/chat/completions \
-H "Content-Type: application/json" \
-H "X-API-Key: sk-你的密钥" \
-d '{
"model": "你的模型名称",
"messages": [
{"role": "user", "content": "你好"}
]
}'
逐字输出(流式)
在请求里加上 "stream": true,回复会一段段返回;计费与普通对话相同,按实际 Token 计算。
curl -N https://mass.gogpu.cn/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-你的密钥" \
-d '{
"model": "你的模型名称",
"messages": [{"role": "user", "content": "讲个笑话"}],
"stream": true
}'
temperature、max_tokens、stream 等字段说明见 请求参数说明。
对话示例(Anthropic 方式)
仅适用于控制台标明支持该方式的模型:
curl https://mass.gogpu.cn/anthropic/v1/messages \
-H "Content-Type: application/json" \
-H "X-API-Key: sk-你的密钥" \
-H "anthropic-version: 2023-06-01" \
-d '{
"model": "你的模型名称",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Hello"}
]
}'
TIP
每个模型只使用其对应的一种调用方式,请勿混用两种地址。
Python 示例
from openai import OpenAI
client = OpenAI(
api_key="sk-你的密钥",
base_url="https://mass.gogpu.cn/v1",
)
resp = client.chat.completions.create(
model="你的模型名称",
messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)
常见 AI 工具如何填写
| 工具 | 接口地址 | 密钥 |
|---|---|---|
| Cursor / Continue 等 | https://mass.gogpu.cn/v1 | 控制台创建的 sk- 密钥 |
| Dify、FastGPT 等 | 选 OpenAI 兼容,地址填 https://mass.gogpu.cn/v1 | 同上 |
具体菜单名称因工具而异,一般在「API 设置」「模型提供商」中修改。
成功与失败时响应长什么样
调用成功时,响应体一般为标准 OpenAI 或 Anthropic 格式(含 choices / content 与 usage 等字段),便于直接用官方 SDK 解析。
校验失败或业务拒绝时,HTTP 状态码仍可能为 200,但 JSON 中会包含业务错误信息,形如:
{
"code": 7,
"data": {},
"msg": "账户余额不足,请充值"
}
请读取 msg 字段排查;使用 OpenAI SDK 时,请关注异常信息中的服务端返回内容。
常见报错对照
| 返回信息(msg,节选) | 含义 | 处理建议 |
|---|---|---|
| 请在请求头携带 API 密钥 | 未传密钥 | 添加 X-API-Key 或 Authorization: Bearer sk-... |
| API密钥无效或不可用 | 密钥错误、已作废或不存在 | 控制台核对密钥,必要时作废重建 |
| 模型名称不能为空 | 未传 model | 补全请求体 |
| 模型对话不能为空 | messages 为空或最后一条无文本 | 补全对话内容 |
| 模型不可用或不存在 | 名称错误或模型已下架 | 对照 /v1/models 与控制台 |
| 当前模型类型暂不支持对话接口… | 非文本对话类模型 | 换文本模型或仅用控制台对应功能 |
| 关联套餐已无可用 Token | 套餐 Token 用尽 | 新购套餐或换按量密钥 |
| 用户套餐不存在、已过期或当前模型不在套餐可用范围内 | 套餐与模型不匹配 | 换支持该模型的套餐或改用按量 |
| 账户余额不足,请充值 | 按量且余额 ≤ 0 | 充值 |
| 已超过本密钥当日/当月消费上限 X 元 | 触发密钥限额 | 调高限额或换密钥 |
| 请求失败,原因:… | 其他业务错误 | 根据冒号后说明处理;仍失败请联系客服 |
更多见 常见问题。
多轮对话与系统提示
OpenAI 方式下,把系统指令放在 messages 第一条、role 为 system:
curl https://mass.gogpu.cn/v1/chat/completions \
-H "Content-Type: application/json" \
-H "X-API-Key: sk-你的密钥" \
-d '{
"model": "你的模型名称",
"messages": [
{"role": "system", "content": "你是简洁的中文技术助手。"},
{"role": "user", "content": "解释什么是 Token 计费"}
],
"temperature": 0.7,
"max_tokens": 2048
}'
Anthropic 方式请使用顶层 system 字段,详见 请求参数说明。
流式调用注意
- 请求体设置
"stream": true后,响应为 SSE(text/event-stream),以data: [DONE]结束。 - 计费与非流式相同,以最终统计的 Token 为准(输入、输出、缓存等分项见 计费方式说明)。
- 客户端请使用支持流式读取的库,并关闭代理缓冲(部分网关需配置
X-Accel-Buffering: no)。 - 若流式过程中断,可能仍会产生部分用量记录,请在 调用统计 中核对。
超时与长任务
单次请求的处理时间受 模型响应速度 与 生成长度 影响。若客户端过早断开,可能收不到完整结果。
| 建议 | 说明 |
|---|---|
控制 max_tokens | 避免一次生成过长 |
| 拆分任务 | 长文档可分段提问 |
| 客户端超时 | 建议不低于 60 秒;流式可适当加长 |
| 仍频繁失败 | 缩短输入、换模型,或联系客服并提供 调用统计 中的时间范围 |
Node.js 示例
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.MASS_API_KEY,
baseURL: "https://mass.gogpu.cn/v1",
});
const resp = await client.chat.completions.create({
model: "你的模型名称",
messages: [{ role: "user", content: "你好" }],
});
console.log(resp.choices[0].message.content);
环境变量示例:export MASS_API_KEY=sk-你的密钥
多密钥与多环境
| 做法 | 说明 |
|---|---|
| 按环境分密钥 | 如 dev / prod 各建一个,便于单独作废 |
| 按项目设消费上限 | 按量密钥可为测试环境设置较低日限额 |
| 套餐与按量分离 | 测试用套餐包、生产用按量,避免互相耗尽额度 |
| 密钥泄露 | 立即 作废,全量更换业务配置中的密钥 |
WARNING
创建密钥时选择的 套餐 / 按量 方式之后 不能通过编辑改为另一种;需 新建密钥 并更新业务配置。
购买套餐与查账单
购买 Token 套餐、创建/作废密钥、查看用量和账单,请登录 控制台 操作,无需记忆其他域名。
