API 调用指南

本文说明如何填写 调用地址API 密钥模型名称,在您的环境(命令行、Python、Cursor 等)中成功调用捷智算模型 API。

::: info 请求参数详解 当前仅支持 文本对话 模型。各字段含义与 JSON 示例见 请求参数说明。 :::


调用地址一览

用途方法完整地址是否需要密钥
查看可用模型GEThttps://mass.gogpu.cn/v1/models
对话(OpenAI 方式)POSThttps://mass.gogpu.cn/v1/chat/completions
对话(Anthropic 方式)POSThttps://mass.gogpu.cn/anthropic/v1/messages

在 AI 工具里填写的根地址

工具类型根地址
OpenAI 类(含多数国产客户端)https://mass.gogpu.cn/v1
Anthropic 类https://mass.gogpu.cn/anthropic

接入前检查清单

检查项说明
密钥已在控制台 API KEY 创建,并保存完整 sk- 字符串
计费套餐密钥已绑定可用套餐;按量用户 账户余额 > 0
模型名与控制台 接口模型名称/v1/modelsid 完全一致
地址OpenAI 类用 /v1/chat/completions;Anthropic 类用 /anthropic/v1/messages
协议HTTPS + Content-Type: application/json

API 密钥

控制台open in new window 创建密钥(sk- 开头),在每次请求的请求头中携带:

填写方式示例
推荐X-API-Key: sk-你的密钥
兼容Authorization: Bearer sk-你的密钥

TIP

开放 API 只认 API 密钥,不需要控制台登录态 Cookie;包括 GET /v1/models 在内的接口均须在请求头携带密钥。密钥与您的账号绑定,请妥善保管。

每次调用前,平台会依次检查(摘要)

检查项套餐密钥按量密钥
密钥未作废
套餐未过期、有剩余 Token、模型在套餐适用范围内
账户余额 大于 0
未超过该密钥设置的 日/月消费上限(元)可选可选

上限为 0 表示不限制;统计范围为 自然日 / 自然月 内该密钥已产生的按量费用(元)。


查看可用模型

在终端执行:

curl -sS https://mass.gogpu.cn/v1/models \
  -H "X-API-Key: sk-你的密钥"

记下要用的模型 id,须与控制台 接口模型名称 一致,后续请求里的 model 字段照抄即可。

返回示例(结构示意):

{
  "object": "list",
  "data": [
    {"id": "deepseek-v4-pro", "object": "model", "owned_by": "system"}
  ]
}

已上架 的模型会出现在列表中;下架或维护中的模型无法调用。


对话示例(OpenAI 方式)

普通对话

curl https://mass.gogpu.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "X-API-Key: sk-你的密钥" \
  -d '{
    "model": "你的模型名称",
    "messages": [
      {"role": "user", "content": "你好"}
    ]
  }'

逐字输出(流式)

在请求里加上 "stream": true,回复会一段段返回;计费与普通对话相同,按实际 Token 计算。

curl -N https://mass.gogpu.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-你的密钥" \
  -d '{
    "model": "你的模型名称",
    "messages": [{"role": "user", "content": "讲个笑话"}],
    "stream": true
  }'

temperaturemax_tokensstream 等字段说明见 请求参数说明


对话示例(Anthropic 方式)

仅适用于控制台标明支持该方式的模型:

curl https://mass.gogpu.cn/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "X-API-Key: sk-你的密钥" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "你的模型名称",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Hello"}
    ]
  }'

TIP

每个模型只使用其对应的一种调用方式,请勿混用两种地址。


Python 示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-你的密钥",
    base_url="https://mass.gogpu.cn/v1",
)

resp = client.chat.completions.create(
    model="你的模型名称",
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)

常见 AI 工具如何填写

工具接口地址密钥
Cursor / Continue 等https://mass.gogpu.cn/v1控制台创建的 sk- 密钥
Dify、FastGPT 等选 OpenAI 兼容,地址填 https://mass.gogpu.cn/v1同上

具体菜单名称因工具而异,一般在「API 设置」「模型提供商」中修改。


成功与失败时响应长什么样

调用成功时,响应体一般为标准 OpenAIAnthropic 格式(含 choices / contentusage 等字段),便于直接用官方 SDK 解析。

校验失败或业务拒绝时,HTTP 状态码仍可能为 200,但 JSON 中会包含业务错误信息,形如:

{
  "code": 7,
  "data": {},
  "msg": "账户余额不足,请充值"
}

请读取 msg 字段排查;使用 OpenAI SDK 时,请关注异常信息中的服务端返回内容。


常见报错对照

返回信息(msg,节选)含义处理建议
请在请求头携带 API 密钥未传密钥添加 X-API-KeyAuthorization: Bearer sk-...
API密钥无效或不可用密钥错误、已作废或不存在控制台核对密钥,必要时作废重建
模型名称不能为空未传 model补全请求体
模型对话不能为空messages 为空或最后一条无文本补全对话内容
模型不可用或不存在名称错误或模型已下架对照 /v1/models 与控制台
当前模型类型暂不支持对话接口…非文本对话类模型换文本模型或仅用控制台对应功能
关联套餐已无可用 Token套餐 Token 用尽新购套餐或换按量密钥
用户套餐不存在、已过期或当前模型不在套餐可用范围内套餐与模型不匹配换支持该模型的套餐或改用按量
账户余额不足,请充值按量且余额 ≤ 0充值
已超过本密钥当日/当月消费上限 X 元触发密钥限额调高限额或换密钥
请求失败,原因:…其他业务错误根据冒号后说明处理;仍失败请联系客服

更多见 常见问题


多轮对话与系统提示

OpenAI 方式下,把系统指令放在 messages 第一条、rolesystem

curl https://mass.gogpu.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "X-API-Key: sk-你的密钥" \
  -d '{
    "model": "你的模型名称",
    "messages": [
      {"role": "system", "content": "你是简洁的中文技术助手。"},
      {"role": "user", "content": "解释什么是 Token 计费"}
    ],
    "temperature": 0.7,
    "max_tokens": 2048
  }'

Anthropic 方式请使用顶层 system 字段,详见 请求参数说明


流式调用注意

  • 请求体设置 "stream": true 后,响应为 SSEtext/event-stream),以 data: [DONE] 结束。
  • 计费与非流式相同,以最终统计的 Token 为准(输入、输出、缓存等分项见 计费方式说明)。
  • 客户端请使用支持流式读取的库,并关闭代理缓冲(部分网关需配置 X-Accel-Buffering: no)。
  • 若流式过程中断,可能仍会产生部分用量记录,请在 调用统计 中核对。

超时与长任务

单次请求的处理时间受 模型响应速度生成长度 影响。若客户端过早断开,可能收不到完整结果。

建议说明
控制 max_tokens避免一次生成过长
拆分任务长文档可分段提问
客户端超时建议不低于 60 秒;流式可适当加长
仍频繁失败缩短输入、换模型,或联系客服并提供 调用统计 中的时间范围

Node.js 示例

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MASS_API_KEY,
  baseURL: "https://mass.gogpu.cn/v1",
});

const resp = await client.chat.completions.create({
  model: "你的模型名称",
  messages: [{ role: "user", content: "你好" }],
});
console.log(resp.choices[0].message.content);

环境变量示例:export MASS_API_KEY=sk-你的密钥


多密钥与多环境

做法说明
按环境分密钥dev / prod 各建一个,便于单独作废
按项目设消费上限按量密钥可为测试环境设置较低日限额
套餐与按量分离测试用套餐包、生产用按量,避免互相耗尽额度
密钥泄露立即 作废,全量更换业务配置中的密钥

WARNING

创建密钥时选择的 套餐 / 按量 方式之后 不能通过编辑改为另一种;需 新建密钥 并更新业务配置。


购买套餐与查账单

购买 Token 套餐、创建/作废密钥、查看用量和账单,请登录 控制台open in new window 操作,无需记忆其他域名。


相关文档

复制 MD