AI 应用概念入门

本文说明使用捷智算 模型 API 服务 时常见的相关概念：知识库、RAG、Agent、Skill、MCP 等，以及它们与「直接调用大模型接口」的关系。

与 Token、计费相关的说明见模型与 Token 入门；接入步骤见快速开始。

能力与层级关系

从下到上，可以粗分为四层：

┌─────────────────────────────────────────────────────────┐
│  应用形态：智能客服、企业问答、Cursor、Dify 工作流…      │
├─────────────────────────────────────────────────────────┤
│  智能体 Agent：理解目标 → 拆任务 → 决定查什么、调什么    │
├─────────────────────────────────────────────────────────┤
│  能力组件：RAG / 知识库检索、Skill、Function Calling…    │
├─────────────────────────────────────────────────────────┤
│  连接层：MCP（统一接工具/数据的标准方式）                │
├─────────────────────────────────────────────────────────┤
│  大模型 API：读文字、写文字（如捷智算 mass.gogpu.cn）    │
└─────────────────────────────────────────────────────────┘

捷智算模型 API 主要提供最底层：大模型对话能力（按 Token 或套餐计费）。
知识库、RAG、Agent、MCP 等能力，通常由 Dify、OpenClaw、自研系统 等业务应用实现；生成回答时，可调用捷智算 模型 API（https://mass.gogpu.cn）作为大模型服务。

大模型（LLM）与模型 API

说法	含义
大模型 / LLM	经过海量文本训练的语言模型，能根据您给的文字续写、回答、总结
模型 API	通过 HTTP 请求调用大模型并获取输出；按 Token 套餐或按量计费

捷智算 模型 API（https://mass.gogpu.cn）提供多模型对话能力；知识库、智能客服系统等完整应用需另行搭建或选用 Dify、OpenClaw 等产品。

知识库

是什么

知识库 = 您希望 AI 参考的专属资料集合，例如：

产品手册、内部 Wiki、制度文件
客服话术、FAQ、工单历史
技术文档、API 说明、标书模板

这些资料不在大模型出厂训练数据里，或需要 经常更新，所以不能只靠模型「凭记忆回答」。

和「直接问 ChatGPT」的区别

直接问通用大模型	接知识库
只能依赖训练时学过的公开知识	可基于您自己的文档回答
容易过时、不知道公司内部规定	资料更新后，检索侧更新即可（配合 RAG）
可能编造看似合理的内容	若设计得当，可标注引用来源

知识库本身是 存文档、做检索 的系统；要让大模型用检索结果来回答，通常还要配合下面的 RAG。

RAG（检索增强生成）

一句话

RAG（Retrieval-Augmented Generation，检索增强生成）指：在生成回答前，先从您的文档库中 检索相关内容，再连同用户问题一并提交给大模型，由模型 依据检索结果 生成回答，而不是仅依赖模型训练时的固定知识。

处理流程

阶段	说明
1. 建库	将 PDF、Word、网页等文档切分并建立可检索索引
2. 提问	用户提交问题
3. 检索	在知识库中匹配语义最相关的文档片段
4. 生成	将问题与检索片段一并提交大模型并生成回答

简化数据流：

您的文档 → 切片 → 建立索引（知识库）
                         ↑
用户问题 → 检索最相关片段 ─┘
         → 连同片段发给大模型 → 回答（最好带引用出处）

能解决什么问题

问题	RAG 的作用
模型不知道公司内部制度	检索内部文档再答
训练数据有「截止日期」	新文档入库即可用
「胡说八道」（幻觉）	有资料约束，并可核对来源
微调成本高	多数企业问答先上 RAG，再考虑微调

和「微调」怎么选（简表）

	RAG	微调（Fine-tuning）
本质	让模型查外部资料	让模型把知识写进权重
更新知识	更新文档 / 索引，较快	往往要重新训练，成本高
适合	企业知识问答、文档助手、客服	固定语气、格式、行业术语风格
建议	多数场景先试 RAG	RAG 不够再评估微调

和捷智算的关系

RAG 的「生成」一步 需要调用大模型 → 可使用捷智算 模型 API。
切片、向量库、检索、编排 一般在 Dify、FastGPT 或自研系统中完成，需自行部署与维护。
检索质量直接影响回答质量：若检索到的片段与问题无关，模型输出也可能错误。

语义检索相关术语（选读）

搭建知识库或 RAG 时，方案说明里常出现 Embedding、向量、向量数据库 等词。下面用直观说法帮助对照理解（不涉及公式与实现细节）：

词	说明
Embedding	把一段文字变成一串数字，让意思相近的文字在数学上「离得近」
向量检索	用问题的向量去库里找最相似的文档片段（不限于相同关键词）
向量数据库	专门存这些数字、做快速相似搜索的库

举例：用户问「怎么退费」，库里可能有「退款流程」——字面不同，语义相近，向量检索更容易找对。

Agent（智能体）

是什么

Agent（智能体） 指一类 会自己拆任务、选步骤、再调用工具或模型 的应用，而不只是「问一句答一句」。

典型过程：

理解您的目标（如「整理上周销售邮件并写摘要」）
规划分几步做（先读邮件 → 再分类 → 再写摘要）
执行调用搜索、数据库、发邮件、调大模型 等
根据结果调整 下一步（部分产品支持多轮反思）

和 RAG、知识库的关系

需要查阅文档时，Agent 可调用基于知识库的 RAG 能力。
也可不依赖知识库，仅调用工具、API 或大模型完成其他任务。

Skill（技能）

行业里的常见含义

Skill 通常指 一项边界清楚、可复用的能力，完成 一类固定或半固定任务，例如：

「按公司模板写周报」
「根据 SKU 查库存并回复话术」
「按规范审查合同条款」

特点：

特点	说明
范围明确	擅长一件事，不是什么都做
可被 Agent 调用	作为完成子任务的能力模块
可编排	多个 Skill 组合成复杂流程

与 Agent、MCP 的区别

概念	说明
大模型	负责理解与生成自然语言
Skill	规定某类任务的步骤与输出要求
MCP	以标准协议连接外部工具与数据源
Agent	拆解任务并调度 Skill、工具与大模型

常见分工如下（各产品实现可能不同）：

MCP 解决「能连上什么」（数据库、Git、浏览器、内部 API）
Skill 解决「连上之后怎么做事」（步骤、注意事项、输出格式）
Agent 决定「当前该不该用哪个 Skill / 工具」

和 Cursor 等工具里的「Skill」

部分开发工具（如 Cursor）里的 Skill，是为 AI 助手准备的 结构化说明（何时用、怎么做、参考哪些规范），帮助助手在特定场景下更稳定地执行任务。思想与上文的「可复用能力单元」相近，但 绑定在具体产品里，不必与别的平台的 Skill 混为一谈。

MCP（Model Context Protocol）

是什么

MCP（Model Context Protocol，模型上下文协议）是 Anthropic 等推动的 开放标准，用来让 AI 应用（Host） 以 统一方式 连接 外部工具和数据（Server）。

MCP 用于统一 AI 应用与外部工具、数据源之间的连接方式：工具提供方实现 MCP Server，支持 MCP 的客户端（如 Cursor、Claude Desktop）即可按同一协议调用。

三类能力

类型	作用	举例
Tools（工具）	AI 主动调用，会产生操作	创建工单、执行 SQL、发 HTTP 请求
Resources（资源）	AI 读取的数据	文件内容、配置、只读查询结果
Prompts（提示模板）	预置好的工作流提示	「按此模板做 Code Review」

调用过程说明

您在 Cursor / Claude 里提问
    → AI 判断是否需要外部能力
    → MCP 客户端连接对应 MCP Server（可能需您确认）
    → Server 执行（读文件、调 API 等）把结果返回
    → AI 结合结果继续生成回答

MCP 和 RAG、Function Calling 的关系

概念	关系
Function Calling	大模型「可以决定调用哪个函数」的能力；很多产品内置
MCP	把「连哪些工具、怎么传参」标准化的协议层，常建立在类似能力之上
RAG	检索文档再生成的一种架构；可以把检索服务封装成 MCP Server，供 Cursor 等调用

三者 不是互斥：例如 Agent 通过 MCP 调用「知识库检索工具」，检索逻辑本身是 RAG。

和捷智算模型 API 的关系

捷智算 模型 API 提供的是 对话补全（OpenAI / Anthropic 兼容地址），不是 MCP Server。
您在 Cursor 里配置 MCP，同时把 模型地址 指向 https://mass.gogpu.cn，是 两条线：
- MCP：接工具与数据
- 模型 API：接大模型推理与计费

OpenClaw 与 Hermes Agent

二者都是 智能体（Agent）方向 的开源方案，但分工不同；捷智算当前 直接提供 OpenClaw 云主机镜像，Hermes 一般在 GPU 云主机上 按官方文档自装。

OpenClaw：个人助手网关

OpenClawopen in new window 是运行在云主机上的 AI 助手网关，主要能力包括：

能力	说明
Gateway	统一管会话、工具、Skill、部分 MCP
多渠道	可对接飞书、钉钉等（以版本与配置为准）
模型接入	可配置在线模型 API 或本机 Ollama

捷智算：购买云主机 → 镜像选 ubuntu22-openclaw → 开机按实例内指引使用，详见 OpenClaw 部署指南。
若要用控制台 模型广场 里的多模型并统一账单，在 OpenClaw 里配置 https://mass.gogpu.cn/v1 + sk- 密钥，见 智能体与 OpenClaw。

Hermes Agent：偏执行与沉淀的运行时

Hermes Agent（如 Nous Research 社区项目open in new window）侧重 任务执行、技能沉淀、长期记忆 等，和 OpenClaw 的「多渠道 inbox」侧重点不同。复杂场景里也有人 OpenClaw 管接入与编排，Hermes 管深度任务。

名称说明

Hermes Agent：智能体软件框架
Hermes 模型系列：模型权重名称，与框架不是同一概念
React Native Hermes 引擎：与本文无关

大模型仍可接 捷智算模型 API 或本机推理；镜像与对接步骤见 智能体与 OpenClaw。

低代码平台：Dify、FastGPT 等

平台类型	通常已包含	您仍需
Dify、FastGPT、MaxKB 等	知识库、RAG 流程、部分 Agent 编排	配置模型 API 地址 + 密钥（可填捷智算）
Cursor、Claude Desktop	编辑器 / 对话 + MCP	配置模型提供商与 MCP Server
OpenClaw（`ubuntu22-openclaw` 镜像）	预装助手网关、体验额度	Ollama 和/或捷智算模型 API
Hermes Agent	自部署运行时	大模型可接本地或捷智算模型 API
完全自研	全部自建	自研检索与业务逻辑 + 调用捷智算 API

产品边界：捷智算提供 GPU 云主机（含 OpenClaw 镜像）与模型 API 计费；知识库、RAG 与智能体编排通常在 Dify、OpenClaw 等应用层完成。

一张表速查

术语	说明
大模型 API	通过 HTTP 调用大模型对话能力；捷智算地址为 `https://mass.gogpu.cn`
知识库	存放企业文档等专属资料，供检索或 RAG 使用
RAG	检索文档后再生成回答
Agent	可自动拆解任务、多步调用工具或模型
Skill	针对某类任务的可复用能力配置
MCP	连接外部工具与数据的标准协议
微调	通过训练将能力写入模型（与 RAG 为不同方案）
OpenClaw	助手网关；捷智算提供 ubuntu22-openclaw 镜像
Hermes Agent	智能体运行时；需在云主机自行部署

延伸阅读（外部资料）

以下为第三方资料，仅供参考；具体功能以对应产品官方文档为准。

主题	参考
RAG 入门	SkillNav：什么是 RAGopen in new window、Datawhale：RAG 简介open in new window
MCP 官方说明	MCP 中文文档 · 简介open in new window
Agent 与 Skill	Datawhale：Agent Skills 解读open in new window

下一步

目标	文档
Token、计费、上下文	模型与 Token 入门
第一次调 API	快速开始
OpenClaw 镜像 + 模型 API	智能体与 OpenClaw · OpenClaw 部署指南
API 字段与示例	请求参数说明