AI 应用概念入门
本文说明使用捷智算 模型 API 服务 时常见的相关概念:知识库、RAG、Agent、Skill、MCP 等,以及它们与「直接调用大模型接口」的关系。
与 Token、计费相关的说明见 模型与 Token 入门;接入步骤见 快速开始。
能力与层级关系
从下到上,可以粗分为四层:
┌─────────────────────────────────────────────────────────┐
│ 应用形态:智能客服、企业问答、Cursor、Dify 工作流… │
├─────────────────────────────────────────────────────────┤
│ 智能体 Agent:理解目标 → 拆任务 → 决定查什么、调什么 │
├─────────────────────────────────────────────────────────┤
│ 能力组件:RAG / 知识库检索、Skill、Function Calling… │
├─────────────────────────────────────────────────────────┤
│ 连接层:MCP(统一接工具/数据的标准方式) │
├─────────────────────────────────────────────────────────┤
│ 大模型 API:读文字、写文字(如捷智算 mass.gogpu.cn) │
└─────────────────────────────────────────────────────────┘
捷智算模型 API 主要提供最底层:大模型对话能力(按 Token 或套餐计费)。
知识库、RAG、Agent、MCP 等能力,通常由 Dify、OpenClaw、自研系统 等业务应用实现;生成回答时,可调用捷智算 模型 API(https://mass.gogpu.cn)作为大模型服务。
大模型(LLM)与模型 API
| 说法 | 含义 |
|---|---|
| 大模型 / LLM | 经过海量文本训练的语言模型,能根据您给的文字 续写、回答、总结 |
| 模型 API | 通过 HTTP 请求调用大模型并获取输出;按 Token 套餐或按量计费 |
捷智算 模型 API(https://mass.gogpu.cn)提供多模型对话能力;知识库、智能客服系统等完整应用需另行搭建或选用 Dify、OpenClaw 等产品。
知识库
是什么
知识库 = 您希望 AI 参考的专属资料集合,例如:
- 产品手册、内部 Wiki、制度文件
- 客服话术、FAQ、工单历史
- 技术文档、API 说明、标书模板
这些资料 不在 大模型出厂训练数据里,或需要 经常更新,所以不能只靠模型「凭记忆回答」。
和「直接问 ChatGPT」的区别
| 直接问通用大模型 | 接知识库 |
|---|---|
| 只能依赖训练时学过的公开知识 | 可基于 您自己的文档 回答 |
| 容易过时、不知道公司内部规定 | 资料更新后,检索侧更新即可(配合 RAG) |
| 可能编造看似合理的内容 | 若设计得当,可 标注引用来源 |
知识库本身是 存文档、做检索 的系统;要让大模型 用 检索结果来回答,通常还要配合下面的 RAG。
RAG(检索增强生成)
一句话
RAG(Retrieval-Augmented Generation,检索增强生成)指:在生成回答前,先从您的文档库中 检索相关内容,再连同用户问题一并提交给大模型,由模型 依据检索结果 生成回答,而不是仅依赖模型训练时的固定知识。
处理流程
| 阶段 | 说明 |
|---|---|
| 1. 建库 | 将 PDF、Word、网页等文档 切分 并建立可检索索引 |
| 2. 提问 | 用户提交问题 |
| 3. 检索 | 在知识库中匹配 语义最相关 的文档片段 |
| 4. 生成 | 将 问题与检索片段 一并提交大模型并生成回答 |
简化数据流:
您的文档 → 切片 → 建立索引(知识库)
↑
用户问题 → 检索最相关片段 ─┘
→ 连同片段发给大模型 → 回答(最好带引用出处)
能解决什么问题
| 问题 | RAG 的作用 |
|---|---|
| 模型不知道公司内部制度 | 检索内部文档再答 |
| 训练数据有「截止日期」 | 新文档入库即可用 |
| 「胡说八道」(幻觉) | 有资料约束,并可核对来源 |
| 微调成本高 | 多数企业问答 先上 RAG,再考虑微调 |
和「微调」怎么选(简表)
| RAG | 微调(Fine-tuning) | |
|---|---|---|
| 本质 | 让模型 查外部资料 | 让模型 把知识写进权重 |
| 更新知识 | 更新文档 / 索引,较快 | 往往要重新训练,成本高 |
| 适合 | 企业知识问答、文档助手、客服 | 固定语气、格式、行业术语风格 |
| 建议 | 多数场景先试 RAG | RAG 不够再评估微调 |
和捷智算的关系
- RAG 的「生成」一步 需要调用大模型 → 可使用捷智算 模型 API。
- 切片、向量库、检索、编排 一般在 Dify、FastGPT 或自研系统中完成,需自行部署与维护。
- 检索质量直接影响回答质量:若检索到的片段与问题无关,模型输出也可能错误。
语义检索相关术语(选读)
搭建知识库或 RAG 时,方案说明里常出现 Embedding、向量、向量数据库 等词。下面用直观说法帮助对照理解(不涉及公式与实现细节):
| 词 | 说明 |
|---|---|
| Embedding | 把一段文字变成一串数字,让 意思相近 的文字在数学上「离得近」 |
| 向量检索 | 用问题的向量去库里找 最相似 的文档片段(不限于相同关键词) |
| 向量数据库 | 专门存这些数字、做快速相似搜索的库 |
举例:用户问「怎么退费」,库里可能有「退款流程」——字面不同,语义相近,向量检索更容易找对。
Agent(智能体)
是什么
Agent(智能体) 指一类 会自己拆任务、选步骤、再调用工具或模型 的应用,而不只是「问一句答一句」。
典型过程:
- 理解 您的目标(如「整理上周销售邮件并写摘要」)
- 规划 分几步做(先读邮件 → 再分类 → 再写摘要)
- 执行 调用搜索、数据库、发邮件、调大模型 等
- 根据结果调整 下一步(部分产品支持多轮反思)
和 RAG、知识库的关系
- 需要查阅文档时,Agent 可调用基于知识库的 RAG 能力。
- 也可不依赖知识库,仅调用工具、API 或大模型完成其他任务。
Skill(技能)
行业里的常见含义
Skill 通常指 一项边界清楚、可复用的能力,完成 一类固定或半固定任务,例如:
- 「按公司模板写周报」
- 「根据 SKU 查库存并回复话术」
- 「按规范审查合同条款」
特点:
| 特点 | 说明 |
|---|---|
| 范围明确 | 擅长一件事,不是什么都做 |
| 可被 Agent 调用 | 作为完成子任务的能力模块 |
| 可编排 | 多个 Skill 组合成复杂流程 |
与 Agent、MCP 的区别
| 概念 | 说明 |
|---|---|
| 大模型 | 负责理解与生成自然语言 |
| Skill | 规定某类任务的步骤与输出要求 |
| MCP | 以标准协议连接外部工具与数据源 |
| Agent | 拆解任务并调度 Skill、工具与大模型 |
常见分工如下(各产品实现可能不同):
- MCP 解决「能连上什么」(数据库、Git、浏览器、内部 API)
- Skill 解决「连上之后怎么做事」(步骤、注意事项、输出格式)
- Agent 决定「当前该不该用哪个 Skill / 工具」
和 Cursor 等工具里的「Skill」
部分开发工具(如 Cursor)里的 Skill,是为 AI 助手准备的 结构化说明(何时用、怎么做、参考哪些规范),帮助助手在特定场景下更稳定地执行任务。思想与上文的「可复用能力单元」相近,但 绑定在具体产品里,不必与别的平台的 Skill 混为一谈。
MCP(Model Context Protocol)
是什么
MCP(Model Context Protocol,模型上下文协议)是 Anthropic 等推动的 开放标准,用来让 AI 应用(Host) 以 统一方式 连接 外部工具和数据(Server)。
MCP 用于统一 AI 应用与外部工具、数据源之间的连接方式:工具提供方实现 MCP Server,支持 MCP 的客户端(如 Cursor、Claude Desktop)即可按同一协议调用。
三类能力
| 类型 | 作用 | 举例 |
|---|---|---|
| Tools(工具) | AI 主动调用,会产生操作 | 创建工单、执行 SQL、发 HTTP 请求 |
| Resources(资源) | AI 读取 的数据 | 文件内容、配置、只读查询结果 |
| Prompts(提示模板) | 预置好的 工作流提示 | 「按此模板做 Code Review」 |
调用过程说明
您在 Cursor / Claude 里提问
→ AI 判断是否需要外部能力
→ MCP 客户端连接对应 MCP Server(可能需您确认)
→ Server 执行(读文件、调 API 等)把结果返回
→ AI 结合结果继续生成回答
MCP 和 RAG、Function Calling 的关系
| 概念 | 关系 |
|---|---|
| Function Calling | 大模型「可以决定调用哪个函数」的能力;很多产品内置 |
| MCP | 把「连哪些工具、怎么传参」 标准化 的协议层,常建立在类似能力之上 |
| RAG | 检索文档再生成 的一种架构;可以把检索服务 封装成 MCP Server,供 Cursor 等调用 |
三者 不是互斥:例如 Agent 通过 MCP 调用「知识库检索工具」,检索逻辑本身是 RAG。
和捷智算模型 API 的关系
- 捷智算 模型 API 提供的是 对话补全(OpenAI / Anthropic 兼容地址),不是 MCP Server。
- 您在 Cursor 里配置 MCP,同时把 模型地址 指向
https://mass.gogpu.cn,是 两条线:- MCP:接工具与数据
- 模型 API:接大模型推理与计费
OpenClaw 与 Hermes Agent
二者都是 智能体(Agent)方向 的开源方案,但分工不同;捷智算当前 直接提供 OpenClaw 云主机镜像,Hermes 一般在 GPU 云主机上 按官方文档自装。
OpenClaw:个人助手网关
OpenClaw 是运行在云主机上的 AI 助手网关,主要能力包括:
| 能力 | 说明 |
|---|---|
| Gateway | 统一管会话、工具、Skill、部分 MCP |
| 多渠道 | 可对接飞书、钉钉等(以版本与配置为准) |
| 模型接入 | 可配置在线模型 API 或本机 Ollama |
捷智算:购买云主机 → 镜像选 ubuntu22-openclaw → 开机按实例内指引使用,详见 OpenClaw 部署指南。
若要用控制台 模型广场 里的多模型并统一账单,在 OpenClaw 里配置 https://mass.gogpu.cn/v1 + sk- 密钥,见 智能体与 OpenClaw。
Hermes Agent:偏执行与沉淀的运行时
Hermes Agent(如 Nous Research 社区项目)侧重 任务执行、技能沉淀、长期记忆 等,和 OpenClaw 的「多渠道 inbox」侧重点不同。复杂场景里也有人 OpenClaw 管接入与编排,Hermes 管深度任务。
名称说明
- Hermes Agent:智能体软件框架
- Hermes 模型系列:模型权重名称,与框架不是同一概念
- React Native Hermes 引擎:与本文无关
大模型仍可接 捷智算模型 API 或本机推理;镜像与对接步骤见 智能体与 OpenClaw。
低代码平台:Dify、FastGPT 等
| 平台类型 | 通常已包含 | 您仍需 |
|---|---|---|
| Dify、FastGPT、MaxKB 等 | 知识库、RAG 流程、部分 Agent 编排 | 配置 模型 API 地址 + 密钥(可填捷智算) |
| Cursor、Claude Desktop | 编辑器 / 对话 + MCP | 配置模型提供商与 MCP Server |
OpenClaw(ubuntu22-openclaw 镜像) | 预装助手网关、体验额度 | Ollama 和/或 捷智算模型 API |
| Hermes Agent | 自部署运行时 | 大模型可接本地或 捷智算模型 API |
| 完全自研 | 全部自建 | 自研检索与业务逻辑 + 调用捷智算 API |
产品边界:捷智算提供 GPU 云主机(含 OpenClaw 镜像)与模型 API 计费;知识库、RAG 与智能体编排通常在 Dify、OpenClaw 等应用层完成。
一张表速查
| 术语 | 说明 |
|---|---|
| 大模型 API | 通过 HTTP 调用大模型对话能力;捷智算地址为 https://mass.gogpu.cn |
| 知识库 | 存放企业文档等专属资料,供检索或 RAG 使用 |
| RAG | 检索文档后再生成回答 |
| Agent | 可自动拆解任务、多步调用工具或模型 |
| Skill | 针对某类任务的可复用能力配置 |
| MCP | 连接外部工具与数据的标准协议 |
| 微调 | 通过训练将能力写入模型(与 RAG 为不同方案) |
| OpenClaw | 助手网关;捷智算提供 ubuntu22-openclaw 镜像 |
| Hermes Agent | 智能体运行时;需在云主机自行部署 |
延伸阅读(外部资料)
以下为第三方资料,仅供参考;具体功能以对应产品官方文档为准。
| 主题 | 参考 |
|---|---|
| RAG 入门 | SkillNav:什么是 RAG、Datawhale:RAG 简介 |
| MCP 官方说明 | MCP 中文文档 · 简介 |
| Agent 与 Skill | Datawhale:Agent Skills 解读 |
下一步
| 目标 | 文档 |
|---|---|
| Token、计费、上下文 | 模型与 Token 入门 |
| 第一次调 API | 快速开始 |
| OpenClaw 镜像 + 模型 API | 智能体与 OpenClaw · OpenClaw 部署指南 |
| API 字段与示例 | 请求参数说明 |
