AI 应用概念入门

本文说明使用捷智算 模型 API 服务 时常见的相关概念:知识库RAGAgentSkillMCP 等,以及它们与「直接调用大模型接口」的关系。

与 Token、计费相关的说明见 模型与 Token 入门;接入步骤见 快速开始


能力与层级关系

从下到上,可以粗分为四层:

┌─────────────────────────────────────────────────────────┐
│  应用形态:智能客服、企业问答、Cursor、Dify 工作流…      │
├─────────────────────────────────────────────────────────┤
│  智能体 Agent:理解目标 → 拆任务 → 决定查什么、调什么    │
├─────────────────────────────────────────────────────────┤
│  能力组件:RAG / 知识库检索、Skill、Function Calling…    │
├─────────────────────────────────────────────────────────┤
│  连接层:MCP(统一接工具/数据的标准方式)                │
├─────────────────────────────────────────────────────────┤
│  大模型 API:读文字、写文字(如捷智算 mass.gogpu.cn)    │
└─────────────────────────────────────────────────────────┘

捷智算模型 API 主要提供最底层:大模型对话能力(按 Token 或套餐计费)。
知识库、RAG、Agent、MCP 等能力,通常由 Dify、OpenClaw、自研系统 等业务应用实现;生成回答时,可调用捷智算 模型 APIhttps://mass.gogpu.cn)作为大模型服务。


大模型(LLM)与模型 API

说法含义
大模型 / LLM经过海量文本训练的语言模型,能根据您给的文字 续写、回答、总结
模型 API通过 HTTP 请求调用大模型并获取输出;按 Token 套餐或按量计费

捷智算 模型 APIhttps://mass.gogpu.cn)提供多模型对话能力;知识库、智能客服系统等完整应用需另行搭建或选用 Dify、OpenClaw 等产品。


知识库

是什么

知识库 = 您希望 AI 参考的专属资料集合,例如:

  • 产品手册、内部 Wiki、制度文件
  • 客服话术、FAQ、工单历史
  • 技术文档、API 说明、标书模板

这些资料 不在 大模型出厂训练数据里,或需要 经常更新,所以不能只靠模型「凭记忆回答」。

和「直接问 ChatGPT」的区别

直接问通用大模型接知识库
只能依赖训练时学过的公开知识可基于 您自己的文档 回答
容易过时、不知道公司内部规定资料更新后,检索侧更新即可(配合 RAG)
可能编造看似合理的内容若设计得当,可 标注引用来源

知识库本身是 存文档、做检索 的系统;要让大模型 检索结果来回答,通常还要配合下面的 RAG


RAG(检索增强生成)

一句话

RAG(Retrieval-Augmented Generation,检索增强生成)指:在生成回答前,先从您的文档库中 检索相关内容,再连同用户问题一并提交给大模型,由模型 依据检索结果 生成回答,而不是仅依赖模型训练时的固定知识。

处理流程

阶段说明
1. 建库将 PDF、Word、网页等文档 切分 并建立可检索索引
2. 提问用户提交问题
3. 检索在知识库中匹配 语义最相关 的文档片段
4. 生成问题与检索片段 一并提交大模型并生成回答

简化数据流:

您的文档 → 切片 → 建立索引(知识库)
                         ↑
用户问题 → 检索最相关片段 ─┘
         → 连同片段发给大模型 → 回答(最好带引用出处)

能解决什么问题

问题RAG 的作用
模型不知道公司内部制度检索内部文档再答
训练数据有「截止日期」新文档入库即可用
「胡说八道」(幻觉)有资料约束,并可核对来源
微调成本高多数企业问答 先上 RAG,再考虑微调

和「微调」怎么选(简表)

RAG微调(Fine-tuning)
本质让模型 查外部资料让模型 把知识写进权重
更新知识更新文档 / 索引,较快往往要重新训练,成本高
适合企业知识问答、文档助手、客服固定语气、格式、行业术语风格
建议多数场景先试 RAGRAG 不够再评估微调

和捷智算的关系

  • RAG 的「生成」一步 需要调用大模型 → 可使用捷智算 模型 API
  • 切片、向量库、检索、编排 一般在 Dify、FastGPT 或自研系统中完成,需自行部署与维护。
  • 检索质量直接影响回答质量:若检索到的片段与问题无关,模型输出也可能错误。

语义检索相关术语(选读)

搭建知识库或 RAG 时,方案说明里常出现 Embedding、向量、向量数据库 等词。下面用直观说法帮助对照理解(不涉及公式与实现细节):

说明
Embedding把一段文字变成一串数字,让 意思相近 的文字在数学上「离得近」
向量检索用问题的向量去库里找 最相似 的文档片段(不限于相同关键词)
向量数据库专门存这些数字、做快速相似搜索的库

举例:用户问「怎么退费」,库里可能有「退款流程」——字面不同,语义相近,向量检索更容易找对。


Agent(智能体)

是什么

Agent(智能体) 指一类 会自己拆任务、选步骤、再调用工具或模型 的应用,而不只是「问一句答一句」。

典型过程:

  1. 理解 您的目标(如「整理上周销售邮件并写摘要」)
  2. 规划 分几步做(先读邮件 → 再分类 → 再写摘要)
  3. 执行 调用搜索、数据库、发邮件、调大模型
  4. 根据结果调整 下一步(部分产品支持多轮反思)

和 RAG、知识库的关系

  • 需要查阅文档时,Agent 可调用基于知识库的 RAG 能力。
  • 也可不依赖知识库,仅调用工具、API 或大模型完成其他任务。

Skill(技能)

行业里的常见含义

Skill 通常指 一项边界清楚、可复用的能力,完成 一类固定或半固定任务,例如:

  • 「按公司模板写周报」
  • 「根据 SKU 查库存并回复话术」
  • 「按规范审查合同条款」

特点:

特点说明
范围明确擅长一件事,不是什么都做
可被 Agent 调用作为完成子任务的能力模块
可编排多个 Skill 组合成复杂流程

与 Agent、MCP 的区别

概念说明
大模型负责理解与生成自然语言
Skill规定某类任务的步骤与输出要求
MCP以标准协议连接外部工具与数据源
Agent拆解任务并调度 Skill、工具与大模型

常见分工如下(各产品实现可能不同):

  • MCP 解决「能连上什么」(数据库、Git、浏览器、内部 API)
  • Skill 解决「连上之后怎么做事」(步骤、注意事项、输出格式)
  • Agent 决定「当前该不该用哪个 Skill / 工具

和 Cursor 等工具里的「Skill」

部分开发工具(如 Cursor)里的 Skill,是为 AI 助手准备的 结构化说明(何时用、怎么做、参考哪些规范),帮助助手在特定场景下更稳定地执行任务。思想与上文的「可复用能力单元」相近,但 绑定在具体产品里,不必与别的平台的 Skill 混为一谈。


MCP(Model Context Protocol)

是什么

MCP(Model Context Protocol,模型上下文协议)是 Anthropic 等推动的 开放标准,用来让 AI 应用(Host)统一方式 连接 外部工具和数据(Server)

MCP 用于统一 AI 应用与外部工具、数据源之间的连接方式:工具提供方实现 MCP Server,支持 MCP 的客户端(如 Cursor、Claude Desktop)即可按同一协议调用。

三类能力

类型作用举例
Tools(工具)AI 主动调用,会产生操作创建工单、执行 SQL、发 HTTP 请求
Resources(资源)AI 读取 的数据文件内容、配置、只读查询结果
Prompts(提示模板)预置好的 工作流提示「按此模板做 Code Review」

调用过程说明

您在 Cursor / Claude 里提问
    → AI 判断是否需要外部能力
    → MCP 客户端连接对应 MCP Server(可能需您确认)
    → Server 执行(读文件、调 API 等)把结果返回
    → AI 结合结果继续生成回答

MCP 和 RAG、Function Calling 的关系

概念关系
Function Calling大模型「可以决定调用哪个函数」的能力;很多产品内置
MCP把「连哪些工具、怎么传参」 标准化 的协议层,常建立在类似能力之上
RAG检索文档再生成 的一种架构;可以把检索服务 封装成 MCP Server,供 Cursor 等调用

三者 不是互斥:例如 Agent 通过 MCP 调用「知识库检索工具」,检索逻辑本身是 RAG。

和捷智算模型 API 的关系

  • 捷智算 模型 API 提供的是 对话补全(OpenAI / Anthropic 兼容地址),不是 MCP Server。
  • 您在 Cursor 里配置 MCP,同时把 模型地址 指向 https://mass.gogpu.cn,是 两条线
    • MCP:接工具与数据
    • 模型 API:接大模型推理与计费

OpenClaw 与 Hermes Agent

二者都是 智能体(Agent)方向 的开源方案,但分工不同;捷智算当前 直接提供 OpenClaw 云主机镜像,Hermes 一般在 GPU 云主机上 按官方文档自装

OpenClaw:个人助手网关

OpenClawopen in new window 是运行在云主机上的 AI 助手网关,主要能力包括:

能力说明
Gateway统一管会话、工具、Skill、部分 MCP
多渠道可对接飞书、钉钉等(以版本与配置为准)
模型接入可配置在线模型 API 或本机 Ollama

捷智算:购买云主机 → 镜像选 ubuntu22-openclaw → 开机按实例内指引使用,详见 OpenClaw 部署指南
若要用控制台 模型广场 里的多模型并统一账单,在 OpenClaw 里配置 https://mass.gogpu.cn/v1 + sk- 密钥,见 智能体与 OpenClaw

Hermes Agent:偏执行与沉淀的运行时

Hermes Agent(如 Nous Research 社区项目open in new window)侧重 任务执行、技能沉淀、长期记忆 等,和 OpenClaw 的「多渠道 inbox」侧重点不同。复杂场景里也有人 OpenClaw 管接入与编排,Hermes 管深度任务

名称说明

  • Hermes Agent:智能体软件框架
  • Hermes 模型系列:模型权重名称,与框架不是同一概念
  • React Native Hermes 引擎:与本文无关

大模型仍可接 捷智算模型 API 或本机推理;镜像与对接步骤见 智能体与 OpenClaw


低代码平台:Dify、FastGPT 等

平台类型通常已包含您仍需
Dify、FastGPT、MaxKB 等知识库、RAG 流程、部分 Agent 编排配置 模型 API 地址 + 密钥(可填捷智算)
Cursor、Claude Desktop编辑器 / 对话 + MCP配置模型提供商与 MCP Server
OpenClawubuntu22-openclaw 镜像)预装助手网关、体验额度Ollama 和/或 捷智算模型 API
Hermes Agent自部署运行时大模型可接本地或 捷智算模型 API
完全自研全部自建自研检索与业务逻辑 + 调用捷智算 API

产品边界:捷智算提供 GPU 云主机(含 OpenClaw 镜像)与模型 API 计费;知识库、RAG 与智能体编排通常在 Dify、OpenClaw 等应用层完成。


一张表速查

术语说明
大模型 API通过 HTTP 调用大模型对话能力;捷智算地址为 https://mass.gogpu.cn
知识库存放企业文档等专属资料,供检索或 RAG 使用
RAG检索文档后再生成回答
Agent可自动拆解任务、多步调用工具或模型
Skill针对某类任务的可复用能力配置
MCP连接外部工具与数据的标准协议
微调通过训练将能力写入模型(与 RAG 为不同方案)
OpenClaw助手网关;捷智算提供 ubuntu22-openclaw 镜像
Hermes Agent智能体运行时;需在云主机自行部署

延伸阅读(外部资料)

以下为第三方资料,仅供参考;具体功能以对应产品官方文档为准。

主题参考
RAG 入门SkillNav:什么是 RAGopen in new windowDatawhale:RAG 简介open in new window
MCP 官方说明MCP 中文文档 · 简介open in new window
Agent 与 SkillDatawhale:Agent Skills 解读open in new window

下一步

目标文档
Token、计费、上下文模型与 Token 入门
第一次调 API快速开始
OpenClaw 镜像 + 模型 API智能体与 OpenClaw · OpenClaw 部署指南
API 字段与示例请求参数说明
复制 MD