AI Agent 是什么

2026-04-23 pv

AI 智能体(AI Agent)的概念越来越火。

数字分身、数字民工、蒸馏同事,某种程度上都在做同一件事:让 AI 表现得更像一个具体的人,执行复杂任务,而非只是单纯对话。

这是 AI 产品化的一种高级形态。

谁不想拥有一个 Agent,可以自觉地接收任务,拆解目标,执行,反馈,全程只需要很少介入,就能拿到最终结果呢?

AI Agent 实现了任务分发和结果呈现的端到端交付。更重要的,这个过程,几乎完全自动化。

那么 AI Agent 是如何做到的?

1. 概念

根据维基百科上的定义,

AI agents (also referred to as compound AI systems or agentic AI) are a class of intelligent agents🔗 distinguished by their ability to operate autonomously🔗 in complex environments.

人工智能代理(也称为复合人工智能系统或智能体人工智能)是一类智能代理,其特点是能够在复杂环境中自主运行。

ChatGPT 最开始发布的时候,还只是一个聊天工具,背后的 LLM 负责与你对话:你的每一个提问,都能得到一个答案。

效果很好,都不够。因为人们期待它能完成更多具体任务,而不仅仅只是输出一段文字。

我将 AI Agent 理解为一个,内核是 LLM,但被安插了多种技能,可以流程化解决某些特定问题的产品形态

2. Agent 核心组件

Agent 的典型工作流程,叫 ReAct (Reason + Act)。

大体有这样几个关键环节:

  1. 接收目标(Goal)
  2. 分解任务(Plan)
  3. 调用工具(Action)
  4. 观察结果(Observation)
  5. 继续调整(Reflection / Iteration)

大致就是一位卓有成效的工作者做事的方式。

举例来说,你想购买一张机票。

Flight Agent 会:

  • 查航班 API
  • 比较价格
  • 判断时间是否合适
  • 调用支付接口(如果允许)
  • 返回结果甚至自动下单

单纯靠 LLM 是做不到的,因为额外你需要:控制流程(Agent Loop)+ 工具调用(Tools)。

如果想要它记住你的偏好和历史选择,记忆(Memory)不可或缺。

3. Subagent

写代码时,如果一个函数过大,最佳实践是拆成几个功能更内聚的子函数。

Subagent 的作用同样如此。

当 Agent 变得越来越复杂时,效果、可维护性,都会变差。

原因是多方面的:

  • LLM 的上下文窗口有长度限制
  • Agent 有自己擅长/不擅长的领域
  • 巨型 Agent = 巨型 Prompt,不好测试,也不便于迭代

有了 Subagent,Agent 更像是一个团队 Leader,而 Subagent 是被主 Agent 调度的“子智能体”,专门负责某一类任务。

比如你想写一篇技术博客。

主 Agent 要想出色的完成任务,需要“召唤”不同角色:

  • 🔍 Research Agent:查资料
  • ✍️ Writing Agent:写初稿
  • 🧹 Editing Agent:润色
  • 📊 SEO Agent:优化关键词

术业有专攻,经过良好地组织和编排,往往能拿到更好的结果。

4. 动手实现

如果想自己动手,有现成的框架可以借鉴:

  1. LangChain

    • 支持 Agent + Tools
    • 可以构建多 Agent 系统
  2. CrewAI

    • 专门做多 Agent 协作
    • 很适合 Subagent 模式

Python 伪代码大致长这样:

class MainAgent:
def run(task):
plan = self.plan(task)
research = ResearchAgent().run(plan)
draft = WritingAgent().run(research)
final = EditingAgent().run(draft)
return final

5. 总结

Agent 和 Subagent 的出现,满足了人们想要把更多智力工作委托出去的愿望,同样也蕴藏着某种野心:人类社会现存的工作,无论体力还是智力,未来是不是都可以由经过特定优化的 Agent 完成?

没有人知道答案。

目前能看到的是,伴随 LLM 的不断升级,工具和使用模式的日渐成熟,更多工作可以交给 Agent 完成,其中不乏一些复杂任务。

比如,我现在平时,代码很少亲自写,都是把需求和任务描述清楚,交给 GitHub Copilot Chat。很多时候完成得都不错,甚至会产生一些惊讶时刻。

工作方式在快速地发生变化。

我们唯一能做的,是学习如何更好地驾驭 AI,而非与之竞争。

(完)

参考

  1. GitHub - alchaincyf/nuwa-skill: 你想蒸馏的下一个员工,何必是同事。蒸馏任何人的思维方式——心智模型、决策启发式、表达DNA。Distill how anyone thinks. · GitHub🔗
  2. AI agent - Wikipedia🔗
  3. [2210.03629] ReAct: Synergizing Reasoning and Acting in Language Models🔗
在 GitHub 上编辑本页面

最后更新于: 2026-04-23T05:30:14+08:00