AI Agent 是什么

AI 摘要:AI Agent 是一种高级 AI 产品，通过端到端交付实现任务分发和结果呈现，几乎完全自动化。

2026-04-23

🤖 AI Agent

🤖 AI Technology

🤖 Intelligent System

AI 智能体（AI Agent）的概念越来越火。

数字分身、数字民工、蒸馏同事，某种程度上都在做同一件事：让 AI 表现得更像一个具体的人，执行复杂任务，而非只是单纯对话。

这是 AI 产品化的一种高级形态。

谁不想拥有一个 Agent，可以自觉地接收任务，拆解目标，执行，反馈，全程只需要很少介入，就能拿到最终结果呢？

AI Agent 实现了任务分发和结果呈现的端到端交付。更重要的，这个过程，几乎完全自动化。

那么 AI Agent 是如何做到的？

1. 概念

根据维基百科上的定义，

AI agents (also referred to as compound AI systems or agentic AI) are a class of intelligent agents🔗 distinguished by their ability to operate autonomously🔗 in complex environments.

人工智能代理（也称为复合人工智能系统或智能体人工智能）是一类智能代理，其特点是能够在复杂环境中自主运行。

ChatGPT 最开始发布的时候，还只是一个聊天工具，背后的 LLM 负责与你对话：你的每一个提问，都能得到一个答案。

效果很好，都不够。因为人们期待它能完成更多具体任务，而不仅仅只是输出一段文字。

我将 AI Agent 理解为一个，内核是 LLM，但被安插了多种技能，可以流程化解决某些特定问题的产品形态。

2. Agent 核心组件

Agent 的典型工作流程，叫 ReAct (Reason + Act)。

大体有这样几个关键环节：

接收目标（Goal）
分解任务（Plan）
调用工具（Action）
观察结果（Observation）
继续调整（Reflection / Iteration）

大致就是一位卓有成效的工作者做事的方式。

举例来说，你想购买一张机票。

Flight Agent 会：

查航班 API
比较价格
判断时间是否合适
调用支付接口（如果允许）
返回结果甚至自动下单

单纯靠 LLM 是做不到的，因为额外你需要：控制流程（Agent Loop）+ 工具调用（Tools）。

如果想要它记住你的偏好和历史选择，记忆（Memory）不可或缺。

3. Subagent

写代码时，如果一个函数过大，最佳实践是拆成几个功能更内聚的子函数。

Subagent 的作用同样如此。

当 Agent 变得越来越复杂时，效果、可维护性，都会变差。

原因是多方面的：

LLM 的上下文窗口有长度限制
Agent 有自己擅长/不擅长的领域
巨型 Agent = 巨型 Prompt，不好测试，也不便于迭代

有了 Subagent，Agent 更像是一个团队 Leader，而 Subagent 是被主 Agent 调度的“子智能体”，专门负责某一类任务。

比如你想写一篇技术博客。

主 Agent 要想出色的完成任务，需要“召唤”不同角色：

🔍 Research Agent：查资料
✍️ Writing Agent：写初稿
🧹 Editing Agent：润色
📊 SEO Agent：优化关键词

术业有专攻，经过良好地组织和编排，往往能拿到更好的结果。

4. 动手实现

如果想自己动手，有现成的框架可以借鉴：

LangChain
- 支持 Agent + Tools
- 可以构建多 Agent 系统
CrewAI
- 专门做多 Agent 协作
- 很适合 Subagent 模式

Python 伪代码大致长这样：

class MainAgent:
    def run(task):
        plan = self.plan(task)

        research = ResearchAgent().run(plan)
        draft = WritingAgent().run(research)
        final = EditingAgent().run(draft)

        return final

5. 总结

Agent 和 Subagent 的出现，满足了人们想要把更多智力工作委托出去的愿望，同样也蕴藏着某种野心：人类社会现存的工作，无论体力还是智力，未来是不是都可以由经过特定优化的 Agent 完成？

没有人知道答案。

目前能看到的是，伴随 LLM 的不断升级，工具和使用模式的日渐成熟，更多工作可以交给 Agent 完成，其中不乏一些复杂任务。

比如，我现在平时，代码很少亲自写，都是把需求和任务描述清楚，交给 GitHub Copilot Chat。很多时候完成得都不错，甚至会产生一些惊讶时刻。

工作方式在快速地发生变化。

我们唯一能做的，是学习如何更好地驾驭 AI，而非与之竞争。

（完）

参考

本文作者:Plantree
本文链接:https://plantree.me/blog/2026/ai-agent/
版权声明:所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处！

AI 与未来的工作

什么是 AI Harness Engineering

在 GitHub 上编辑本页面

最后更新于: 2026-07-13T05:59:15+08:00