传统AI大模型已经落伍了吗？智能体(Agent)是什么？如何搭建自己的AI自动工作团队？

什么是Agent(智能体)？

我们可以看看一个名为 ChatDev 的开源项目。通过这个项目，我们能够更加形象地理解智能体在实际场景中的应用。

无人软件公司ChatDev

ChatDev 是由国内的大模型公司 面壁智能 与 清华大学 NLP 实验室 联合开发的，它可以被看作是一家虚拟的软件公司。

ChatDev 通过各种不同角色的智能体 运营，包括执行官，产品官，技术官，程序员，审查员，测试员，设计师等。这些智能体形成了一个多智能体组织结构，其使命是“通过编程改变数字世界”。ChatDev内的智能体通过参加专业的功能研讨会来协作，包括设计、编码、测试和文档编写等任务。

不同的是，这家公司的员工并不是人类，而是扮演着各个角色的智能代理（AI Agents）。

这些角色包括 CEO、CTO、产品经理、程序员、测试人员和设计师等。

而真正的客户则是人类。我们只需提出需求，比如开发一款乒乓球游戏程序，接下来这些智能体就会自动协作，进行讨论、规划和开发工作，最终将成品交付给我们。

通过 ChatDev，我们可以清楚地看到智能体如何在实际场景中发挥作用，真正实现了自主工作和协作能力的结合。

Create Customized Software using Natural Language Idea (through LLM-powered Multi-Agent Collaboration) - OpenBMB/ChatDev

GitHub - OpenBMB/ChatDev: Create Customized Software using Natural Language Idea (through LLM-powered Multi-Agent Collaboration)

https://github.com/OpenBMB/ChatDev

游戏中的智能体社会

米哈游与复旦大学发表的关于智能体的综述展示了如何在社会场景中设计和运用多个智能体（agents），并详细描述了不同智能体在场景中的行为模式。

场景的左上角，一个智能体正在点菜，表明该智能体具有任务分配与选择的能力。与此同时，另一个智能体则在规划如何完成烹饪任务，表现出其对复杂问题的分解和解决能力。这里的互动体现了智能体的协作与分工，它们能够各自处理不同任务，最终达成目标。

在右上角，两个智能体正在讨论如何制作灯笼，表明它们具备交流与讨论的能力。智能体不仅能够进行决策，还能在团队中进行信息交换与合作。此外，它们还在计算制作灯笼的成本，这说明了这些智能体具备基本的经济思维和资源管理能力，能够做出与成本相关的优化决策。

通过这些场景，文章展示了智能体如何在复杂的、多任务的环境中协同工作，解决实际问题，并且与人类社会中的类似行为模式产生共鸣。

参考综述原文：

Review: The Rise and Potential of Large Language Model Based Agents: A Survey

Abstract

https://medium.com/@dataism/review-the-rise-and-potential-of-large-language-model-based-agents-a-survey-36c8820f159b

AI Agent与传统AI大模型有什么区别？

AI Agent（人工智能代理，Artificial Intelligence Agent）,又称智能体，将已成为大模型应用于实际业务场景中的主流形式。那么，AI Agent 与传统 AI 大模型究竟有什么区别呢？

AI Agent是一种能够感知环境、自主理解，并具备决策和执行动作能力的智能体。

它的核心在于通过独立思考和调用外部工具，逐步完成给定的目标。相比之下，传统的 AI 大模型虽然经过海量数据的训练，具备强大的语言理解和生成能力，但它主要依赖于用户输入的提示词（Prompt）来输出结果。提示词的精准与否，直接影响模型的表现。

而 AI Agent 则不再依赖频繁的提示词输入。只需给定一个明确的目标，Agent 就能够根据环境信息和任务要求，自主规划路径，分解任务并执行行动。这种能力让它在处理复杂任务时更加高效和灵活。

传统的大模型，虽然具备上下文学习和类似人类思维链的推理能力，但仍有一些局限性，比如生成错误信息（“幻觉”现象）以及在处理长上下文时的性能衰减。而 AI Agent 能够弥补这些不足，将大模型作为核心引擎，同时通过将复杂任务分解为多个子任务，逐步实现目标。这种分布式执行方式使得 AI Agent 更适合动态、多步骤的任务场景，显著提升了智能体的自主决策和问题解决能力。

关于Agent的技术架构

一个基于大模型的 AI Agent 系统 通常包括四个关键组件：

大模型（LLM）

记忆（Memory）

任务规划（Planning）

工具使用（Tool）

在这个系统中，大模型(LLM)充当智能体的大脑，负责计算和决策，而其他组件则提供辅助，帮助 AI Agent 更好地完成目标任务。

1. 规划（Planning）

对于需要多个步骤的复杂任务，AI Agent 可以通过调用大模型（LLM）的“思维链”（Chain of Thought, COT）能力来进行任务分解。在 AI Agent 架构中，任务的规划和分解依赖于大模型的能力。思维链能够逐步引导模型进行深度思考，将大型任务分解为较小的、可管理的子目标，从而更高效地处理复杂任务。