category
tags
type
slug
date
summary
status
icon
password
Agent智能体通过自主执行、多模块协同和长期规划,扩展了传统AI大模型的任务能力和应用场景,使AI能够更加智能地处理复杂任务。
Agent智能体刮起又一轮的技术变革,新的风暴已经出现,怎么能够停止不前。
什么是Agent(智能体)?
我们可以看看一个名为 ChatDev 的开源项目。通过这个项目,我们能够更加形象地理解智能体在实际场景中的应用。
无人软件公司ChatDev
ChatDev 是由国内的大模型公司 面壁智能 与 清华大学 NLP 实验室 联合开发的,它可以被看作是一家虚拟的软件公司。
ChatDev 通过各种不同角色的智能体 运营,包括执行官,产品官,技术官,程序员 ,审查员,测试员,设计师 等。这些智能体形成了一个多智能体组织结构,其使命是“通过编程改变数字世界”。ChatDev内的智能体通过参加专业的功能研讨会来 协作,包括设计、编码、测试和文档编写等任务。
不同的是,这家公司的员工并不是人类,而是扮演着各个角色的智能代理(AI Agents)。
这些角色包括 CEO、CTO、产品经理、程序员、测试人员和设计师等。
而真正的客户则是人类。我们只需提出需求,比如开发一款乒乓球游戏程序,接下来这些智能体就会自动协作,进行讨论、规划和开发工作,最终将成品交付给我们。
通过 ChatDev,我们可以清楚地看到智能体如何在实际场景中发挥作用,真正实现了自主工作和协作能力的结合。
更多关于ChatDev:
游戏中的智能体社会
米哈游与复旦大学发表的关于智能体的综述展示了如何在社会场景中设计和运用多个智能体(agents),并详细描述了不同智能体在场景中的行为模式。
场景的左上角,一个智能体正在点菜,表明该智能体具有任务分配与选择的能力。与此同时,另一个智能体则在规划如何完成烹饪任务,表现出其对复杂问题的分解和解决能力。这里的互动体现了智能体的协作与分工,它们能够各自处理不同任务,最终达成目标。
在右上角,两个智能体正在讨论如何制作灯笼,表明它们具备交流与讨论的能力。智能体不仅能够进行决策,还能在团队中进行信息交换与合作。此外,它们还在计算制作灯笼的成本,这说明了这些智能体具备基本的经济思维和资源管理能力,能够做出与成本相关的优化决策。
通过这些场景,文章展示了智能体如何在复杂的、多任务的环境中协同工作,解决实际问题,并且与人类社会中的类似行为模式产生共鸣。
参考综述原文:
AI Agent与传统AI大模型有什么区别?
AI Agent(人工智能代理,Artificial Intelligence Agent),又称智能体,将已成为大模型应用于实际业务场景中的主流形式。那么,AI Agent 与传统 AI 大模型究竟有什么区别呢?
AI Agent是一种能够感知环境、自主理解,并具备决策和执行动作能力的智能体。
它的核心在于通过独立思考和调用外部工具,逐步完成给定的目标。相比之下,传统的 AI 大模型虽然经过海量数据的训练,具备强大的语言理解和生成能力,但它主要依赖于用户输入的提示词(Prompt)来输出结果。提示词的精准与否,直接影响模型的表现。
而 AI Agent 则不再依赖频繁的提示词输入。只需给定一个明确的目标,Agent 就能够根据环境信息和任务要求,自主规划路径,分解任务并执行行动。这种能力让它在处理复杂任务时更加高效和灵活。
传统的大模型,虽然具备上下文学习和类似人类思维链的推理能力,但仍有一些局限性,比如生成错误信息(“幻觉”现象)以及在处理长上下文时的性能衰减。而 AI Agent 能够弥补这些不足,将大模型作为核心引擎,同时通过将复杂任务分解为多个子任务,逐步实现目标。这种分布式执行方式使得 AI Agent 更适合动态、多步骤的任务场景,显著提升了智能体的自主决策和问题解决能力。
关于Agent的技术架构
一个基于大模型的 AI Agent 系统 通常包括四个关键组件:
- 大模型(LLM)
- 记忆(Memory)
- 任务规划(Planning)
- 工具使用(Tool)
在这个系统中,大模型(LLM)充当智能体的大脑,负责计算和决策,而其他组件则提供辅助,帮助 AI Agent 更好地完成目标任务。
1. 规划(Planning)
- 对于需要多个步骤的复杂任务,AI Agent 可以通过调用大模型(LLM)的“思维链”(Chain of Thought, COT)能力来进行任务分解。在 AI Agent 架构中,任务的规划和分解依赖于大模型的能力。思维链能够逐步引导模型进行深度思考,将大型任务分解为较小的、可管理的子目标,从而更高效地处理复杂任务。
- AI Agent 还具备反思和自省的框架,不断提升任务规划能力。通过对过去的行为进行自我批评和反省,AI Agent 能够从错误中吸取经验,分析并优化未来的行动。自省框架允许 AI Agent 纠正之前的决策,帮助它不断优化,提升智能和适应能力。
2. 记忆(Memory)
- 短期记忆:AI Agent 会将系统中的所有输入存储为短期记忆,依赖这种短期记忆进行上下文学习。然而,短期记忆受到上下文窗口长度的限制,不同模型的上下文窗口大小有所不同。
- 长期记忆:AI Agent 需要查询外部向量数据库来存储长期信息,构成系统的长期记忆。长期记忆使得 AI Agent 能够长期保存并调用大量信息,外部向量数据库可通过快速检索进行访问,帮助 AI Agent 完成复杂任务(如阅读 PDF 或查询知识库)。
- 向量数据库通过将数据转化为向量进行存储,方便高效检索。
3. 工具(Tools)
- AI Agent 能够调用外部工具的 API 来扩展模型的能力,获取大模型以外的信息和功能。例如,预定日程、设置待办事项、查询数据等。
- 类 GPT 的大模型已支持插件功能,可通过调用插件访问最新信息或特定数据源。不过,这类插件需要用户在提问时手动选择,无法自动完成自然问题的回答。而 AI Agent 可以根据任务规划自动调用外部工具,并根据 API 接口返回的信息进一步完成任务,避免手动干预。
Coze是什么?
Coze 是新一代一站式 AI Bot 开发平台。无论你是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,你可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。
Coze由字节跳动团队开发,分为国内版和海外版:
- 国内版使用的是字节自研的云雀大模型,国内网络即可以正常访问
- 海外版使用GPT-4、GPT-3.5等大模型,访问需要突破网络限制的工具
特点
- Coze 支持丰富的主流第三方插件、知识库、数据库、工作流设计、预置 AI Bot、性能监控与优化等功能,这让它在同类平台中独树一帜。
- Coze 非常适合小白用户,无需编程基础,只要会使用电脑就可以轻松上手。
- Coze 国内版可以直接对接发布到微信、飞书等主流平台,国外版则支持对接 Facebook Messenger、Slack、Telegram 等平台。
- 目前国内版仅支持使用“云雀大模型”作为对话引擎,国外版则可以使用 GPT-3.5/GPT-4 ,不过国内暂时无法直接访问,需要一些“魔法”手段。
- Coze 还拥有自己的移动端 APP,方便用户通过手机分享自己的 AI 应用,大大提升了用户体验,也增加了产品裂变的可能性。
关于更多Coze的技术特点,可以参考官方文档:
Coze搭建一个AI团队
围绕Coze可以搭建你的工作团队,甚至你可以直接对外发布AI应用,例如销售部门、产品部门、售后部门的Bot创建一个客户端,即可让它们直面客户,自动运行。
Coze 的解决方案包含以下五大模块:
1. Bot
Bot 是 Coze 平台的核心,它是一个 AI 聊天机器人,能够处理用户的输入,执行指令,并提供个性化的反馈。你可以通过它来执行各种任务,比如问答、任务管理和信息查询等。通过设定特定的场景或命令,它可以帮助用户更高效地完成工作。
你可以像我一样为这个工作设置不同的分工机器人。
2. Plugins
Plugins 模块允许用户通过扩展插件来增强 Bot 的功能。通过插件,用户可以接入外部应用或服务,比如日程管理、数据分析、API 集成等。这使得 Coze 的 AI 能力可以与其他软件或系统进行无缝对接,帮助用户整合不同的工具与平台。
它很像Github的Actions。两者都提供了扩展功能的机制,通过插件或动作来增强系统的能力。
GitHub Actions 允许用户定义和自动化软件开发流程,执行 CI/CD 流水线任务,如代码测试、部署等。用户可以通过配置工作流来触发特定条件下的动作,集成外部服务,自动化重复任务。
Coze 的 Plugins 也支持类似的自动化能力,用户可以通过插件来扩展 AI 的功能,连接外部服务(如数据分析、API、工具等),并实现任务自动化。这使得 Bot 可以根据设定的条件执行复杂操作,自动完成日常任务。
两者的核心思想都是利用插件/动作增强平台的功能,通过自动化减少人工操作,提高效率。
3. Workflows
Workflows 是 Coze 提供的自动化工作流工具。用户可以创建和自定义一系列自动化任务,并根据自己的需要设定触发条件。
例如,你可以设定在接收到特定信息时自动执行某些操作,帮助减少手动任务,提升工作效率。这使得复杂的任务和流程可以通过预设的工作流来简化和自动化。
又例如,当收到某些消息时,让AI搜索谷歌的相关内容,并整理出文字,并调用第三方接口直接生成视频。
4. Knowledge
Knowledge 模块是 Coze 的知识库系统。用户可以存储和管理他们的知识、数据和文档。该系统可以作为用户的信息存储库,方便 AI 在需要时快速检索相关信息。这不仅提高了信息的利用率,还让 Bot 能够从存储的知识中获得更深层次的理解和上下文支持。
这里我们可以对接Notion来存储我们的工作资料:
5. Cards
- Cards 模块是 Coze 平台中的信息管理和展示工具。每张卡片可以包含任务、信息或动态数据,类似于一个简化的项目管理面板。通过卡片,用户可以组织不同的任务和信息,快速浏览和管理当前的工作进展。卡片模块帮助用户将复杂的信息模块化,提升可视化和管理效率。
最后
今天的分享就到这里,关于Coze的具体使用,有时间再继续完善。
Loading...