2024中国AI Agent行业研究报告-甲子光年-2024.4-60页(1).pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024中国AI Agent行业研究报告-甲子光年-2024.4-60页1 2024 中国 AI Agent 行业 研究 报告 甲子 光年 2024.4 60
- 资源描述:
-
1、大模型时代的“APP”,探索新一代人机交互及协作范式出品机构:甲子光年智库智库院长:宋涛撰写分析师:刘瑶、胡博文发布时间:2024.42024中国AI Agent 行业研究报告注:AIGC生成内容亦对本报告有贡献CONTENTS目 录Part 01前世今生:科幻憧憬、学术概念与商业尝试Part 02奇点已至:让每个人掌握AI的力量Part 04时代先驱:当下商业实践值得关注的里程碑Part 05潜力无限:来自于数据、算法、算力的飞轮效应Part 03百家争鸣:属于大模型时代的APP繁荣AI Agent的发展历程梳理:大模型赋予了AI Agent核心改变 Agent(代理)一概念起源于哲学,描述
2、了一种拥有欲望、信念、意图以及采取行动能力的实体。在人工智能领域,这一术语被赋予了一层新的含义:具有自主性、反应性、交互性等特征的智能“代理”。大型语言模型(LLMs)的出现为智能代理的进一步发展带来了希望。基于符号规则基于统计学习基于深度学习基于大模型LLM给AI Agent底层提供了一个突破性技术方案:LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让Agent 具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的Agent成为可能LLM的框架优势:过去等强化学习基于深度学习框架可让Agent学到技能,但Agent的泛化性较差,往往用于非常窄的特定领域,例如用在游戏或低维
3、层面的控制或计划,标志性应用是围棋领域的AlphaGo。长期以来,研究者们一直在追求与人类相当、乃至超越人类水平的通用人工智能(Artificial General Artificial General IntelligenceIntelligence,AGIAGI)。在 1950 1950 年代,Alan Turing Alan Turing 就将智能的概念扩展到了人工实体,并提出了著名的图灵测试。这些人工智能实体通常被称为 AgentAgent(代理*)过往的工作主要集中在增强代理的特定能力,如符号推理或对特定任务的掌握(国际象棋、围棋等)。这些研究更加注重算法设计和训练策略,而忽视了模型
4、固有的通用能力的发展,如知识记忆、长期规划、有效泛化和高效互动等。事实证明,增强模型固有能力是推动智能代理进一步发展的关键因素。*Agent 术语的中文译名并未形成共识,有学者将其翻译为智能体、行为体、代理或智能代理,目前行业出现的“代理”和“智能代理”均指代 Agent,后由于2023年Open AI引爆AIGC领域,一般称为AI Agent。过往的AI Agent类型:符号型智能体:采用逻辑规则和符号表示来封装知识和促进推理过程,如1980年前后,出现的医学诊断专家系统,模拟心理治疗程序等;反映型智能体:关注智能体与其环境之间的交互,强调快速和实时响应,缺乏复杂缺乏复杂决策和规划能力;基于
5、强化学习的智体题:关注如何让智能体通过与环境的交互进行学习。基于迁移学习和元学习的智能体:使智能体从少量样本中迅速推理出执行任务的最优策略。AI Agent的发展历程简述数据来源:公开资料,专家访谈,甲子光年智库整理LLM是Agent能力的增效器,交互协作程度是Agent能力的扩展器大模型时代的AI AgentLLM(规划+记忆+工具+行动)提升AI Agent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验。LLM是核心控制器,构建核心能力核心特征AI Agent记忆能力行动能力工具能力规划能力人类用户通过用户接口
6、、命令指示等方式与Agent形成交互,是Agent的监督者、合作者和决策者外界环境Agent所处的环境(可能包括虚拟及物理世界),外界环境可以与Agent形成交互Agents其他Agent,多Agent可以形成协作,结合相关任务结果形成群体智能系统开发者Agent的开发者,对Agent的相关能力,设计Agent的相关组件能力人机交互设计开发感知反馈群体协作架构解析 当下大模型的参数量提升AI Agent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验,是当下Agent的构建关键。Agent基于LLM的组件,和交互两个
7、层面数据来源:公开资料,专家访谈,甲子光年智库整理当下的AI Agent可以看作LLM技术下Prompt工程的进化 AI Agent是Prompt工程的一种升级,Agent的核心在于自主性的增强,可有效完成某一个工作点或工作单元,尽量减少人的干预;评价一个AI Agent的核心逻辑:在流程上的节点上完成了什么程度的自动化。AI AgentChain/FlowModelPromptMulti-AgentPrompt模式是把大模型当做工具来调用:大模型的最初兴起的时候,Prompt工程,把大模型当成一种编程语言来看待。人们通过描述角色技能、任务关键词、任务目标及任务背景,告知大模型需要输出的格式,
8、并调用大模型进行输出。因此在2023年,全球AIGC关注者发展了多种Prompt工程的玩法,如角色扮演、零样本提示和少样本提示,希望将Prompt工程发挥到极致。例如一个澳大利亚少年编写了一个15000个字符的提示词,成功地让他变身为人类的导师,教授各种知识。这种方式就像能直接构建软件一样。Prompt工程的万能公式:角色+角色技能+任务核心关键词+任务目标+任务背景+任务范围+任务解决与否判定+任务限制条件+输出格式/形式+输出量。Agent的核心在于自主性的增强,这种增强的核心要义是可以去独立完成一个工作节点,在某个工作节点几乎可以减少人类的审核。让整个事件的流程在此刻完成闭环成本降到最低
展开阅读全文
