《信息服务行业专题报告:AI Agent(智能体)从技术概念到场景落地-240918(33页).pdf》由会员分享,可在线阅读,更多相关《信息服务行业专题报告:AI Agent(智能体)从技术概念到场景落地-240918(33页).pdf(33页珍藏版)》请在薪酬报告网上搜索。
1、请务必阅读正文之后的信息披露和法律声明行业研究/信息服务行业专题报告行业专题报告证券研究报告2024年09月18日投资评级优于大市投资评级优于大市维持维持市场表现市场表现AIAI AgentAgent(智能体智能体):):从技术概念到场景落从技术概念到场景落地信息服务3.07%-5.49%-14.05%N-22.62%-31.18%-39.74%2023/72023/102024/1海通综指2024/4资料来源:海通证券研究所相相 关关 研研 究究计算机行业跟踪周报350期:信创操作系统持续发展,人形机器人落地前景可期期 2 0 2 4.0 8.1 1医疗IT订单月度数据跟踪系列:7月中标订单
2、表现平淡,政策有望加速医疗IT需需 求求 释释 放放 20 2 4.0 8.0 8计算机行业2024024 年8月研究观点:各地政府积极布局,低空经济进入加速落地期期 2 0 2 4.0 8.0 6分析师:杨林Tel:(021)23183969Email:证书:证书:S0850517080008分析师:杨蒙Tel:(021)23185700Email:证书:证书:S0850523090001S0850523090001联系人:朱瑶Tel:(021)23187261Email:联系人:杨昊翊Tel:(021)23185620Email:资源和监督结果。赋能两类实体领域,成本与效益的博弈:赋能两类
3、实体领域,成本与效益的博弈:AIAIAgentAgent目前的应用大多都在概念层面,但随着大模型竞争加快、政策鼓励研发投入、更多企业参与AI 研究等因素,应用层面的AI Agent推进速度加快。智能体大致可以分为六类,根据他们被设计出的特点,可以作用在不同的应用领域上。不同类别的智能体给予应用层面上更多研发方向,像目前关注度较高的自动驾驶技术、智能电网控制、能源管理等都能被垂类智能体覆盖。结合多模态大模型,自动化和情感需求类智能体已落地。但商业化智能体仍需考虑成本问题,由于智能体之间的交互过程可能出现错误循环且输出结果不一定符合需求,tokens成本远高于普通LLMs。人工智能发展迅猛,智能体
4、商业化落地:人工智能发展迅猛,智能体商业化落地:未来多方面推动人工智能发展,应用级别智能体有望快速落地。国内各地相继出台关于人工智能的发展政策,推动其为重要的研究方向。预计 2026 年国内人工智能市场规模超过 260 亿美元,全球人工智能市场规模2025 年超6万亿美元。海外以美国为例,相关政策出台时间较早,人工智能领域发展更加成熟,许多智能体应用已在服务各类企业。并且美国有意与人工智能强国组成战略伙伴,共同发展AI 科技。智能体发展能推动政府、金融、制造、能源、医疗、零售等行业的智能化应用向多模态和跨模态转变。投资建议:投资建议:我们认为未来智能体(AIAI AgentAgent)的前景十
5、分广阔,随着大模型的发展,智能体将从概念走向实际应用,成为各行业的重要助力。通过多模态大模型,智能体能够整合图片、语音等异构数据,提高任务处理效率,并解决跨行业、跨领域的问题。技术方面,智能体具备长期和短期记忆、自主规划、工具使用和自动执行任务的能力。这些能力不仅能提高工作效率,还能为用户提供更好的体验。单智能体通过试错学习适用于简单任务,而多智能体则在复杂环境中通过合作或竞争调整最佳策略。当前,智能体主要应用在自动化和情感需求等领域,但商业化进程仍面临成本挑战,特别是在智能体交互过程中出现的错误循环和高 token消耗问题。另外,中国政府积极推动人工智能的发展,各地相继出台相关政策。预计到2
6、026 年,中国人工智能市场规模将超过260亿美元,将在政府、金融、制造、能源、医疗、零售等多个领域实现智能化应用。结合国家政策支持以及各大企业的积极投入,智能体技术将不断进步,特别是在算力快速增长的背景下,AIAgent的发展前景更加可期。多模态智能体的出现,将进一步推动各行业智能化应用的升级,智能体的商业化将迎来新的突破。建议关注:建议关注:A A I算力、模型和应用:寒武纪-U、海光信息、景嘉微、龙芯中科、浪潮信息、中科曙光、神州数码、软通动力、中国长城、科大讯飞、中控技术、海康威视、大华股份、商汤-W、赛意信息、宝信软件、万兴科技、虹软科技、新致软件、新国都 风险提示:风险提示:1.大
7、模型发展不及预期;2.AI 智能体发展不及预期;3.智能体下游需求不足。思维链铸就智能体,多体交互拓展应用:思维链铸就智能体,多体交互拓展应用:早在上世纪50年代,阿兰图灵把“高度智能有机体”扩展到了人工智能。如今随着大模型的快速发展,这个概念又被重新拾起。大模型成为了智能体目前最完美的载体,有望完成从概念到实际应用的蜕变。用户在Agent(智能体)模式中给 AI 设置目标和身份,并提供PromptPrompt(提示词)。AIAI自主拆分任务、使用工具、完成工作,用户仅负责设立目标、提供工具投资要点:投资要点:行业研究行业研究 信息服务行业信息服务行业2 2请务必阅读正文之后的信息披露和法律声
8、明目目录录1.原理解析:思维链铸就智能体,多体交互拓展应用.61.1Agent 模式架构解析.61.2单智能体 vs 多智能体.71.3 Prompt 提示词的艺术.82.应用场景:赋能两类实体领域,成本与效益的博弈.82.1自动化类:微软智能体 AutoGen.92.2 情感需求类:陪伴型智能体.112.3 效能讨论:成本与价值间的博弈.123.未来展望:人工智能发展迅猛,智能体商业化落地.133.1 海内外政策推动人工智能发展加速.133.2 算力规模高增,企业对 AIGC 的投入意愿强.153.3 多模态智能体有望实现大规模商业化.173.4 全球智能体市场增速加快.184.潜在标的:A
9、gent 企业千帆竞发,垂类应用引人期待.194.1 LeewayHertz:提供多领域解决方案.194.2 Markovate:提供多模态智能体解决方案.214.3 Replika:情感类智能体热度不减.24.4 CharacterAl:自研大模型,打造智能体社区.234.5 星火智能体:布局智能体平台,发布垂类智能体.244.6 SkyAgents:自研模型降低成本自研模型降低成本.254.7 商汤:联合清华、上海人工智能实验室打造GITM.264.8 字节跳动:豆包聊天助手.274.9 腾腾 讯讯:AppAgent.285.投资建议.316.风险提示.32行业研究行业研究 信息服务行业信
10、息服务行业3 3请务必阅读正文之后的信息披露和法律声明图目录图目录图1人类与 AI 的交互模式.6图2AI Agent 智能体工作原理.7图3单智能体强化学习原理图.7图4多智能体强化学习原理图.7图5CrewAI 整体框架.8图6AutoGen 运作模式图解.9图7Agent 交流模式展示.10图8AutoGen 实验数据对比.11图9林间聊愈室产品介绍.12图 10OpenAI 不同模型 tokens 消耗价目表.12图 1 1单次运行 Agent 对 Tokens 的消耗.13图 1 2单次运行 Agent的实际成本.13图1 3 中国人工智能市场规模预测.14图1 4全球人工智能市场规
11、模预测.14图1 5美国增强型人工智能研发投资2015-2030.15图1 6 美国及其 AI盟 友.15图1 7中国智能算力规模及预测.16图 1 8企业 AIAgent 使用情况.16图1 9专注于横向应用的 AI 代理初创企业率先获得融资.17图2 0 多模态大模型发展.18图 2 1全球自主人工智能和智能体市场规模.18图2 2中国前五大人工智能市场应用.19图 2 3LeewayHertz 公司发展历程与合作公司.19图 2 4LeewayHertz 的智能体产品架构.20图 2 5LeewayHertz 为私募股权提供的 AI Agent解决方案.20图 2 6Character.
12、ai 智能体架构.21图 2 7ShopSpot 用户界面展示.21图 2 8ShopSpot 库存管理系统.21图 2 9ShopSpot 多模态智能体图片识别功能展示.22图 3 0Replika 付费模式.22行业研究行业研究 信息服务行业信息服务行业4 4请务必阅读正文之后的信息披露和法律声明图 3 1截止2024年8月Replika 各年龄段用户占比.23图 3 2截止2024年8月Replika 用户全球分布.23图 3 3Character.AI 用户界面.23图 3 4Character.ai 2024年7月每日访问量.24图 3 5Character.AI 各年龄段用户占比.
13、24图 3 6Character.AI用户全球分布.24图 3 7科大讯飞星火智能体介绍.25图 3 8部分星火AI 智能体展示.25图 3 9天工大模型能力展示.26图 4 0天工Agent计费模式.26图 4 1RL架构对比GITM 创新架构.27图 4 2解锁科技树的成功率(蓝色是GITM).27图 4 3各模型完成任务成功率对比.27图 4 4豆包智能体的对话界面.28图 4 5腾 讯AppAgent展示软件操作.29图 4 6AppAgent 的 App 探索学习阶段.30图 4 7AppAgent 的实际部署阶段.31行业研究 信息服务行业5请务必阅读正文之后的信息披露和法律声明表
14、目录表目录表1AI Agent 类型盘点以及具体应用.9表2国内政策推动人工智能发展.13表3海外政策推动人工智能发展.15行业研究 信息服务行业6请务必阅读正文之后的信息披露和法律声明1.1.原理解析:思维链铸就智能体,多体交互拓展应用原理解析:思维链铸就智能体,多体交互拓展应用早在上世纪50年代,阿兰图灵把“高度智能有机体”扩展到了人工智能。如今随着大模型的快速发展,这个概念又被重新拾起。大模型成为了智能体目前最完美的载体,有望完成从概念到实际应用的蜕变。用户在Agent(智能体)模式中给Al 设置目标和身份,并提供 Prompt(提示词)。AI自主拆分任务、使用工具、完成工作,用户仅负责
15、设立目标、提供工具资源和监督结果。OpenAI 定义的智能体具有长期和短期记忆、自主规划、工具使用和自动执行任务的能力,能提高工作效率和用户体验。另外,智能体也分为单智能体和多智能体。单智能体通过试错学习在单一环境中行动,追求最大奖励,多用于简易任务。多智能体在博弈环境中行动,追求长期累积奖励,多用于复杂测试。1.1Agent1.1Agent模式架构解析模式架构解析Agent有效减少人类工作总量,人与AI协作才是最终形态。人类与AI交互可大致分为三种模式。Embedding模式中大模型可以填补一些信息缺失,完成少量子任务,例如总结信息等等。用户最终会整合挑选AI提供的信息,并自主完成任务。Co
16、pilot 模式则更加智能化,Al 可根据用户设定的流程去执行任务。例如让AI根据写一段稿件或者根据需求编程,但其对Prompt 的要求也更高。在AI完成流程后,用户需要对内容结果进行调整并自主结束工作。Agent 智能体模式的AI参与度更高,但也不是完全由AI代理。用户需要给AI设计一个目标和身份,以及需要使用的工具。配上更为复杂的Prompt,AI能自主进行任务拆分,使用工具并结束任务。用户只负责设立目标、提供资源、监督结果。图图1 1 人类与人类与AIAI的交互模式的交互模式Agents模式AI人类完成绝大部分工作人类设立任务目标其中某(几)个流程Al完成初稿其中某(几)个任务AI提供信
17、息或建议人类修改调整确认人类自主结束工作资料来源:腾讯研究院,海通证券研究所任务拆分工具选择进度控制A自主结束工Embedding模式人类自主结束工作Copilot模式设立目标提供资源监督结果AI完成绝大部分工作人类设立任务目标入类和AI协作工作Al全权代理人类人类AIAI以 LLMLLM 为核心,四模块铸造AI Agent。从 OpenAl 的定义来看,智能体以大语言模型为核心,其拥有长期和短期记忆、自主规划能力、能自动化执行复杂任务、能够使用工具等四个特点。1)记忆模块:智能体像人类一样,能留存学到的知识以及交互习惯等,这样的机制能让智能体在处理重复工作时调用以前的经验,从而避免用户进行大
18、量重复交互。短期记忆适用于所有上下文的学习,类似平常我们与ChatGPT沟通的模式;长期记忆则保留知识和交互回忆,例如智能体在特定行业积累的大量数据和经验,则能提供更专业、更具深度和个性化的回答,提升用户体验。2)规划模块:将复杂任务分解成子目标并逐一解决,完成任务后进行反思总结。例如反思自己大量输出重复内容或在单一子目标耗时过长等问题,将经验存入长期记忆以规避类似错误。3)工具模块:智能体可利用工具来弥补自身短板,通过调用外部API来实现功能拓展。例如调用连接互联网的API去搜索实时信息。4)行动模块:智能体会形成完整的计划流程。例如先读取以前工作的经验和记忆,之后规划子目标并使用相应工具去
19、处理问题,最后输出给用户并完成反思。请务必阅读正文之后的信息披露和法律声明行业研究 信息服务行业7图图2 2 AIAI AgentAgent智能体工作原理智能体工作原理日 历()计算器()代码解释器()搜 索()更 多.短期记忆工具智能体长期记忆记忆智能体规划行动交互协作智能体反射自我反思思维链子目标拆解资料来源:腾讯研究院,海通证券研究所1 1.2 2单智能体单智能体 vsvs多多 智智 能能 体体单智能体与多智能体各具优势,适配于不同垂直领域。单智能体的强化学习原理是基于马尔可夫决策来完成的,简单来说可以分为状态集S、行动集A、奖 励R,下一 时刻的状态和奖励只与上一时刻的行动有关,与更早
20、之前的状态无关。其模型原理就是让智能体用试错的方式来学习,若某个策略能得到奖赏,则智能体产生该行为的策略就会加强。其目的就是在单一环境中行动,尽可能得到最大的奖励。应用领域目前也较为广泛,例如赛车游戏中连续动作的训练:控制方向盘、油门、刹车等动作,可由DDPG、A3C、PPO 算法来决策。一些离散动作的训练例如围棋智能体 AlphaGo,可通过Q-Learning 等算法决策。多智能体的决策不仅与自身行动相关,还与系统内其他智能体的行动所关联。一个多智能体系统中会有两个以上的智能体,他们一般存在着合作或竞争关系。这样模型称为马尔科夫博弈,其状态转换符合马尔可夫决策,关系符合博弈。在多智能体模型
21、中每个智能体的目标是找到最优策略来使它在任意状态下获得最大的长期累积奖励。由于其模型更为复杂,干扰因素较多等原因,目前多智能体模型商业化产品较少。图图 3 3 单单 智智 能能 体体 强强 化化 学学 习习 原原 理理 图图Agent智能体行动A环境状态s奖励R资料来源:CSDN,海通证券研究所图图 4 4 多多 智智 能能 体体 强强 化化 学学 习习 原原 理理 图图环境状态8料劝Agent 1状态 s奖励 R2状态s奖励RAgent2Agent n奖励 R1行动An资料来源:CSDN,海通证券研究所CrewAI 是世界领先的多智能体框架之一,在多智能体领域用于协调角色扮演型自主AI智能体
22、。通过促进协作智能,CrewAI使智能体能够无缝协作并处理复杂任务。在编写程序时,用户需要赋予每一位 Agent 角色、任务、以及背景故事。行业研究 信息服务行业8请务必阅读正文之后的信息披露和法律声明图图5 5 CrewAI整体框架整体框架CrewProcesses definehow-How tasks will be assigned to Agents.How agents interact with each other.-Howagentsperformtheirtasks.ProcessTasks can override agentthat should be used an资
23、料来源:CrewAI,CSDN,海通证券研究所Agents have the inertabitityof reachout toanothertodelegateaskguestns.alsothaeasepc0ificagents will work together:AgentAgentAgentTaskTask1.3Prompt提示词的艺术提示词的艺术Prompt 是一种基于自然语言处理的交互方式,它通过机器对自然语言的解析,实现用户与机器之间的沟通。可以理解为是一段给定的文本或语句,用于启动和引导机器学习模型生成类型、主题或格式的输出。在自然语言处理领域中,Prompt 通常由一个问
24、题或任务描述组成,例如“帮我写一篇有关人工智能的文章”,“帮我编写一段可以整理数据的程序”等等。一个优秀的 Prompt 应该包含1)明确目标:能够定义任务,以及想要达到的效果;2)具体指导:给予模型明确的指导和约束,举一些例子或明确回复边界;3)简洁明了:使用简练、清晰的语言表达Prompt;4)迭代优化:一次 Prompt 输出可能达不到想要的结果,用户需要根据智能体的回答来改变提示词,持续调整优化。2.2.应用场景:赋能两类实体领域,成本与效益的博弈应用场景:赋能两类实体领域,成本与效益的博弈AI Agent目前的应用大多都在概念层面,但随着大模型竞争加快、政策鼓励研发投入、更多企业参与
25、AI研究等因素,应用层面的AI Agent推进速度加快。智能体大致可以分为六类,根据他们被设计出的特点,可以作用在不同的应用领域上。不同类别的智能体给予应用层面上更多研发方向,像目前关注度较高的自动驾驶技术、智能电网控制、能源管理等都能被垂类智能体覆盖。结合多模态大模型,自动化和情感需求类智能体已落地。但商业化智能体仍需考虑成本问题,由于智能体之间的交互过程可能出现错误循环且输出结果不一定符合需求,tokens 成本远高于普通LLMs。请务必阅读正文之后的信息披露和法律声明行业研究 信息服务行业9表表1 1 AIAI AgentAgent类型盘点以及具体应用类型盘点以及具体应用AlAl Age
26、ntAgent类型类型具体描述具体描述应用领域应用领域基于效能的Agent基于目标的Agent基于模型的Agent分层Agent机器人Agent多Agent系统基于效用的Agent在具有多种潜在结果的复杂决策环境中表现出色-比如平衡不同风险以做出投资决策,或者 金融交易、价格追踪系统、智权衡价格与成本。基于目标的Agent会评估和规划行动,以实现它们的目标。与其他类型的智能Agent不同的是,它们能够将前瞻性和战略规划结合起来,朝着特定的结果前进。能电网控制扫地机器人、项目管理软件、电子游戏适用于并非总是可见或可预测的信息时。这个模型会根据环境中传入的数据不断更新,因此人工智能Agent可以对
27、环境中未见的部分进行推断,并预测未来的状况。自动驾驶技术、自动灌溉、智能家居分层Agent类似于复杂的组织结构,具有不同的决策层次。系统中的不同Agent拥有不同的专业领域,这使它们在处理复杂的多步骤任务时更加高效。空中交通管制系统、自主仓储机器人增加了性能元素,这些人工智能Agent的实体通常配备有摄像头或触摸传感器等传感器。这种Agent在危险或重复性很高的任务中尤其有用-让人工智能Agent来完成这些任务可能更有效率,也更符合成本效益。生产线机器人、手术机器人、农业机器人、服务机器人每个Agent都是半自主运行的,但其设计目的是与其他Agent互动,形成一个动态的生态系统,从个体行为中产
28、交通管理系统、用于能源管理生集体行为。对于这种Agent程序来说,协作是关键。的智能电网、供应链与物流2.12.1自动化类:微软智能体自动化类:微软智能体 AutoGenAutoGen微软研发的AutoGen是一种多智能体沟通的模型,这些智能体通过对话完成任务。实验发现这种多智能体沟通模式可以有效提高AI 解决问题的准确性以及成果的完整性。使用AutoGen,开发者可以灵活定义智能体交互行为。微软的研究证明了该框架在包括解决数学、编码、问题解答、运筹学、在线决策、娱乐等问题上的有效性。AutoGen需要两个以上的智能体形成交流模式,其中智能体可以由大语言模型LLMs、人类、工具来扮演。当一个需
29、求被提出,智能体会开始灵活交流,他可以是多个智能体向需求人汇报的模式(HierarchicalChat)或者是像研讨会一样随意讨论(JointChat)。在官方给出的示例中,智能体之间的沟通确实减少了人工交互,其有能力自己修复出现的问题并给出满意的答案。图图6A u t o G e n运运 作作 模模 式式 图图 解解ConversableagentsMonthMulti-AgentConversationsGot it!Here is theOutput:%JointchatHierarchicalchatSorry!Pleasefirstpip install yfinanceand th
30、en executethe codeError packageyfinanceishotinstalledPlotachartofMETAandTESLAstock price changeYTD.Execute thefollowing code.No,please plot%revised code.Installingchange!Output:MonthAgentCustomizationFlexible Conversation PatternsExampleAgent Chat资料来源:Enabling Next-GenLLMApplicationsvia Multi-AgentC
31、onversation,CSDN,海通证券研究所资料来源:botpress,海通证券研究所行业研究 信息服务行业10请务必阅读正文之后的信息披露和法律声明在AutoGen智能体程序中,人类充当需求发起者,智能体通过不断使用工具并在相互交流中解决陆续出现的问题从而得到最终答案。在智能体交流过程中,人类可随时介入其中,若用户对最终结果不满意,可以重新提出需求,智能体就会继续优化答案。图图 7 7A A g g e e n n t t 交交 流流 模模 式式 展展 示示TheResulting Automated Agent Chat:Conversation-DrlvenPlot a chart
32、of META andTESLA stock price change YTD.receivegenerate_replygenerate_replyBthon工 具sendConversation-CentricComputationError:package yfinance is notinstalledAoent自己解决问题,0人工介入Sorry!PleasefirstpipinstallyfinanceandthenexecuteExecutethefollowingcode.generate_replyreceive人县供需Control Flowend资料来源:Enabling
33、Next-GenLLM Applications via Multi-Agent Conversation,CSDN,海通证券研究所AutoGen在四项实战应用的表现测试中均胜过单一大语言模型,实验发现智能体能增加AI完成任务的成功率以及模型的稳定性。1)数学计算:分别测试了AI在完成整个数学题库和随机120 道题目的表现,AutoGen 的成功率远超各类语言模型。2)数据库检索问答:先建立一个RAG数据库,然后对智能体进行问答测试,看其能否追踪到正确的答案。其F1-scoreF1-score越高,说明模型更稳定;RecallRecall体现了分类模型对样本的识别能 力。Recall越高,说明
34、模型对样本的识别能力越强。从数据看出纯 AutoGen 模型的表现略高于其他组合。3)ALFWorld(AdaptiveLearningFrameworkWorld)研究:ALFWorld是专门用于研究和开发智能体的仿真环境,在其虚拟世界中,包含了各种场景、任务和智能体需要完成的挑战。ALFWorldALFWorld 实验发现3个智能体的成功率高于2个智能体,说明随着交互的智能体变多,智能体间互相纠错的能力有所提升。但对于AutoGen 的实验也提到多智能体可能会导致错误循环(智能体之间反馈错误但一直无法解决),这也是降低成功率的因素之一。一。4)4)OptiGuide:是专门设计来通过自然语
35、言处理,解读和指导复杂供应链优化决策。在用不同语言模型运行OptiGuide的时,发现多智能体协作模式的成绩显著高于单智能体。其中多GPTGPT4 4智能体协作运行 OptiGuide时,F1-score 和 Recall 分别能达到96%96%和 9 8%。ProgramExecution行业研究 信息服务行业11请务必阅读正文之后的信息披露和法律声明图图8A u t o G e n实实 验验 数数 据据 对对 比比MethodsMetrics(b)A2:Q&Atasks(w/GPT-3.5).Metrics(c)A3:Performance on ALFWorld.(d)A4:Perfor
36、mance on OptiGuide.资料来源:Enabling Next-Gen LLM Applications via Multi-Agent Conversation,海通证券研究所2.22.2情感需求类:陪伴型智能体情感需求类:陪伴型智能体智能体另一大应用领域就是提供拟人情感陪伴类服务。陪伴类的智能体拥有长期记忆,让用户与其聊天中产生熟悉且亲切的感觉。随着大模型不断迭代,陪伴类智能体更加立体,能提供更高的情绪价值。目前国内情绪消费类市场潜力较大,在如今紧凑的生活节奏之下,国民孤独感增加,而陪伴类智能体或受益于这样的大环境。根据GIA(GlobalIndustry Analysts)的
37、研究,Denny Yin提出该行业规模预计到2024年增长到1000亿美元,到2026年增长到2000亿美元。情感沟通类智能体上线,收获大量用户好评。在大模型出现之前,一些利用心理学CBT 沟通技术的产品已经在市面上广泛存在,例如Weobot、wysa 等。随着大模型的发展和迭代,智能体已经能被打造成心理咨询师或塔罗师的角色。用户通过倾诉生活中的烦恼,并在与智能体沟通中寻求情绪宣泄。目前一款治愈系的软件“林间聊愈室”上线后获得了大量好评,App Store评分4.7,多数用户给出了五星好评。其中产品使用小动物的角色设定降低了用户的戒备心,加上治愈的画风和场景设计,打造独特的用户体验。(a)A1
38、:PerformanceonMATH(w/GPT-4).Methods行业研究 信息服务行业12请务必阅读正文之后的信息披露和法律声明图图9 9林间聊愈室产品介绍林间聊愈室产品介绍资料来源:App Store,海通证券研究所2.32.3效能讨论:成本与价值间的博弈效能讨论:成本与价值间的博弈打造智能体并不是0成本,大语言模型的token 消耗就是最直观的成本展示。由于智能体的运行机制内包含反思和深度学习,这使得其在token 消耗方面比传统大语言模型高。相比于单智能体,多智能体又多了一层交互端的消耗,当多个智能体讨论且进入错误循环中,无效成本将会显著提升。所以在效能方面,对智能体进行成本讨论以
39、及优化策略十分重要。在商用智能体中,更先进的大语言模型代表更好的用户体验,但随之而来的是极速上升的成本。目前GPT4的价格是GPT3.5turbo的十倍,而且由于智能体之间交互的特性,在输出过程中往往伴随着更高的token 消耗。若最终输出的长度超出模型token限制,则不得不调用更高版本的模型例如GPT4-32K,成本又是GPT4的两倍。图图1010 OpenAI 不同模型不同模型tokens消耗价目表消耗价目表Modelgpt-4oModelgpt-3.5-turbo-0125资料来源:OpenAl,海通证券研究所PricingUS$0.0050/1K input tokensUS$0.0
40、150/1Koutput tokensPricingUS$0.00050/1KinputtokensUS$0.00150/1Koutputtokens在实际测试中,使用搭载GPT4 的智能体模型查找新闻并进行总结梳理。这部分的单次消耗是42000个 tokens,成本是1.5美元。在实际应用中,假设一天需要统计的股票新闻大约有120家公司,则成本为35.8美元,按照汇率1:7.14折合人民币255.5元。而且智能体并不是完美的,在运行过程中出现幻觉或错误循环也是常事。例如智能体在找不到合适新闻的时候会进行大量重复的内容输出,人工介入纠错又会增加一定成本。请务必阅读正文之后的信息披露和法律声明行
41、业研究 信息服务行业13图图1111单次运行单次运行AgentAgent 对对 TokensTokens 的消耗的消耗图图1212单次运行单次运行Agent 的实际成本的实际成本Tokens60K16Jul ContexttokensGeneratedtokens0-01Ju41,59941,599 tokens33,591 tokens8,008tokens31JulGPT-4$216 JulDefaultProjectS07Jul13Jui$1.4919Jul$1.4925JuiJul资料来源:OpenAI,海通证券研究所资料来源:OpenAI,海通证券研究所商业化智能体在成本和最终产品中
42、会有一定博弈,若将智能体运用到股票交易等对精准度需求极高的行业中,产品或引入更多智能体进行协作以提高模型的稳定性,则成本上升。如果运行成本高于其创造的价值时,该智能体模型就失去了商业化的能力。目前多数智能体应用仅停留在测试阶段,市场中的用户需要更理性的看待智能体商业发中能带来的效益。3 3.未未来来展展望望:人人工工智智能能发发展展迅迅猛猛,智智能能体体商商业业化化落落地地未来多方面推动人工智能发展,应用级别智能体有望快速落地。国内各地相继出台关于人工智能的发展政策,推动其为重要的研究方向。预计2026年国内人工智能市场规模超过260亿美元,全球人工智能市场规模2025年超6万亿美元。海外以美
43、国为例,相关政策出台时间较早,人工智能领域发展更加成熟,许多智能体应用已在服务各类企业。并且美国有意与人工智能强国组成战略伙伴,共同发展AI科技。多模态大模型利用异构数据提升应用效率,促进AI Agent发展。将智能体赋能于图片+语音的多模态大模型中,可以减少使用工具和交互的过程,使智能体完成更多复杂任务,解决跨行业、跨领域的问题。智能体发展能推动政府、金融、制造、能源、医疗、零售等行业的智能化应用向多模态和跨模态转变。3.13.1 海内外政策推动人工智能发展加速海内外政策推动人工智能发展加速多地陆续出台关于人工智能发展的指导文件,2024年政府与企业的投入资金有望迎来大幅增长。国务院在202
44、4政府工作报告中提出,要开展“人工智能+”行动,实施数字化转型。智能体作为人工智能应用领域的重要研究方向,相信众多企业和研究部门会开展更多研究工作。另外,像上海、杭州、广东、北京等省市也出台了相关政策,其中杭州市推出“算力券”约2.5亿用于支持本地的算力发展。广东省也将算力作为重点发展方向,预测2025年的人工智能核心产业规模超过3000亿元。表表2 2国内政策推动人工智能发展国内政策推动人工智能发展政府机构政府机构上海市经济和信息化委员会、上海市发展和改革委员会等五部门国务院文件名称文件名称发布时间发布时间具具体内容体内容实施大模型创新扶持计划。支持引进高水平创新企业,支持本市创新主体打造具
45、有国际竞争力的大模型,鼓励形成数据飞轮,加速模型迭代,对取得重大成果的予以专项奖励。实施大模型示范应用推进计划。重点支持在智能制造、生物医药、集成电路、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景,打造标杆性大模型产品和服务。深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际2024政府工作报告2024年3月竞争力的数字产业集群。实施制造业数字化转型行动,加快工业互联网规模化应用,推进服务业数字化,建设智慧城市、数字乡村上海市推动人工智能大模型创新发展若干措施(2023-2025年)2023年10月$0.530KHAITONGHAITO
46、NG行业研究 信息服务行业1414请务必阅读正文之后的信息披露和法律声明杭州市人民政府广东省人民政府办公厅关于支持人工智能全产业链高质量发展的补充意见(征求意见稿)广东省关于人工智能赋能千行百业的若干措施2024年5月2024年6月1)支持算力技术攻关。鼓励企业开展算力关键技术研发攻关,市级科技研发计划给予专项支持。鼓励企业承担国家、省重点研发任务,加速形成重大科研成果,对符合政策规定的项目按国家、省实际到账资助经费的25%给予资助,资助金额最高不超过500万元。2)加大融资贴息支持。对纳入政府统一布局的算力基础设施建设项目(总投资规模不低于5000万元)3)扩容算力券发放。每年设立“算力券”
47、总额提升至2.5亿元,新增算力券支持企业购买符合杭州市规划布局的智算中心以及纳入算力撮合的合作伙伴所供给的智能算力。到2025年,全省算力规模超过40EFLOPS,人工智能核心产业规模超过3000亿元。到2027年,全省人工智能产业底座进一步夯实,算力规模超过60EFLOPS,全国领先的算法体系和算力网络体系基本形成;智能终端产品供给丰富,在手机、计算机、家居、机器人等8大门类,打造100款以上大规模使用的智能终端产品,人工智能核心产业规模超过4400亿元;聚焦制造、教育、养老等领域,打造500个以上应用场景,各行各业劳动生产率显著提升。资料来源:上海市经济和信息化委员会,国务院,杭州市人民政
48、府,广东省人民政府,中国政府网,新华社,海通证券研究所中国人工智能市场份额稳定增长,未来AI 实体项目增多利好智能体发展。根据IDC预测,国内人工智能市场规模预计在2026年达到264.4亿美元,2021年到2026年期间的CAGR 超20%。根据增长率计算,从2022年开始,每年市场规模会保持20%左右的稳定增长态势。根据澎湃新闻援引德勤统计,未来2025年世界人工智能市场规模将超过6万亿美元,2017年-2025年期间复合增长率将超30%。AI高速发展中或利好更多实体企业,专门提供智能体产品服务的厂商规模也将快速扩张。图图1313中国人工智能市场规模预测中国人工智能市场规模预测300264
49、.42 2.1%p0.6%20%180.115%122.410%100500202120222023E市场份额(左亿美元)资料来源:IDC,海通证券研究所图图1414全球人工智能市场规模预测全球人工智能市场规模预测6.45.7364.483.53.042.431.91.180.6910201720182019E2020E2021E2022E2023E2024E市场规模(左万亿美元)一yoy(右资料来源:德勤,澎湃新闻,海通证券研究所美国相关政策落地较早,人工智能发展已成规模。在2021年3月,大模型还未进入公众视野时,美国人工智能国家安全委员会已经发布了对该领域未来发展的规划。文件中写到了美国
50、坚定在人工智能领域的投入,且规定了研发投入资金的比重。另外,在2023年5月,美国白宫发布国家人工智能研发战略计划,对之前提出的8项重点战略目标进行了优化和完善,同时强调了人工智能领域国际交流的重要性。另外,文件还80%70%60%50%40%30%20%10%0%250200150一yoy(右%)5%0%54322025E2024E20.5%21.7%2025E2026E17.9%219.2103.8147.525%7请务必阅读正文之后的信息披露和法律声明行业研究 信息服务行业15对比了2020年发布计划中的各项指标与实际指标差距,并针对细分领域加强研发投入。表表3 3海外政策推动人工智能发
51、展海外政策推动人工智能发展政府机构政府机构美国人工智能国家安全委员会美国白宫文件名称文件名称NSCAI最终报告国家人工智能研发战略计发布时间发布时间2021年3月2023年5月具体内容具体内容美国国家人工智能安全委员会(NSCAI)的任务是向总统和国会提出建议,以“推进人工智能、机器学习发展以全面解决美国国家安全和国防需求的相关技术。”在设立本委员会时,2019财年约翰 S 麦凯恩国防授权法案第1051节指示NSCAI从国家竞争力的角度审视人工智能及其维持技术优势的手段、国际合作和竞争力的趋势、促进基础和先进研究投资的方式、劳动力和培训、军事使用的潜在风险、伦理问题、建立数据标准和激励数据共享
52、,以及人工智能的未来发展等方方面面。该计划是对2016、2019年版国家人工智能研发战略计划的再次更新,重申了之前的8项战略目标并对各战略的具体优先事项进行了调整和完善,同时增加了新的第9项战略以强调国际合作。此外,该报告还提出要评估联邦机构对2020年国家人工智能倡议法案(NAlIA)和国家人工智能研发战略计划的实施情况。资料来源:清华大学人工智能国际治理研究院,安全内参,海通证券研究所美国增强型人工智能投资研发保持高增速,AI 战略联盟强大。2024年美国在该方面的投入预计为15亿美元,NSCAI 希望在2025年把这一数字提高到80亿美元,增幅高达433%。且在2025年之后,保持每年投
53、入增长80亿美元的趋势。最高预计在2030年投入高达350亿美元。美国强调了AI 盟友的概念,与澳大利亚、加拿大、英国、日本等国家构建人工智能战略伙伴关系,未来将会吸引更多AI强国加入联盟当中。图图1515美国增强型人工智能研发投资美国增强型人工智能研发投资2015-20302015-2030SohenedAIRAD50170资料来源:清华大学人工智能国际治理研究院,海通证券研究所tment.FY2015-2030图图 1 1 6 6 美美 国国 及及 其其 A A I I 盟盟 友友资料来源:清华大学人工智能国际治理研究院,海通证券研究所3.23.2算力规模高增,企业对算力规模高增,企业对
54、AIGC的投入意愿强的投入意愿强2021年中国的智能算力规模为155.2 EFLOPS(每秒百亿亿次浮点运算)。据IDC预测,规模将在2026年达到ZFLOPS 级别(每秒十万亿亿次浮点计算)。预计在2021-2026年期间,智能算力增长的CAGR 为52.3%。随着算力规模的大幅增长,将会带动AI技术快速发展。根据中国信通院的测算,每在算力中投入1元,将带动3-4元的经济产出。在智能体发展中,更强的算力能支持更复杂的模型计算并且给予其更快的响应速度。当大模型能快速迭代,AI Agent将会有更强力的基座,相同运行模式下或能显著提升F1-score和 Recall水平。行业研究 信息服务行业1
55、6请务必阅读正文之后的信息披露和法律声明图图1717中国智能算力规模及预测中国智能算力规模及预测140012001000800600400200031.72019752020427268155.2202120222023EFLOPS(左 百 亿 亿 次/秒)922.8640.720242025yoy(右%)1271.42026160.0%140.0%120.0%100.0%80.0%60.0%40.0%20.0%0.0%资 料 来 源:新 华 网、经 济 日报、国 家 自 然 科 学 基金 委 员 会,IDC 与 浪潮 信 息 2 0 2 2-2 0 2 3 中 国人 工 智 能 计 算 力
56、发展评估报告 ,海通 证 券 研 究 所根据IDC 统计,2023年已有34%的企业在 AI 中的投入已见成效,AI 能力正在稳步发展。AIAgent目前多为企业自研,仅有少部分企业将Agent 融入真正工作中,若AI Agent能在未来用低成本撬动高效益,则会引起越来越多的企业重视。定制化AIAI AgentAgent或成为一片蓝海市场,拥有成熟技术和一揽子解决方案的企业能占据大量市场份额。图图1 8企企 业业A IA g e n t使使 用用 情情 况况图 1 3 企 业AIAgent的 应 用 情 况实 现 了AIAgent常 态 化,AIAgent已经参与到企业招聘、销售、人事等各项业
57、务流程中AIAgent已经成熟运用于某 一 具体业务流程 已经在某项工作中进行了AIAgent试 点正在制定AIAgent应 用 计 划不了解或尚未考虑来源:IDC,2023资 料 来 源:IDC与钉钉2024 AIGC应 用 层 十 大 趋 势 白 皮 书 ,海 通 证 券 研 究 所风险投资青睐的智能体初创企业聚焦于横向应用领域,广泛涉及销售、客户支持及企业级与常规生产力工作流程优化。当前市场上专注于垂直行业特定应用的初创公司仍属少数,大部分代理技术开发的新兴企业主要面向企业客户,而非个人消费者。这些Agent 初创公司希望用技术取代SDR、软件工程师、合规分析专家、客户服务专员等多个职位
58、的职能。这一趋势的影响力将极为广泛且深远,不仅限于日常工作中对公司员工的增加或取代,更会改变公司面向外界客户的交互形象,或使企业的运营方式与客户体验发生改变。行业研究 信息服务行业17请务必阅读正文之后的信息披露和法律声明图图1919专注于横向应用的专注于横向应用的 AI代理初创企业率先获得融资代理初创企业率先获得融资Al agent startups focusing on horizontal applications takefunding leadDlsclosed equlty funding&deals since2022(asof 7/29/2024)$1,548MHorizon
59、tal70 deok$220MVertical9dealNote fcudes OpnAL ncudes tondng to companies dnvtloping sgents withvaying degees af atonomyCBINSIGHTS资料来源:点滴科技资讯公众号,海通证券研究所3 3.3.3多模态智能体有望实现大规模商业化多模态智能体有望实现大规模商业化多模态大模型能利用大量异构的数据资源提升应用的效率和能力上限,同时也利好AIAgent发展。多模态的概念或能提高智能体的工作效率,例如将其赋能于一个能形成图片+语音的多模态大模型中,单个智能体能完成更多复杂的任务,有效的