在本文中,您将了解为什么短期上下文对于自主代理来说是不够的,以及如何设计长期记忆,使它们在较长的时间内保持可靠。
我们将讨论的主题包括:
- 情景记忆、语义记忆和程序记忆在自主主体中的作用
- 这些内存类型如何交互以支持跨会话的实际任务
- 如何为您的用例选择实用的内存架构
让我们开始吧。
超越短期记忆:AI 代理所需的 3 种长期记忆
作者提供的图片
如果您构建过聊天机器人或使用过语言模型,那么您已经熟悉人工智能系统如何在单个对话中处理内存。该模型会跟踪您所说的内容、维护上下文并做出连贯的响应。但谈话结束后,这段记忆就消失了。
这对于回答问题或进行孤立的交互非常有效。但是,那些需要自主运行数周或数月的人工智能代理又如何呢?代理可以在多个会话中安排任务、管理工作流程或提供个性化建议?对于这些系统,基于会话的内存是不够的。
该解决方案反映了人类记忆的工作原理。我们不只是记住对话。我们记得经历(上周二那场尴尬的会议)、事实和知识(Python 语法、公司政策)以及学到的技能(如何调试代码、如何构建报告)。每种类型的记忆都有不同的用途,它们一起使我们能够随着时间的推移有效地发挥作用。
人工智能代理也需要同样的东西。构建能够从经验中学习、积累知识和执行复杂任务的代理需要实现三种不同类型的长期记忆:情景记忆、语义记忆和程序记忆。这些不仅仅是理论类别。它们是实用的架构决策,决定您的代理是否可以真正自主运行,或者仍然仅限于简单、无状态的交互。
为什么短期记忆会遇到困难
大多数开发人员都熟悉人工智能系统中的短期记忆。它是上下文窗口,让 ChatGPT 在单个对话中保持连贯性,或者是滚动缓冲区,帮助您的聊天机器人记住您在三条消息之前所说的内容。短期记忆本质上是人工智能的工作记忆,对于即时任务很有用,但范围有限。
将短期记忆想象成计算机中的 RAM。一旦你关闭应用程序,它就消失了。当会话结束时,你的人工智能代理就会忘记一切。对于基本的问答系统,这种限制是可以管理的。但对于需要在几天、几周或几个月内独立发展、适应和运作的自主代理呢?短期记忆还不够。
即使非常大的上下文窗口也只能暂时模拟内存。如果没有外部存储层,它们就不会在会话中持续、积累或改进。
获得关注的代理(推动采用的代理 代理人工智能框架 和 多智能体系统)需要一种不同的方法:持续、学习和指导智能行动的长期记忆。
长期代理记忆的三大支柱
人工智能代理的长期记忆有多种形式。自主代理需要三种不同类型的长期记忆,每种都有独特的用途。每种内存类型都回答自主代理必须处理的不同问题: 之前发生了什么?我知道什么?我该怎么做?
情景记忆:从经验中学习
情景记忆允许人工智能代理回忆其操作历史中的特定事件和经历。它存储发生的事情、发生时间以及结果。
考虑一位人工智能财务顾问。有了情景记忆,它不仅能了解一般的投资原则,还能了解一般的投资原则。它记得三个月前,它向用户 A 推荐了一个科技股投资组合,但该推荐表现不佳。它回忆说,用户 B 忽视了其关于多元化的建议,后来后悔了。这些具体经验以一般知识无法做到的方式为未来的建议提供信息。
情景记忆将智能体从反应系统转变为能够从自身历史中学习的系统。当你的智能体遇到新情况时,它可以在情景记忆中搜索类似的过去经历,并根据之前有效(或无效)的方法调整其方法。
这种内存类型通常使用 矢量数据库 或其他持久存储层,可以跨过去的情节进行语义检索。即使细节不同,代理也可以找到概念上与当前情况相似的体验,而不是完全匹配。
在实践中,情景记忆存储交互的结构化记录:时间戳、用户标识符、采取的操作、环境条件和观察到的结果。这些事件成为智能体在做出决策时参考的案例研究,从而实现了一种随着时间的推移而变得更加完善的基于案例的推理。
语义记忆:存储结构化知识
情景记忆是关于个人经历的,而语义记忆则存储事实知识和概念理解。这是智能体推理世界所需的事实、规则、定义和关系。
法律人工智能助手严重依赖语义记忆。它需要知道合同法与刑法不同,某些条款是就业协议中的标准条款,并且特定的先例适用于特定的司法管辖区。这些知识并不与其所处理过的特定案例(即情景性案例)相关,而是广泛适用的一般专业知识。
语义记忆通常使用结构化知识图或关系数据库进行建模,其中可以查询和推理实体及其关系。也就是说,许多代理还在向量数据库中存储非结构化领域知识,并通过 RAG 管道检索它。当代理人需要知道“组合这些药物有什么副作用?”时或者“API 身份验证的标准安全实践是什么?”,它正在查询语义记忆。
情景记忆和语义记忆之间的区别对于自主主体很重要。情景记忆告诉代理“上周二,当我们尝试与客户 Y 联系 X 时,由于 Z 而失败了。”语义记忆告诉智能体“当条件 A 和 B 存在时,方法 X 通常效果最好。”两者都很重要,但它们具有不同的认知功能。
对于在专门领域工作的代理来说,语义记忆通常与 RAG系统 引入不属于基本模型训练一部分的特定领域知识。这种组合使代理能够保持深厚的专业知识,而不需要大量的模型重新训练。
随着时间的推移,从情景记忆中提取的模式可以被提炼成语义知识,从而使智能体能够超越个人经验进行概括。
程序记忆:自动化专业知识
程序记忆在人工智能代理设计中经常被忽视,但它对于需要执行复杂、多步骤工作流程的代理来说至关重要。这是代理可以不经深思熟虑地自动执行的学习技能和行为模式。
想想你是如何学会触摸打字或驾驶汽车的。最初,每个动作都需要集中注意力。随着时间的推移,这些技能变得自动化,释放你的意识来完成更高级别的任务。人工智能代理中的程序记忆的工作原理类似。
当客户服务代理第一百次遇到密码重置请求时,程序记忆意味着它不需要每次都从头开始推理整个工作流程。步骤序列(验证身份、发送重置链接、确认完成、记录操作)成为可靠执行的缓存例程。
程序记忆并不能完全消除推理。它减少了重复性的思考,因此推理可以集中在新的情况上。
这种类型的记忆可以通过强化学习、微调或明确定义的编码最佳实践的工作流程来形成。随着代理获得经验,经常使用的程序会转移到程序内存中,从而缩短响应时间并减少计算开销。
对于执行复杂任务的自主代理,程序内存可以实现平滑的编排。处理您旅行预订的代理不仅了解有关航空公司的事实(语义)或记住您过去的旅行(情景),它还知道 如何 执行搜索航班、比较选项、预订和协调确认的多步骤流程。
三种内存类型如何协同工作
所有三种内存类型在集成时都能发挥最佳性能。考虑一个自主人工智能研究助理,其任务是“准备可再生能源投资的市场分析报告”。

情景记忆 回忆起上个月,在为半导体行业创建类似的分析时,该用户对纳入监管风险评估表示赞赏,并发现技术术语令人反感。代理还记得哪些数据源被证明是最可靠的,以及哪些可视化格式产生了最好的反馈。
语义记忆 提供事实基础:不同可再生能源类型的定义、当前市场估值、行业主要参与者、不同国家的监管框架以及能源政策和投资趋势之间的关系。
程序记忆 指导执行:代理自动知道从市场规模开始,然后进行竞争格局分析,然后进行风险评估,最后提出投资建议。它知道如何构建章节、何时包含执行摘要以及引用来源的标准格式。
如果没有这三者一起工作,特工的能力就会下降。如果没有一般知识,仅情景记忆就会使其过于个性化。仅靠语义记忆就可以使其知识渊博,但无法从经验中学习。仅凭程序记忆就可以使其擅长执行编程任务,但在遇到新情况时却不够灵活。
为您的用例选择正确的内存架构
并非每个自主代理都需要同等重视所有三种记忆类型。正确的内存架构取决于您的具体应用。
为了 个人人工智能助理 注重用户个性化,情景记忆最为重要。这些代理需要记住您的偏好、过去的互动和结果,以提供日益定制的体验。
为了 领域专家代理 在法律、医学或金融等领域,语义记忆最为重要。这些代理需要深入的、结构化的知识库,以便他们能够可靠地查询和推理。
为了 工作流程自动化代理 对于处理重复过程,程序记忆是关键。这些代理从可以大规模执行的学习例程中获益最多。
许多生产系统(特别是那些构建在诸如 郎图 或者 船员人工智能)实施混合方法,根据需要处理的任务组合多种内存类型。
前进的道路
随着我们深入进入代理人工智能时代,内存架构将把有能力的系统与有限的系统分开。改变我们工作方式的代理不仅仅是具有更好提示的语言模型。它们是具有丰富、多方面记忆的系统,可以实现真正的自主性。
对于回答问题的聊天机器人来说,短期记忆就足够了。长期记忆(情景记忆、语义记忆和程序记忆)将这些聊天机器人转变为能够在较长时间尺度内学习、记忆和智能行动的代理。
高级语言模型、向量数据库和内存架构的融合正在创建人工智能代理,它们不仅能处理信息,还能随着时间的推移积累智慧和专业知识。
对于机器学习从业者来说,这种转变需要新的技能和新的架构思维。设计有效的代理不再仅仅涉及即时工程。这是有意决定的 智能体应该记住什么,应该如何记住,以及记忆何时影响行动。这就是人工智能领域目前最有趣的工作正在进行的地方。

