超越短期记忆：AI 代理所需的 3 种长期记忆

在本文中，您将了解为什么短期上下文对于自主代理来说是不够的，以及如何设计长期记忆，使它们在较长的时间内保持可靠。

我们将讨论的主题包括：

情景记忆、语义记忆和程序记忆在自主主体中的作用
这些内存类型如何交互以支持跨会话的实际任务
如何为您的用例选择实用的内存架构

让我们开始吧。

超越短期记忆：AI 代理所需的 3 种长期记忆
作者提供的图片

如果您构建过聊天机器人或使用过语言模型，那么您已经熟悉人工智能系统如何在单个对话中处理内存。该模型会跟踪您所说的内容、维护上下文并做出连贯的响应。但谈话结束后，这段记忆就消失了。

这对于回答问题或进行孤立的交互非常有效。但是，那些需要自主运行数周或数月的人工智能代理又如何呢？代理可以在多个会话中安排任务、管理工作流程或提供个性化建议？对于这些系统，基于会话的内存是不够的。

该解决方案反映了人类记忆的工作原理。我们不只是记住对话。我们记得经历（上周二那场尴尬的会议）、事实和知识（Python 语法、公司政策）以及学到的技能（如何调试代码、如何构建报告）。每种类型的记忆都有不同的用途，它们一起使我们能够随着时间的推移有效地发挥作用。

人工智能代理也需要同样的东西。构建能够从经验中学习、积累知识和执行复杂任务的代理需要实现三种不同类型的长期记忆：情景记忆、语义记忆和程序记忆。这些不仅仅是理论类别。它们是实用的架构决策，决定您的代理是否可以真正自主运行，或者仍然仅限于简单、无状态的交互。

为什么短期记忆会遇到困难

大多数开发人员都熟悉人工智能系统中的短期记忆。它是上下文窗口，让 ChatGPT 在单个对话中保持连贯性，或者是滚动缓冲区，帮助您的聊天机器人记住您在三条消息之前所说的内容。短期记忆本质上是人工智能的工作记忆，对于即时任务很有用，但范围有限。

将短期记忆想象成计算机中的 RAM。一旦你关闭应用程序，它就消失了。当会话结束时，你的人工智能代理就会忘记一切。对于基本的问答系统，这种限制是可以管理的。但对于需要在几天、几周或几个月内独立发展、适应和运作的自主代理呢？短期记忆还不够。

即使非常大的上下文窗口也只能暂时模拟内存。如果没有外部存储层，它们就不会在会话中持续、积累或改进。

获得关注的代理（推动采用的代理 代理人工智能框架 和 多智能体系统）需要一种不同的方法：持续、学习和指导智能行动的长期记忆。

长期代理记忆的三大支柱

人工智能代理的长期记忆有多种形式。自主代理需要三种不同类型的长期记忆，每种都有独特的用途。每种内存类型都回答自主代理必须处理的不同问题： 之前发生了什么？我知道什么？我该怎么做？

情景记忆：从经验中学习

情景记忆允许人工智能代理回忆其操作历史中的特定事件和经历。它存储发生的事情、发生时间以及结果。

考虑一位人工智能财务顾问。有了情景记忆，它不仅能了解一般的投资原则，还能了解一般的投资原则。它记得三个月前，它向用户 A 推荐了一个科技股投资组合，但该推荐表现不佳。它回忆说，用户 B 忽视了其关于多元化的建议，后来后悔了。这些具体经验以一般知识无法做到的方式为未来的建议提供信息。

情景记忆将智能体从反应系统转变为能够从自身历史中学习的系统。当你的智能体遇到新情况时，它可以在情景记忆中搜索类似的过去经历，并根据之前有效（或无效）的方法调整其方法。

这种内存类型通常使用 矢量数据库 或其他持久存储层，可以跨过去的情节进行语义检索。即使细节不同，代理也可以找到概念上与当前情况相似的体验，而不是完全匹配。

在实践中，情景记忆存储交互的结构化记录：时间戳、用户标识符、采取的操作、环境条件和观察到的结果。这些事件成为智能体在做出决策时参考的案例研究，从而实现了一种随着时间的推移而变得更加完善的基于案例的推理。

语义记忆：存储结构化知识

情景记忆是关于个人经历的，而语义记忆则存储事实知识和概念理解。这是智能体推理世界所需的事实、规则、定义和关系。

法律人工智能助手严重依赖语义记忆。它需要知道合同法与刑法不同，某些条款是就业协议中的标准条款，并且特定的先例适用于特定的司法管辖区。这些知识并不与其所处理过的特定案例（即情景性案例）相关，而是广泛适用的一般专业知识。

语义记忆通常使用结构化知识图或关系数据库进行建模，其中可以查询和推理实体及其关系。也就是说，许多代理还在向量数据库中存储非结构化领域知识，并通过 RAG 管道检索它。当代理人需要知道“组合这些药物有什么副作用？”时或者“API 身份验证的标准安全实践是什么？”，它正在查询语义记忆。

情景记忆和语义记忆之间的区别对于自主主体很重要。情景记忆告诉代理“上周二，当我们尝试与客户 Y 联系 X 时，由于 Z 而失败了。”语义记忆告诉智能体“当条件 A 和 B 存在时，方法 X 通常效果最好。”两者都很重要，但它们具有不同的认知功能。

对于在专门领域工作的代理来说，语义记忆通常与 RAG系统 引入不属于基本模型训练一部分的特定领域知识。这种组合使代理能够保持深厚的专业知识，而不需要大量的模型重新训练。

随着时间的推移，从情景记忆中提取的模式可以被提炼成语义知识，从而使智能体能够超越个人经验进行概括。

程序记忆：自动化专业知识

程序记忆在人工智能代理设计中经常被忽视，但它对于需要执行复杂、多步骤工作流程的代理来说至关重要。这是代理可以不经深思熟虑地自动执行的学习技能和行为模式。

想想你是如何学会触摸打字或驾驶汽车的。最初，每个动作都需要集中注意力。随着时间的推移，这些技能变得自动化，释放你的意识来完成更高级别的任务。人工智能代理中的程序记忆的工作原理类似。

当客户服务代理第一百次遇到密码重置请求时，程序记忆意味着它不需要每次都从头开始推理整个工作流程。步骤序列（验证身份、发送重置链接、确认完成、记录操作）成为可靠执行的缓存例程。

程序记忆并不能完全消除推理。它减少了重复性的思考，因此推理可以集中在新的情况上。

这种类型的记忆可以通过强化学习、微调或明确定义的编码最佳实践的工作流程来形成。随着代理获得经验，经常使用的程序会转移到程序内存中，从而缩短响应时间并减少计算开销。

对于执行复杂任务的自主代理，程序内存可以实现平滑的编排。处理您旅行预订的代理不仅了解有关航空公司的事实（语义）或记住您过去的旅行（情景），它还知道如何执行搜索航班、比较选项、预订和协调确认的多步骤流程。

三种内存类型如何协同工作

所有三种内存类型在集成时都能发挥最佳性能。考虑一个自主人工智能研究助理，其任务是“准备可再生能源投资的市场分析报告”。

超越短期记忆人工智能代理需要 3 种长期记忆

情景记忆 回忆起上个月，在为半导体行业创建类似的分析时，该用户对纳入监管风险评估表示赞赏，并发现技术术语令人反感。代理还记得哪些数据源被证明是最可靠的，以及哪些可视化格式产生了最好的反馈。

语义记忆 提供事实基础：不同可再生能源类型的定义、当前市场估值、行业主要参与者、不同国家的监管框架以及能源政策和投资趋势之间的关系。

程序记忆 指导执行：代理自动知道从市场规模开始，然后进行竞争格局分析，然后进行风险评估，最后提出投资建议。它知道如何构建章节、何时包含执行摘要以及引用来源的标准格式。

如果没有这三者一起工作，特工的能力就会下降。如果没有一般知识，仅情景记忆就会使其过于个性化。仅靠语义记忆就可以使其知识渊博，但无法从经验中学习。仅凭程序记忆就可以使其擅长执行编程任务，但在遇到新情况时却不够灵活。

为您的用例选择正确的内存架构

并非每个自主代理都需要同等重视所有三种记忆类型。正确的内存架构取决于您的具体应用。

为了 个人人工智能助理 注重用户个性化，情景记忆最为重要。这些代理需要记住您的偏好、过去的互动和结果，以提供日益定制的体验。

为了 领域专家代理 在法律、医学或金融等领域，语义记忆最为重要。这些代理需要深入的、结构化的知识库，以便他们能够可靠地查询和推理。

为了 工作流程自动化代理 对于处理重复过程，程序记忆是关键。这些代理从可以大规模执行的学习例程中获益最多。

许多生产系统（特别是那些构建在诸如郎图或者 船员人工智能）实施混合方法，根据需要处理的任务组合多种内存类型。

前进的道路

随着我们深入进入代理人工智能时代，内存架构将把有能力的系统与有限的系统分开。改变我们工作方式的代理不仅仅是具有更好提示的语言模型。它们是具有丰富、多方面记忆的系统，可以实现真正的自主性。

对于回答问题的聊天机器人来说，短期记忆就足够了。长期记忆（情景记忆、语义记忆和程序记忆）将这些聊天机器人转变为能够在较长时间尺度内学习、记忆和智能行动的代理。

高级语言模型、向量数据库和内存架构的融合正在创建人工智能代理，它们不仅能处理信息，还能随着时间的推移积累智慧和专业知识。

对于机器学习从业者来说，这种转变需要新的技能和新的架构思维。设计有效的代理不再仅仅涉及即时工程。这是有意决定的 智能体应该记住什么，应该如何记住，以及记忆何时影响行动。这就是人工智能领域目前最有趣的工作正在进行的地方。

What's Hot

以太坊价格牛眼突破，下行阻力挤压价格，它将走向何方？

超越短期记忆：AI 代理所需的 3 种长期记忆

随着美国需求疲软，比特币 Coinbase 溢价罕见折扣

超越短期记忆：AI 代理所需的 3 种长期记忆

为什么短期记忆会遇到困难

长期代理记忆的三大支柱

情景记忆：从经验中学习

语义记忆：存储结构化知识

程序记忆：自动化专业知识

三种内存类型如何协同工作

为您的用例选择正确的内存架构

前进的道路

以太坊价格牛眼突破，下行阻力挤压价格，它将走向何方？

超越短期记忆：AI 代理所需的 3 种长期记忆

随着美国需求疲软，比特币 Coinbase 溢价罕见折扣

到 2030 年，巴基斯坦可能成为世界加密货币领导者