LangGraph API 自动处理检查点
使用 LangGraph API 时,您无需手动实现或配置检查点器。API 会在后台自动为您处理所有持久化基础设施。
线程(Threads)
线程是由检查点器为每个保存的检查点分配的唯一 ID 或线程标识符。它包含一系列运行的累积状态。当执行一次运行时,助手底层图的状态将被持久化到该线程中。 调用带有检查点器的图时,您必须在配置的configurable 部分指定 thread_id。
检查点(Checkpoints)
线程在特定时间点的状态称为检查点。检查点是在每个超步保存的图状态快照,由StateSnapshot 对象表示,包含以下关键属性:
config:与此检查点关联的配置。metadata:与此检查点关联的元数据。values:此时各状态通道的值。next:图中接下来要执行的节点名称元组。tasks:包含待执行任务信息的PregelTask对象元组。如果该步骤之前已尝试过,则包含错误信息。如果图从节点内部被动态中断,任务将包含与中断相关的附加数据。
- 空检查点,
START作为下一个要执行的节点 - 包含用户输入
{'foo': '', 'bar': []}且node_a为下一个要执行节点的检查点 - 包含
node_a输出{'foo': 'a', 'bar': ['a']}且node_b为下一个要执行节点的检查点 - 包含
node_b输出{'foo': 'b', 'bar': ['a', 'b']}且无后续节点的检查点
bar 通道定义了 reducer,因此 bar 通道的值包含两个节点的输出。
获取状态
与保存的图状态交互时,您必须指定线程标识符。通过调用graph.get_state(config) 可查看图的_最新_状态。这将返回一个 StateSnapshot 对象,对应于配置中提供的线程 ID 的最新检查点,或如果提供了检查点 ID,则返回该线程对应的检查点。
get_state 的输出如下:
获取状态历史
通过调用graph.get_state_history(config),您可以获取给定线程的完整图执行历史。这将返回与配置中提供的线程 ID 关联的 StateSnapshot 对象列表。重要的是,检查点将按时间顺序排列,最近的检查点 / StateSnapshot 位于列表首位。
get_state_history 的输出如下:
重播(Replay)
还可以回放之前的图执行。如果我们使用thread_id 和 checkpoint_id 调用图,LangGraph 将在对应 checkpoint_id 的检查点_之前_重新播放已执行的步骤,并仅执行检查点_之后_的步骤。
thread_id是线程的 ID。checkpoint_id是指代线程内特定检查点的标识符。
configurable 部分传递:
checkpoint_id _之前_的步骤。所有 checkpoint_id _之后_的步骤都将被执行(即新分支),即使它们之前已执行过。有关重播的更多信息,请参阅时间旅行操作指南。
重播
更新状态
除了从特定检查点 重播图外,我们还可以_编辑_图状态。我们使用 graph.update_state() 方法实现。此方法接受三个参数:
config
配置应包含指定要更新的线程的 thread_id。仅传递 thread_id 时,我们将更新(或分叉)当前状态。可选地,如果包含 checkpoint_id 字段,则分叉该选定检查点。
values
这些值将用于更新状态。请注意,此更新的处理方式与任何节点更新完全相同。这意味着这些值将传递给reducer 函数(如果图状态中的某些通道已定义)。这意味着 update_state 不会自动覆盖每个通道的通道值,而仅覆盖没有 reducer 的通道。让我们通过一个示例说明。
假设您使用以下模式定义了图的状态(参见上面的完整示例):
foo 键(通道)被完全更改(因为该通道未指定 reducer,因此 update_state 会覆盖它)。然而,bar 键指定了 reducer,因此它将 "b" 附加到 bar 的状态。
as_node
调用 update_state 时,您还可以选择指定 as_node。如果提供了该参数,更新将被视为来自节点 as_node。如果未提供 as_node,则将其设置为上次更新状态的节点(如果不含糊)。这很重要,因为要执行的下一步取决于上次给出更新的节点,因此这可用于控制下一个执行的节点。有关分叉状态的更多信息,请参阅时间旅行操作指南。
更新
内存存储(Memory Store)
共享状态模型 状态模式 指定了图执行时填充的一组键。如上所述,状态可以在每个图步骤由检查点器写入线程,从而实现状态持久化。 但是,如果我们希望在_线程之间_保留某些信息呢?考虑一个聊天机器人的场景,我们希望在与该用户的_所有_聊天对话(即线程)中保留特定的用户信息! 仅使用检查点器,我们无法在线程之间共享信息。这促使了Store 接口的需求。作为示例,我们可以定义一个 InMemoryStore 来跨线程存储有关用户的信息。我们只需像以前一样使用检查点器编译图,并添加新的 in_memory_store 变量。
LangGraph API 自动处理存储
使用 LangGraph API 时,您无需手动实现或配置存储。API 会在后台自动为您处理所有存储基础设施。
基本用法
首先,让我们在不使用 LangGraph 的情况下单独展示这一点。元组 命名空间划分,在此特定示例中为 (<user_id>, "memories")。命名空间可以是任意长度,代表任何内容,不必特定于用户。
store.put 方法将内存保存到存储中的命名空间。执行此操作时,我们指定上述定义的命名空间,以及内存的键值对:键是内存的唯一标识符 (memory_id),值(字典)是内存本身。
store.search 方法读取命名空间中的内存,这将返回给定用户的所有内存列表。最近的内存位于列表末尾。
Item),具有某些属性。我们可以通过 .dict 转换将其作为字典访问,如上所示。
其属性包括:
value:此内存的值(本身是一个字典)key:此命名空间中此内存的唯一键namespace:字符串列表,此内存类型的命名空间created_at:此内存创建的时间戳updated_at:此内存更新的时间戳
语义搜索
除了简单检索,存储还支持语义搜索,允许您根据含义而非精确匹配查找内存。要启用此功能,请使用嵌入模型配置存储:fields 参数或在存储内存时指定 index 参数来控制内存的哪些部分被嵌入:
在 LangGraph 中使用
设置完成后,我们在 LangGraph 中使用in_memory_store。in_memory_store 与检查点器协同工作:检查点器将状态保存到线程(如上所述),而 in_memory_store 允许我们存储可在_线程之间_访问的任意信息。我们如下编译同时包含检查点器和 in_memory_store 的图。
thread_id 调用图,同时还使用 user_id,我们将用它来为特定用户的内存命名空间,如上所示。
store: BaseStore 和 config: RunnableConfig 作为节点参数来访问 in_memory_store 和 user_id。以下是我们如何在节点中使用语义搜索查找相关内存的示例:
store.search 方法获取内存。回想一下,内存作为对象列表返回,可以转换为字典。
user_id 相同,我们仍然可以访问相同的内存。
langgraph.json 文件中配置索引设置。例如:
检查点器库
在底层,检查点由符合 BaseCheckpointSaver 接口的检查点器对象提供支持。LangGraph 提供了多个检查点器实现,均通过独立的、可安装的库实现:langgraph-checkpoint:检查点器保存器的基础接口 (BaseCheckpointSaver) 和序列化/反序列化接口 (SerializerProtocol)。包括用于实验的内存检查点器实现 (InMemorySaver)。LangGraph 自带langgraph-checkpoint。langgraph-checkpoint-sqlite:使用 SQLite 数据库的 LangGraph 检查点器实现 (SqliteSaver / AsyncSqliteSaver)。适用于实验和本地工作流。需要单独安装。langgraph-checkpoint-postgres:使用 Postgres 数据库的高级检查点器 (PostgresSaver / AsyncPostgresSaver),用于 LangGraph 平台。适用于生产环境。需要单独安装。
检查点器接口
每个检查点器符合 BaseCheckpointSaver 接口并实现以下方法:.put- 存储带有其配置和元数据的检查点。.put_writes- 存储与检查点关联的中间写入(即待处理写入)。.get_tuple- 使用给定配置(thread_id和checkpoint_id)获取检查点元组。这用于在graph.get_state()中填充StateSnapshot。.list- 列出符合给定配置和过滤条件的检查点。这用于在graph.get_state_history()中填充状态历史。
.ainvoke、.astream、.abatch 执行图),将使用上述方法的异步版本(.aput、.aput_writes、.aget_tuple、.alist)。
要异步运行您的图,您可以使用
InMemorySaver,或 Sqlite/Postgres 检查点器的异步版本 — AsyncSqliteSaver / AsyncPostgresSaver 检查点器。序列化器
当检查点器保存图状态时,它们需要序列化状态中的通道值。这是通过序列化器对象完成的。langgraph_checkpoint 定义了 protocol 用于实现序列化器,并提供默认实现 (JsonPlusSerializer),可处理多种类型,包括 LangChain 和 LangGraph 原语、日期时间、枚举等。
使用 pickle 序列化
默认序列化器 JsonPlusSerializer 在底层使用 ormsgpack 和 JSON,这不适用于所有类型的对象。
如果您想对当前 msgpack 编码器不支持的对象(如 Pandas 数据帧)回退到 pickle,可以使用 JsonPlusSerializer 的 pickle_fallback 参数:
加密
检查点器可以选择加密所有持久化状态。要启用此功能,请将EncryptedSerializer 实例传递给任何 BaseCheckpointSaver 实现的 serde 参数。创建加密序列化器的最简单方法是通过 from_pycryptodome_aes,它从 LANGGRAPH_AES_KEY 环境变量读取 AES 密钥(或接受 key 参数):
LANGGRAPH_AES_KEY,就会自动启用加密,因此您只需提供环境变量。其他加密方案可以通过实现 CipherProtocol 并将其提供给 EncryptedSerializer 来使用。