当前位置：首页>学习笔记>学习笔记:AI是怎么记住我们的?

学习笔记:AI是怎么记住我们的?

2026-04-17 12:19:10

学习笔记:AI是怎么记住我们的?

🔍 ChatGPT 记忆机制破解背景

核心问题：AI 如何记住用户对话？是否完整保存所有历史记录？

破解者背景：Manthan Gupta（AI 红队测试者、GPU 内核工程师）通过与 GPT 反复交互，揭示了其记忆机制。

验证依据：符合实际使用体验，且破解者具备专业技术背景（分布式训练调优、Agent 编排等）。

🧠 ChatGPT 记忆系统的四级架构

(一) 元对话数据（Session Metadata）

定义：保存用户环境指纹与行为特征的临时数据，非长期记忆。

核心数据项：

环境信息：时区（如东京）、日期（2025年12月17日）、设备（桌面端 Chrome 143）、系统（Windows 11 64bit）、显示设置（分辨率 5140×1440，非深色模式）。

用户行为：订阅级别（Plus）、账号年龄（146 周）、活跃度（近 7 天 7 天活跃、近 30 天 29 天活跃）、对话特征（平均深度 6.6、消息长度 485 字、当前页面打开 3004 秒）。

模型偏好：历史对话模型分布（5.1 Thinking 占 73%、5.2 Thinking 占 13%、GPT-4 占 9% 等）。

作用：设定对话基本框架，例如高活跃度用户会获得更多 token 分配以提升回答质量。

(二) 用户记忆（User Memory）

定义：显性保存的用户核心特征，可通过指令调整。

生成方式：

用户主动告知：如“记住我是科普工作者”。

AI自动提取：从对话中识别职业、兴趣（如对保健品科学证据、AI 芯片生态感兴趣）、个人关系（儿子叫牛牛）等。

特点：支持实时更新，例如用户可指令“不再作为科普工作者，改为摇滚乐队贝斯手”。

(三) 近期对话摘要

设计逻辑：仅记录用户最近15次对话的核心话题，忽略AI回复内容，消耗仅几百个token。

示例：

12月17日：平头耳塞综合评分

12月16日：经院哲学与神学逻辑压力测试

12月15日：咀嚼对大脑的影响

12月14日：晶体生长与地缘政治类比

作用：对用户当前输入做70%正确率的话题预测，模拟熟人聊天中的话题连贯性。

(四) 当前对话内容

定义：实时处理的对话细节，是模型消耗token的主要部分。

技术参数：GPT-5 API输入上限为27万token（约10-20万汉字），满足99.9%用户需求。

特点：支持模糊指代理解，例如“第二波低垂的果实背后的技术”可被准确识别。

💡 工程设计的核心洞察

目标导向：不追求完整记忆，仅需让用户产生“被记住”的感受。

成本优化：避免向量数据库、RAG（检索增强生成）等高算力方案，采用轻量化摘要机制。

人性模拟：通过15次近期话题摘要，还原真实人际交往中“聚焦当下、弱关联历史”的对话模式。

📌 补充细节

用户使用强度评估：根据活跃度、消息长度和复杂度，Plus用户可被归类为前10%-30%，在全体用户中则为前1%-5%。

跨模型通用性：推测其他大语言模型可能采用类似记忆机制。

应用启示：虚拟关系中AI记忆具有局限性，可帮助降低用户对“情感连接”的过度依赖。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

学习笔记:AI是怎么记住我们的?

最新文章

热门文章

随机文章

学习笔记:AI是怎么记住我们的?

【理论学习笔记】在二十届中央纪委五次全会上的工作报告

学习笔记分享【沟通:听内容】

最新文章

热门文章

随机文章