最近 DeepSeek 发布了一项名为 Engram(记忆印迹) 的新技术。这不仅仅是一个微调技巧,而是对 Transformer 架构的一种底层修改。简单来说,它试图解决大模型“死记硬背”参数效率低下的问题。论文原文:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf