Meta超级智能实验室首篇论文发布：REFRAG重新定义RAG技术

2025年9月8日

（图片来自网络）

Meta超级智能实验室首篇论文发布：REFRAG重新定义RAG技术

Meta超级智能实验室近日发布其首篇论文，提出名为REFRAG的高效解码框架，重新定义了检索增强生成（RAG）技术。该框架有望大幅提升RAG的效率，同时解决长上下文信息处理时存在的计算难题。

理解RAG与挑战

首先，我们先回顾RAG的工作原理与面临的挑战。RAG通过外部知识库检索信息，作为上下文辅助大语言模型（LLM）生成回答，但长上下文会导致LLM计算负担加重、延迟增加。Meta实验室发现RAG解码存在计算冗余，于是提出REFRAG。

REFRAG：创新解码框架

REFRAG采用“压缩、感知、扩展”三步流程优化信息处理：

通过这一设计，REFRAG在保持性能的同时，将首字生成延迟（TTFT）最高加速30倍，且未牺牲RAG回答的准确性与时效性。

性能验证

论文数据显示，REFRAG在推理速度、上下文处理能力等方面表现优异，在等效计算预算下可扩大上下文窗口16倍，为长上下文信息处理提供新方案。该研究不仅适用于RAG，也可拓展到多轮对话、长文档摘要等场景，为更高效AI应用提供思路。