paper: https://arxiv.org/pdf/2512.18329
code: https://github.com/WinstonCHEN1/LiR3AG/
文章目录
- 核心问题
- 核心思想
- 方法: LIR3 ^33AG 框架
- 实验
- code解析
- 贡献
核心问题
致力于解决在多跳问答(Multi-hop QA)任务中,如何在保持高性能的同时,降低推理模型(Reasoning Models)在RAG系统中的计算开销(Token消耗和推理延迟)。
- 背景:引入推理模型(如OpenAI o1, DeepSeek-R1)能显著提升RAG在复杂多跳问题上的表现,因为它们能处理碎片化证据并进行逻辑推理 。
- 痛点:推理模型在生成过程中会产生大量的中间思维步骤(Chain-of-Thought),导致极高的Token消耗和推理延迟,且有时会产生冗余的推理 。
核心思想
核心思想是将推理模型的有效策略“迁移”给非推理模型(Non-reasoning Models),通过结构化的方法显式地构建推理链,从而在不依赖昂贵推理模型的情况下实现类似的逻辑推理能力 。
- 策略分析:作者首先分析了推理模型在RAG中的行为,发现主要有两种策略 :