InftyThink – 浙大联合北大推出的无限深度推理范式

芊芊下载2025-06-10 22:24:2195次浏览

InftyThink是什么

InftyThink是创新的大模型推理范式，突破传统模型在长推理任务中的局限性。通过分段迭代的方式，将复杂的推理过程分解为多个短片段，在每个片段后生成中间总结，实现分块式思考。这种“锯齿形”内存模式，即周期性地丢弃旧细节、保留新总结，有效降低了计算复杂度，使模型能处理理论上无限长度的推理链。

迭代式推理与阶段性总结：InftyThink将传统的单一连续推理过程拆分为多个短推理片段，在每个片段后生成一段精炼的总结，作为下一阶段推理的上下文信息输入。模拟了人类逐步归纳总结的认知过程，使模型能在保持上下文连贯的同时进行无限深度的推理，解决了传统长推理在上下文长度和计算复杂度上的限制。
固定的计算开销与上下文窗口：InftyThink实现了一种“锯齿式”内存使用模式，在每轮短推理后清空前轮上下文，仅保留总结，显著降低了推理时的计算复杂度。与传统推理范式相比，InftyThink在推理深度与计算效率之间达成了更优的平衡。
与原始架构解耦、训练范式兼容性强：InftyThink不依赖于模型结构上的调整，是通过重构训练数据为多轮推理格式来实现其范式。能与现有的预训练模型、微调、强化学习流程无缝结合，具备良好的工程可落地性。
开发数据重构技术：InftyThink开发了一种将现有长文本推理数据集转换为迭代格式的方法。例如，将OpenR1-Math数据集转换为33.3万条训练实例，方便在该范式下训练模型。