PodLens

PodLens https://lens.lumihelia.com/papers/ 解读有据,出处可查。 zh-Hans 智能体协作的行动级心智模型数据集 · Jiaju Chen https://lens.lumihelia.com/papers/humans-almanac.html https://lens.lumihelia.com/papers/humans-almanac.html Sat, 06 Jun 2026 00:00:00 +0000 本文介绍了 ALMANAC，这是第一个针对人机协作(human-agent collaboration)的行动级心智模型标注(Action-Level Mental Model Annotations)数据集。虽然大语言模型(LLM)智能体具备多步推理和规划能力，但它们大多被优化用于独立完成任务，缺乏协作所需的共享心智模型对齐能力。为了填补这一空白，作者设计了一个理论指导的双步标注框架，基于经典社… 智能体协作心智模型 ALMANAC 地图任务行为预测智能体记忆：长周期工作负载的系统特征与启示 · Yasmine Omri https://lens.lumihelia.com/papers/agent-memory.html https://lens.lumihelia.com/papers/agent-memory.html Sat, 06 Jun 2026 00:00:00 +0000 本文是针对大语言模型(LLM)智能体记忆系统(Agent Memory Systems)的第一份系统级表征(systems characterization)研究。随着大语言模型智能体被越来越多地应用于需要长期持续推理的长周期任务(long-horizon tasks)中，智能体需要在多个会话中持久化存储、检索和更新其自身的记忆。尽管目前存在多种智能体记忆系统设计，但它们的系统级行为和计算开销一直… 智能体记忆系统级表征预填充开销记忆构建鲜度与延迟能耗开销经验时代：超越人类数据的强化学习 · David Silver https://lens.lumihelia.com/papers/the-era-of-experience.html https://lens.lumihelia.com/papers/the-era-of-experience.html Sat, 06 Jun 2026 00:00:00 +0000 本篇论文由 David Silver 和 Richard S. Sutton 撰写（该文为即将由 MIT Press 出版的书籍《Designing an Intelligence》中的一个章节预印本）。论文探讨了人工智能（AI）正处于从“人类数据时代”向“经验时代”转变的临界点。作者指出，尽管当前的 AI（如大型语言模型，即 LLMs）通过在海量人类生成的数据上进行训练取得了巨大成功，但这种依赖… 经验流具地奖励双层优化自我博弈世界模型