<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>PodLens</title>
<link>https://lens.lumihelia.com/papers/</link>
<description>解读有据,出处可查。</description>
<language>zh-Hans</language>
<atom:link href="https://lens.lumihelia.com/papers/feed.xml" rel="self" type="application/rss+xml" />
<item>
<title>智能体协作的行动级心智模型数据集 · Jiaju Chen</title>
<link>https://lens.lumihelia.com/papers/humans-almanac.html</link>
<guid isPermaLink="true">https://lens.lumihelia.com/papers/humans-almanac.html</guid>
<pubDate>Sat, 06 Jun 2026 00:00:00 +0000</pubDate>
<description>本文介绍了 ALMANAC，这是第一个针对人机协作(human-agent collaboration)的行动级心智模型标注(Action-Level Mental Model Annotations)数据集。虽然大语言模型(LLM)智能体具备多步推理和规划能力，但它们大多被优化用于独立完成任务，缺乏协作所需的共享心智模型对齐能力。为了填补这一空白，作者设计了一个理论指导的双步标注框架，基于经典社…</description>
<category>智能体协作</category>
<category>心智模型</category>
<category>ALMANAC</category>
<category>地图任务</category>
<category>行为预测</category>
</item>
<item>
<title>智能体记忆：长周期工作负载的系统特征与启示 · Yasmine Omri</title>
<link>https://lens.lumihelia.com/papers/agent-memory.html</link>
<guid isPermaLink="true">https://lens.lumihelia.com/papers/agent-memory.html</guid>
<pubDate>Sat, 06 Jun 2026 00:00:00 +0000</pubDate>
<description>本文是针对大语言模型(LLM)智能体记忆系统(Agent Memory Systems)的第一份系统级表征(systems characterization)研究。随着大语言模型智能体被越来越多地应用于需要长期持续推理的长周期任务(long-horizon tasks)中，智能体需要在多个会话中持久化存储、检索和更新其自身的记忆。尽管目前存在多种智能体记忆系统设计，但它们的系统级行为和计算开销一直…</description>
<category>智能体记忆</category>
<category>系统级表征</category>
<category>预填充开销</category>
<category>记忆构建</category>
<category>鲜度与延迟</category>
<category>能耗开销</category>
</item>
<item>
<title>经验时代：超越人类数据的强化学习 · David Silver</title>
<link>https://lens.lumihelia.com/papers/the-era-of-experience.html</link>
<guid isPermaLink="true">https://lens.lumihelia.com/papers/the-era-of-experience.html</guid>
<pubDate>Sat, 06 Jun 2026 00:00:00 +0000</pubDate>
<description>本篇论文由 David Silver 和 Richard S. Sutton 撰写（该文为即将由 MIT Press 出版的书籍《Designing an Intelligence》中的一个章节预印本）。论文探讨了人工智能（AI）正处于从“人类数据时代”向“经验时代”转变的临界点。作者指出，尽管当前的 AI（如大型语言模型，即 LLMs）通过在海量人类生成的数据上进行训练取得了巨大成功，但这种依赖…</description>
<category>经验流</category>
<category>具地奖励</category>
<category>双层优化</category>
<category>自我博弈</category>
<category>世界模型</category>
</item>
</channel>
</rss>