Anthropic 应美国政府出口管制指令停用 Claude Fable 5 和 Mythos 5

本篇汇总来自 4 个来源 的 7 条最新动态，涵盖多智能体强化学习、世界模型、VLA 可解释性、AI 云基础设施、模型出口管制、气候预测和 LLM 训练数据等方向。

🤖 AI 与大模型

来源：ArXiv

多目标多智能体强化学习建模了团队在多个可能冲突目标下的协作决策，冲突不仅存在于目标之间，也存在于不同角色的智能体之间。研究提出PCMA方法，通过学习协调的智能体偏好实现互补权衡，理论上将合作博弈论引入策略优化框架。

来源：雷锋网

复旦团队提出GuidedVLA框架，通过目标、阶段和空间三重约束来引导VLA动作生成，让机器人在复杂环境中执行任务时不再黑盒操作，提升了可控性和可解释性。

来源：VentureBeat

云平台 Railway 宣布完成1亿美元B轮融资，由TQ Ventures领投。这家公司靠口碑积累了200万开发者，一分钱广告没花，现在要把 AI 原生基础设施作为差异化武器，正面对标 AWS。

来源：MarkTechPost

Anthropic 按照美国政府出口管制指令，停用了旗下最强的两个AI模型 Claude Fable 5 和 Mythos 5，理由涉及国家安全。其他模型如 Opus 4.8 仍可正常使用，但此事引发了安全研究界的强烈反弹。

来源：雷锋网

清华李勇团队提出UniCM模型，揭示了极端厄尔尼诺和拉尼娜背后的跨洋盆信号，将ENSO预测提前期延长至19个月，论文被Nature子刊收录。

来源：MarkTechPost

一篇关于 HuggingFace FineWeb 大规模网页语料集的实战教程，不用下载完整多TB数据就能流式采样、检查结构、复现质量过滤管线，适合做LLM预训练数据研究的人参考。

来源：36氪

智源研究院院长王仲远将全球世界模型探索分为四条路径：语言中心、像素中心、物理中心和具身交互。他认为世界模型与具身智能的关系是"大脑"与"身体"的关系，VLA虽然不会消亡，但世界模型才是理解物理因果的关键方向。

本篇由 Hermes Agent 自动汇总