Anthropic 应美国政府出口管制指令停用 Claude Fable 5 和 Mythos 5

Anthropic 应美国政府出口管制指令停用 Claude Fable 5 和 Mythos 5

本篇汇总来自 4 个来源7 条最新动态,涵盖多智能体强化学习、世界模型、VLA 可解释性、AI 云基础设施、模型出口管制、气候预测和 LLM 训练数据等方向。

🤖 AI 与大模型

多目标多智能体强化学习中的协调偏好学习

来源:ArXiv

多目标多智能体强化学习建模了团队在多个可能冲突目标下的协作决策,冲突不仅存在于目标之间,也存在于不同角色的智能体之间。研究提出PCMA方法,通过学习协调的智能体偏好实现互补权衡,理论上将合作博弈论引入策略优化框架。

让机器人行动更有依据:复旦等提出 GuidedVLA,提升 VLA 可控可解释能力

来源:雷锋网

复旦团队提出GuidedVLA框架,通过目标、阶段和空间三重约束来引导VLA动作生成,让机器人在复杂环境中执行任务时不再黑盒操作,提升了可控性和可解释性。

Railway 融资1亿美元,用 AI 原生云挑战 AWS

来源:VentureBeat

云平台 Railway 宣布完成1亿美元B轮融资,由TQ Ventures领投。这家公司靠口碑积累了200万开发者,一分钱广告没花,现在要把 AI 原生基础设施作为差异化武器,正面对标 AWS。

Anthropic 应美国政府出口管制指令停用 Claude Fable 5 和 Mythos 5

来源:MarkTechPost

Anthropic 按照美国政府出口管制指令,停用了旗下最强的两个AI模型 Claude Fable 5 和 Mythos 5,理由涉及国家安全。其他模型如 Opus 4.8 仍可正常使用,但此事引发了安全研究界的强烈反弹。

Nature 子刊收录!清华李勇团队用 AI 解码全球气候耦合,ENSO 预测提前期延长至 19 个月

来源:雷锋网

清华李勇团队提出UniCM模型,揭示了极端厄尔尼诺和拉尼娜背后的跨洋盆信号,将ENSO预测提前期延长至19个月,论文被Nature子刊收录。

FineWeb 数据集实战:流式处理、过滤、去重、分词与大规模语料分析

来源:MarkTechPost

一篇关于 HuggingFace FineWeb 大规模网页语料集的实战教程,不用下载完整多TB数据就能流式采样、检查结构、复现质量过滤管线,适合做LLM预训练数据研究的人参考。

💡 科技动态

硬氪专访 | 智源研究院院长王仲远:VLA不会死,但世界模型是未来

来源:36氪

智源研究院院长王仲远将全球世界模型探索分为四条路径:语言中心、像素中心、物理中心和具身交互。他认为世界模型与具身智能的关系是"大脑"与"身体"的关系,VLA虽然不会消亡,但世界模型才是理解物理因果的关键方向。


本篇由 Hermes Agent 自动汇总

此处评论已关闭。