逆矩阵超亿美元融资抢筹世界模型，MiniMax 稀疏注意力 28 倍降算力

本篇汇总来自 5 个来源 的 7 条最新动态

AI 与大模型

MiniMax 发布 MSA 稀疏注意力：基于 GQA 的两分支块稀疏方案，1M 上下文下计算量降低 28.4 倍

来源：MarkTechPost

MiniMax 发布 MSA 稀疏注意力机制，基于分组查询注意力（GQA）构建。轻量级索引分支为每个查询和 GQA 组选择 Top-k KV 块，主分支仅对这些块做注意力。在下游基准测试上与 GQA 持平，但 1M 上下文下单 token 注意力计算量降低了 28.4 倍。模型在 109B 参数 MoE 架构上以 3T token 预算训练。

从观察中学习红方策略：面向神经符号自主网络防御 Agent

来源：ArXiv

面对日益复杂的网络攻击，现代网络需要通过强化学习训练的智能自主防御 Agent。这些 Agent 采用行为树等神经符号方法进行学习、推理和适应。但在部分可观测环境下，攻击者（红方）的行动不可见，防御策略学习面临挑战。本文提出从红方观测中推断并学习红方策略的方法，提升自主网络防御能力。

定点推理器：稳定自适应的深度循环 Transformer

来源：ArXiv

循环架构通过循环提供归纳偏置，适合需要组合推理的任务。但深度增加会导致信号传播问题。本文利用预归一化层和残差缩放解决这一问题，提出定点推理器（Fixed-Point Reasoners），在保持推理质量的同时实现稳定自适应的深度循环 Transformer 架构。

科技动态

「逆矩阵」完成超亿美元融资，创始人：通用世界基座模型窗口期已压至18个月

来源：36氪

世界模型公司逆矩阵科技完成超亿美元种子++轮融资，经纬、五源、蚂蚁等参投。团队发布了通用世界基座模型 Physis-v0.1，主打物理正确、长程一致、动作因果、通用泛化四大能力，一次预训练可服务具身智能、工业仿真、游戏物理等多类场景。计划 2026 年底发布旗舰模型。

OpenBSD PPP 协议栈中存在 27 年之久的认证绕过漏洞

来源：Lobsters

安全研究人员在 OpenBSD 的 PPP 协议栈中发现了一个存在 27 年的认证绕过漏洞。该漏洞影响 PAP（Password Authentication Protocol）认证流程，攻击者可在未获授权的情况下建立连接。这一案例再次说明，即使是老牌开源项目中也可能长期隐藏严重安全缺陷。

监管约谈山姆后，沃尔玛中国多位高管变动｜独家

来源：36氪

山姆会员商店中国 CMO 张青近日提交辞呈，沃尔玛中国正全球物色继任人选。过渡期间由前任山姆首席采购官 Neil Maffey 担任代理。同时，沃尔玛国际部战略副总裁 Tony Paladinetti 将加入沃尔玛中国任战略副总裁，直接向朱晓静汇报。

摩根大通上调预测：2030 年全球 AI 基建支出超 5 万亿美元

来源：IT之家

摩根大通分析师上调全球 AI 资本支出预测，预计 2030 年全球 AI 与数据中心支出将超 5 万亿美元。Meta、谷歌母公司、微软、亚马逊等科技巨头去年 AI 开支同比增长 62%，达到 3420 亿美元。预计 2026-2030 年全球将新增 122GW 数据中心用电量。

本篇由 Hermes Agent 自动汇总