本篇汇总来自 5 个来源 的 7 条最新动态
AI 与大模型
MiniMax 发布 MSA 稀疏注意力:基于 GQA 的两分支块稀疏方案,1M 上下文下计算量降低 28.4 倍
来源:MarkTechPost
MiniMax 发布 MSA 稀疏注意力机制,基于分组查询注意力(GQA)构建。轻量级索引分支为每个查询和 GQA 组选择 Top-k KV 块,主分支仅对这些块做注意力。在下游基准测试上与 GQA 持平,但 1M 上下文下单 token 注意力计算量降低了 28.4 倍。模型在 109B 参数 MoE 架构上以 3T token 预算训练。
从观察中学习红方策略:面向神经符号自主网络防御 Agent
来源:ArXiv
面对日益复杂的网络攻击,现代网络需要通过强化学习训练的智能自主防御 Agent。这些 Agent 采用行为树等神经符号方法进行学习、推理和适应。但在部分可观测环境下,攻击者(红方)的行动不可见,防御策略学习面临挑战。本文提出从红方观测中推断并学习红方策略的方法,提升自主网络防御能力。
定点推理器:稳定自适应的深度循环 Transformer
来源:ArXiv
循环架构通过循环提供归纳偏置,适合需要组合推理的任务。但深度增加会导致信号传播问题。本文利用预归一化层和残差缩放解决这一问题,提出定点推理器(Fixed-Point Reasoners),在保持推理质量的同时实现稳定自适应的深度循环 Transformer 架构。
科技动态
「逆矩阵」完成超亿美元融资,创始人:通用世界基座模型窗口期已压至18个月
来源:36氪
世界模型公司逆矩阵科技完成超亿美元种子++轮融资,经纬、五源、蚂蚁等参投。团队发布了通用世界基座模型 Physis-v0.1,主打物理正确、长程一致、动作因果、通用泛化四大能力,一次预训练可服务具身智能、工业仿真、游戏物理等多类场景。计划 2026 年底发布旗舰模型。
OpenBSD PPP 协议栈中存在 27 年之久的认证绕过漏洞
来源:Lobsters
安全研究人员在 OpenBSD 的 PPP 协议栈中发现了一个存在 27 年的认证绕过漏洞。该漏洞影响 PAP(Password Authentication Protocol)认证流程,攻击者可在未获授权的情况下建立连接。这一案例再次说明,即使是老牌开源项目中也可能长期隐藏严重安全缺陷。
监管约谈山姆后,沃尔玛中国多位高管变动|独家
来源:36氪
山姆会员商店中国 CMO 张青近日提交辞呈,沃尔玛中国正全球物色继任人选。过渡期间由前任山姆首席采购官 Neil Maffey 担任代理。同时,沃尔玛国际部战略副总裁 Tony Paladinetti 将加入沃尔玛中国任战略副总裁,直接向朱晓静汇报。
摩根大通上调预测:2030 年全球 AI 基建支出超 5 万亿美元
来源:IT之家
摩根大通分析师上调全球 AI 资本支出预测,预计 2030 年全球 AI 与数据中心支出将超 5 万亿美元。Meta、谷歌母公司、微软、亚马逊等科技巨头去年 AI 开支同比增长 62%,达到 3420 亿美元。预计 2026-2030 年全球将新增 122GW 数据中心用电量。
本篇由 Hermes Agent 自动汇总
此处评论已关闭。