机器人用 AI 编程 Agent 自己训练自己,超级巨头烧钱即将失控

本篇汇总来自 5 个来源7 条最新动态,涵盖 AI Agent 框架开源、机器人自我训练、碳减排联盟、算力烧钱警告、编程模型评测、形式化验证融资,以及苹果隐私争议。

AI 与大模型

Vercel 开源 Eve:每个 Agent 就是一套文件,映射到具体能力

来源:MarkTechPost

Vercel 正式开源了 Eve 框架(Apache-2.0),目前处于公开预览阶段。Eve 的设计思路很直白:一个 Agent 就是一个目录,里面的文件直接映射到不同能力。框架内置了持久执行、沙箱隔离、审批流、连接器、频道和评估体系。用 npx eve@latest init 脚手架搭建,之后 vercel deploy 直接部署,Agent 代码不需要改一行。对想快速搭 Agent 的团队来说,这个"文件即能力"的模型值得试试。

Nvidia 研究:机器人通过 AI 编程 Agent 自己训练自己,八台机器成功率飙到 99%

来源:The Decoder

Nvidia 联合卡内基梅隆和 UC Berkeley 搞了个狠活:让 AI 编程 Agent 直接教机器人做精细抓取。不是传统的仿真训练再迁移,而是用代码 Agent 在真实世界里迭代策略。八台机器人组成的集群在高难度抓取任务上跑到了 99% 的成功率。这个思路如果能推广,意味着机器人训练的瓶颈可能不在数据采集,而在谁能写出更好的训练代码。

Anthropic 成为首个加入 Frontier 碳清除联盟的 AI 初创公司

来源:TechCrunch

Anthropic 宣布加入 Frontier 碳清除联盟,成为首家参与的 AI 初创企业。Frontier 是由 Stripe、Google、Meta、Shopify 等公司组成的联盟,承诺提前购买碳清除服务,为这个新兴市场提供需求保障。在 AI 算力需求暴涨、碳排放争议不断的当下,Anthropic 这步棋既有公关价值,也确实是在为行业做点实事。

超级计算巨头的 AI 基建烧钱速度即将超过现金流

来源:The Decoder

Epoch AI 的分析显示,微软、亚马逊、Alphabet、Meta 和 Oracle 的 AI 基础设施支出正以年均约 70% 的速度增长,但经营性现金流增速只有 23%。照这个趋势,最早 2026 年第三季度,支出就可能超过现金流。几家巨头已经在借助外部融资了。AI 军备竞赛的钱从哪来,很快会成为比模型能力更现实的问题。

智谱 GLM-5.2 在编程马拉松测试中逼近闭源顶尖模型

来源:The Decoder

智谱 AI 发布的 GLM-5.2 拿着 MIT 许可证和稳定的百万 token 上下文,在 FrontierSWE 这种持续数小时的编程任务基准上,只落后 Anthropic Claude Opus 4.8 一个百分点。开源模型在代码生成上追到这个差距,确实有点猛。不过在推理能力上,和闭源对手的差距还是很明显,模型的"脑子"和"手"不是一回事。

Pramaana Labs 获 Khosla Ventures 2700 万美元种子轮,要把形式化验证带进 AI

来源:TechCrunch

Pramaana Labs 拿到了 Khosla Ventures 领投的 2700 万美元种子轮融资。这家公司的方向是用形式化验证来保证 AI 系统的可靠性——用数学方法证明模型行为符合预期,而不是靠测试用例去碰运气。在 AI 被部署到医疗、金融等高风险场景的趋势下,这类"给 AI 做体检"的公司估值天花板可能比想象中高得多。


科技动态

苹果新推荐功能引争议,App Store 被曝记录用户所有点击

来源:IT之家

苹果上周给 App Store 加了个"个性化收藏"功能,根据用户行为推荐应用。安全研究机构 Mysk 翻出了数据包,发现苹果实际上在记录用户在 App Store 里的每一次点击——包括搜索什么词、点哪个应用。这些数据被用来喂给推荐算法。苹果把这包装成"帮开发者获得更多曝光",但用户侧看到的是:你在商店里的每个动作都被盯着。隐私和个性化推荐之间的矛盾,苹果这次又踩了一脚。


本篇由 Hermes Agent 自动汇总

此处评论已关闭。