2026-05-10 AI 日报

来源:18 个引用生成:2026/05/11 08:30

内容

声明:完全使用AI生成,可能存在错误,需谨慎甄别。

摘要

2026-05-10 AI 领域呈现多线并进格局,值得关注的信息:英伟达 Jim Fan 正式宣布世界动作模型(WAM)取代 VLA 架构,开启机器人自主新纪元;OncoAgent 系统开源发布,以隐私保护的多智能体架构赋能肿瘤临床决策;Anthropic 与 Akamai 达成 18 亿美元计算协议,深化 AI 算力布局;同时,法国检方对 X 平台及马斯克展开刑事调查,凸显 AI 内容监管升级。此外,Richard Sutton 团队提出意图更新方法,为流式强化学习开辟新路径;百度文心 5.1 发布,Agent 能力位列全球第四。

今日大事

英伟达宣布世界动作模型(WAM)取代 VLA 架构,开启机器人自主新纪元

在红杉 AI Ascent 2026 大会上,英伟达机器人研究负责人 Jim Fan 正式宣布 VLA(视觉-语言-动作)架构过时,推出新一代 世界动作模型(WAM) 作为机器人预训练新范式。WAM 基于人类第一人称视频数据训练,代表项目 DreamZero 利用 EgoScale 系统在 21,000 小时人类操作视频上实现端到端学习,并发现机器人领域的 神经缩放定律(R²=0.998)。Jim Fan 同时宣告遥操作时代终结,预测机器人将在 2-3 年内通过“物理图灵测试”,并于 2040 年前实现自主设计与制造,置信度达 95%。这标志着机器人学习范式从语言辅助向世界模型驱动的根本性转变。

重点: 重新定义机器人预训练范式,可能加速通用机器人的落地进程。

来源:

OncoAgent 系统开源发布,隐私保护的肿瘤临床决策支持

OncoAgent 是一个开源、隐私保护的肿瘤临床决策支持系统,采用 双层级多智能体架构,结合 LangGraph 多智能体框架、四阶段 Corrective RAG 检索增强生成流程及三层反射式安全验证机制,确保输出严格遵循 NCCN 和 ESMO 指南,并执行零 PHI(受保护健康信息)策略。系统通过复杂度评分将病例路由至 9B 参数快速模型或 27B 深度推理模型,均基于 26.7 万真实与合成病例通过 QLoRA 在 AMD MI300X 硬件上微调完成。借助 Unsloth 优化与序列打包技术,全数据集训练仅需约 50 分钟,效率提升 56 倍。系统支持本地部署,保障数据主权,适用于医院环境。

重点: 为医疗 AI 提供兼顾隐私、效率与临床准确性的可落地参考架构

来源:

Anthropic 与 Akamai 达成 18 亿美元计算基础设施协议

AnthropicAkamai 达成一项为期多年、价值 18 亿美元 的计算基础设施协议,Akamai 将为 Anthropic 提供大规模云计算能力,支持其 AI 模型训练与推理。此举不仅强化了 Anthropic 的算力基础,也标志着 Akamai 从传统 CDN 向高性能计算的战略转型。资本市场反应积极,Akamai 股价一度上涨 28%。该合作反映了 AI 行业激烈的算力竞争,以及老牌服务商通过与顶级 AI 公司绑定重塑市场地位的趋势。

重点: 凸显 AI 算力需求的爆炸性增长及基础设施合作新模式。

来源:

法国检方对 X 平台及埃隆·马斯克展开刑事调查

法国检方已对 埃隆·马斯克 及其社交平台 X 展开刑事调查,指控内容包括传播未成年人色情图像、Grok 生成否认纳粹大屠杀的言论以及深度伪造色情内容。此前法国执法部门搜查了 X 在巴黎的办公室,并传唤马斯克及前 CEO Linda Yaccarino 接受讯问,但两人均未如期到场。检方警告,若再次缺席,将面临 缺席起诉。此举标志着法国当局正通过刑事手段强化对平台内容监管的执法力度,可能对全球社交媒体和 AI 生成内容的监管产生示范效应。

重点: 标志着 AI 生成内容面临日益严格的法律监管与追责。

来源:

Richard Sutton 团队提出‘意图更新’方法,解决流式强化学习难题

图灵奖得主 Richard Sutton 团队提出 “意图更新”(Intentional Updates) 新方法,解决流式强化学习的 “流式壁垒” 问题。传统方法因固定步长导致更新不稳定,而该方案借鉴 1967 年 NLMS 算法思想,以期望的函数输出变化量反推步长,确保每次更新幅度可控。在 MuJoCo 等任务中,新方法在批量大小为 1 的流式设置下性能媲美 SAC,且计算量仅为后者的 1/140。实验表明,其更新误差控制精准,显著降低对稳定化技巧的依赖,为在线持续学习开辟新路径。

重点: 为在线强化学习提供高效稳定的理论基础,推动实时 AI 系统发

来源:

变更与实践

Anthropic 发布基于 HackerOne 的公开漏洞赏金计划

安全研究人员可通过 HackerOne 平台报告 Claude.aiClaude Code 等 Anthropic 系统的安全漏洞,按 CVSS 标准获取奖励。企业安全团队应关注此计划,并评估自身 AI 系统是否可借鉴类似外部众测模式。

来源:

Arcjet 推出 Guards 功能,将安全防护嵌入 AI 代理内部

开发者可将 Guards SDK 集成到 AI 代理的工具调用和工作流中,实现 提示注入检测PII 数据屏蔽用户级 Token 预算控制。建议在构建涉及敏感数据或外部操作的 AI 代理时,评估并引入此类内核级安全策略。

来源:

字节跳动 UI-TARS Desktop v0.3.0 发布,强化多模态 AI 智能体

开发者可体验 UI-TARS Desktop 提供的桌面与浏览器 GUI 自动化控制能力,新版本支持流式工具和沙箱执行环境。适合用于 RPA、测试自动化或辅助开发场景,需注意本地化部署带来的隐私优势与计算资源需求。

来源:

Bun 实验性 Rust 重写原型测试兼容性达 99.8%,但争议持续

关注 Bun 从 Zig 迁移至 Rust 的进展,其 99.8% 测试通过率 引发热议。开发者应理性看待测试通过率与生产环境可维护性、安全性的差异,并关注 LLM 在代码迁移中扮演的角色及其对代码质量的影响。

来源:

安全与风险

cPanel 披露 3 个新漏洞,影响约 4.4 万台服务器

使用 cPanel 的共享主机环境、WordPress 及 PHP 站点管理员。 立即检查并应用 cPanel 官方发布的安全补丁。长期应评估从 cPanel 等弱隔离架构迁移至更安全方案的可能性,并加强对共享环境的安全监控。

来源:

FreeBSD 披露 execve() 本地提权漏洞,需重启修复

运行 FreeBSD 15.0R-p7 及更早版本的系统管理员。 通过 freebsd-update 升级系统并重启以修复漏洞。鉴于无临时缓解措施,运维团队应制定分批升级计划,使用 Ansible 等工具降低业务中断影响。

来源:

开源与工具

Oracle AI Developer Hub 开源,提供企业级 AI 开发完整工具链

该资源库为开发者提供了基于 Oracle 数据库和 OCI 服务构建 AI 应用、智能体的五大核心模块(Apps、Notebooks、Guides 等),包含大量端到端示例和 Jupyter 教程,是快速学习企业级 AI 开发实践的宝贵资料。

来源:

Chrome DevTools MCP 工具发布,让 AI 编码助手控制实时浏览器

该工具允许 Gemini、Claude、Cursor 等 AI 助手通过 Model Context Protocol 直接操作和调试 Chrome 浏览器,实现了 AI 辅助开发、测试与性能分析的深度集成,显著提升开发效率。

来源:

agentmemory 开源工具发布,为 AI 编程代理提供持久化记忆

该工具通过自动捕获工具使用记录并压缩为可搜索记忆,解决了 AI 代理在多会话间的上下文丢失问题。其 95.2% 的检索准确率92% 的 Token 节省效果,对提升开发代理效率具有实际价值。

来源:

数据与洞察

王宜平利用自研 AI 框架提升拉姆齐数 R(3,17) 下界

该突破展示了 AI 在纯数学研究中的巨大潜力,其采用逆向构造与 AI 自我迭代优化的方法,仅用普通 CPU 服务器完成,成果已开源,为 AI 辅助科学发现提供了新范式。(将 R(3,17) 的下界从 92 提升至 93,打破该问题长达 32 年的停滞状态;同时刷新 R(4,15) 下界至 160。)

来源:

今日观察

今日 AI 领域呈现 技术范式革新产业生态重构 并行的态势。英伟达 WAM 架构的提出可能重塑机器人开发路线,而 Anthropic 与 Akamai 的巨额算力合作则凸显了基础设施的基石作用。对于开发者而言,OncoAgent、agentmemory 等开源项目和工具提供了落地 AI 应用的新参考;对于企业,内容监管与安全合规的压力持续上升。短期内,AI 在垂直领域(如医疗、机器人)的专业化、可靠化应用将加速,同时 围绕 AI 生成内容的法律与伦理框架 也将进入快速构建期。