2026-05-18 AI 日报

来源:21 个引用生成:2026/05/19 08:30

内容

声明:完全使用AI生成,可能存在错误,需谨慎甄别。

摘要

2026-05-18 AI 领域呈现多线并进格局,值得关注的信息:openJiuwen社区开源发布JiuwenSwarm,开启群体智能范式跃迁;蔚蓝科技发布BabyAlpha A3机器狗,以国产芯片和1/10成本打破英伟达在高端机器人芯片领域的垄断;上海交通大学等团队发布CX-Mind胸片诊断大模型,推进医学AI进入“可验证推理链”时代;小红书快手团队分别发表CCD感知自适应线程编排框架ALM-MTA论文,在系统优化与推荐算法领域取得突破;同时,Grafana Labs遭黑客入侵窃取源代码并拒绝支付赎金,引发开源安全讨论;AMD SEV-SNP披露Infinity Fabric配置失误漏洞,威胁云端机密计算安全。

今日大事

openJiuwen社区开源发布JiuwenSwarm,开启群体智能范式

openJiuwen社区于2026年5月18日正式开源发布JiuwenSwarm,标志着AI从单智能体向群体智能的范式跃迁。该平台基于协同工程理念,构建包含Agent Swarm、Swarm Skills、Swarm Skills Hub自演进机制的全栈体系,支持多智能体自主分工与动态协商。在医疗、教育等场景验证中,PinchBench评测达94.2% SOTA,且token消耗降低34.8%。系统支持HOTSHITS两种人机协作模式,全套技术栈开源,推动“AI养蜂”生态发展。

重点: 首个面向群体智能的全栈开源平台发布,推动AI从单体到协同的范

来源:展开 2 条收起 2 条

蔚蓝科技发布消费级机器狗BabyAlpha A3,打破英伟达算力垄断

蔚蓝科技正式发布消费级四足机器人BabyAlpha A3,搭载6颗国产芯片异构计算集群,总算力达2,070 TFLOPS,较上一代提升1000倍,可流畅运行70亿参数端侧大模型(TPS达280)。其性能对标英伟达Jetson AGX Thor,但成本仅300美元,约为其1/10。产品集成超高清视觉、3D感知与立体听觉系统,实现超越人类的感知与全自主决策能力,标志着消费级具身智能迈入实用化阶段。

重点: 以1/10成本提供对标英伟达的算力,有望打破高端机器人芯片垄

来源:展开 3 条收起 3 条

上海交大等联合发布CX-Mind,推进胸片诊断至“可验证推理链”时代

上海交通大学、上海创智学院与瑞金医院联合发布多模态大模型CX-Mind,首次将胸片诊断推进至“可验证推理链”时代。该模型通过交错式推理(interleaved reasoning)实现从影像观察到诊断结论的每一步均有证据支撑,在23个数据集、超70万张影像的评测中,三大能力域平均提升25.1%,并在真实世界测试集Rui-CXR上获得多中心医生五项主观评估全部第一。CX-Mind不仅提升诊断准确性,更强调推理过程的可审查性。

重点: 推动医学AI从“黑箱分类”迈向“可协作推理”的新阶段,提升诊

来源:展开 1 条收起 1 条

小红书与快手团队分别在顶会发表系统优化与推荐算法重要论文

小红书引擎架构团队在ICDE 2026发表论文,提出CCD感知自适应线程编排框架,突破多核CPU向量检索性能瓶颈,在真实业务负载下实现吞吐量最高提升3.7倍P999延迟降低30%~90%快手在ICLR 2026提出ALM-MTA方法,解决多触点归因中的未观测混杂问题,落地后带来作者DAU提升0.6%,AUC相对SOTA提升11%的显著收益。两项研究均代表了中国互联网公司在系统架构与算法优化领域的前沿实力。

重点: 系统级优化与算法创新推动AI基础设施与推荐系统的性能突破。

来源:展开 2 条收起 2 条

Grafana Labs遭黑客入侵窃取源代码,拒绝支付赎金

开源监控工具厂商Grafana Labs确认遭黑客入侵,黑客利用窃取的令牌凭证访问其GitLab代码开发环境,窃取了部分源代码,但未涉及客户数据或财务信息。公司已撤销该令牌并加强安全措施。尽管其软件为开源,Grafana强调遵循FBI建议,拒绝支付赎金,因付款无法保证数据不被泄露,且可能助长未来攻击。目前调查仍在进行中。

重点: 开源厂商遭入侵后坚持不支付赎金,为行业树立安全事件应对标杆。

来源:展开 1 条收起 1 条

变更与实践

Anthropic发布Claude Code多项重要更新

在旧金山举办的“Code with Claude 2026”活动上,Anthropic发布了Claude Code的多项重要更新,包括托管代理(Managed Agents)主动式工作流(Proactive Workflows)能力曲线(Capability Curve)。开发者可关注这些新功能如何提升编码代理的自主性与工作流集成能力。

来源:展开 1 条收起 1 条

腾讯云发布AI设计智能体协作平台Ardot公测

腾讯云于2024年3月26日正式发布AI设计智能体协作平台Ardot,支持通过自然语言描述生成可编辑的设计初稿,并实现一键转代码。平台兼容Figma文件导入,支持多人实时协作。产设研团队可评估其在提升协作效率与打通设计开发全流程方面的潜力。

来源:展开 3 条收起 3 条

Hugging Face发布Open Agent Leaderboard评估基准

Hugging Face发布Open Agent Leaderboard,首个全面评估通用AI代理系统的开放基准,强调评估完整系统(包括工具使用、规划、记忆与容错)而非仅底层模型。研究揭示相同模型搭配不同代理架构可产生显著差异,代理设计对性能影响日益显著。开发者可参考该基准优化代理架构。

来源:展开 1 条收起 1 条

Cloudflare与Stripe合作推出AI代理账户自动化协议

CloudflareStripe联合推出新协议,允许AI代理自主完成创建云账户、注册域名、订阅及部署等操作。Stripe负责身份验证与支付,并设置每月100美元的默认消费上限。此举标志着AI在基础设施管理中的自主性迈出关键一步,开发者可探索其在自动化部署场景中的应用。

来源:展开 1 条收起 1 条

安全与风险

AMD SEV-SNP披露Infinity Fabric配置失误漏洞

云端机密计算安全,使用AMD SEV-SNP技术的虚拟机内存隔离 研究人员发现,通过错误配置AMD芯片内部的Infinity Fabric互连架构,可削弱或破坏SEV-SNP提供的虚拟机内存隔离。尽管该攻击需先控制hypervisor或UEFI,门槛较高,但仍引发对硬件级信任模型的质疑。AMD已发布microcode补丁,用户可通过attestation机制验证修复状态。

来源:展开 1 条收起 1 条

Calif披露M5芯片Mac设备纯数据提权攻击

搭载M5芯片的Mac设备用户 安全公司Calif宣布仅用5天即在搭载M5芯片的Mac设备上实现纯数据提权攻击,突破苹果硬件级内存防护MIE。团队结合两个内核漏洞与侧信道技术,利用Claude Mythos Preview AI模型加速分析,完成全球首次对M5芯片MIE的有效绕过。苹果已在macOS 26.5中修复漏洞,专家呼吁用户立即更新系统

来源:展开 1 条收起 1 条

Grafana Labs源代码遭窃取,开源厂商面临供应链安全挑战

Grafana Labs及其开源生态用户 黑客利用窃取的令牌凭证访问Grafana Labs的GitLab代码开发环境,窃取了部分源代码。公司已撤销令牌并加强安全措施。此事件提醒开源厂商需加强访问凭证管理与环境监控,用户应关注官方安全通告。

来源:展开 1 条收起 1 条

开源与工具

JiuwenSwarm:openJiuwen社区发布群体智能开源平台

标志着AI从单智能体向群体智能的范式跃迁,提供全栈开源支持,推动多智能体自主分工与动态协商的“AI养蜂”生态发展。

来源:展开 2 条收起 2 条

Wox v2.1.0发布:老牌开源桌面启动器更新

这款停更后恢复维护的跨平台桌面启动器新增Glance实时状态显示、截图功能文件预览AI命令等实用功能,性能更优,适合追求效率的用户。

来源:展开 1 条收起 1 条

Agent Skills发布:安全验证的AI编码代理技能注册库

该项目通过严格的静态分析、安全扫描和人工审核,为Claude Code、Cursor、GitHub Copilot等AI编程工具提供可信的能力扩展,解决当前AI技能市场安全性参差不齐的问题。

来源:展开 1 条收起 1 条

数据与洞察

中国大模型周调用量连续三周超越美国,腾讯Hy3 preview登顶

数据表明中国在大模型应用规模上已持续领先,市场竞争格局发生显著变化,腾讯在免费期结束后仍保持领先凸显其用户粘性与技术优势。(全球AI大模型周调用量26.9万亿Token,中国贡献7.693万亿,为美国的1.81倍腾讯Hy3 preview2.66万亿Token登顶,环比增长210%。)

来源:展开 2 条收起 2 条

今日观察

今天AI领域的主线围绕群体智能范式跃迁具身智能成本突破医学AI可解释性提升以及系统与算法底层优化展开,同时开源安全硬件信任模型的风险事件敲响警钟。这些变化正加速AI从单一工具向协同系统、从实验室向消费级产品、从黑箱决策向可审计推理的转变。开发者需关注开源生态的安全实践,企业采购应评估具身智能与端侧大模型的成本效益,普通用户则将看到AI在医疗、机器人等领域的应用日益可靠与普惠。短期内,国产AI芯片在具身智能领域的规模化应用群体智能框架的社区生态建设将成为值得持续关注的热点。