内容
声明:完全使用AI生成,可能存在错误,需谨慎甄别。
摘要
2026-05-09 AI 领域呈现多线并进格局,值得关注的信息:OpenAI研究员翁家翌提出启发式学习新范式,挑战传统强化学习;百度发布文心大模型5.1,以仅业界6%的预训练成本实现国内搜索能力第一;RadixArk完成1亿美元种子轮融资,英伟达、AMD、英特尔三大芯片巨头罕见联手投资,凸显AI基础设施的战略地位;同时,DeepSeek大幅开放识图模式内测,标志其正式进入多模态交互时代;MiniMax披露M2系列模型低频词元退化问题,引发对模型稳定性的关注。
今日大事
OpenAI研究员提出启发式学习新范式,无需梯度更新实现强化学习
OpenAI研究员翁家翌提出启发式学习(HL)新范式,通过GPT-5.4驱动的Codex自主迭代生成.py代码,在不更新神经网络参数的情况下实现强化学习。该方法以显式程序代码替代梯度下降,在Atari游戏Breakout中达到864分理论满分,并在Atari 57基准测试中与PPO算法持平,部分游戏超越人类水平。在MuJoCo机器人控制任务中,HL在Ant和HalfCheetah上分别取得6000+和11836分,展现强大性能。HL具备抗遗忘、可解释、高样本效率等优势,未来或与神经网络融合,解决持续学习难题。
重点: 为AI学习范式提供全新路径,可能解决持续学习难题。
来源:
百度发布文心大模型5.1:预训练成本仅业界6%,搜索能力国内第一
百度于5月9日正式发布新一代基础大模型文心大模型5.1,采用“多维弹性预训练”技术,预训练成本仅为业界同规模模型的6%,实现高效能压缩。该模型在LMArena搜索能力排名中位居国内第一、全球第四,是唯一进入前列的国产模型。其在智能体、推理、知识整合和深度搜索等方面表现突出,部分能力已接近国际领先水平,并已上线千帆平台及文心一言官网,面向企业与开发者开放。
重点: 国产大模型在关键能力上实现突破,并大幅降低训练成本。
来源:
RadixArk完成1亿美元种子轮融资,三大芯片巨头罕见联手投资
AI基础设施公司RadixArk宣布完成1亿美元种子轮融资,投后估值达4亿美元,创下2026年AI Infra赛道早期融资纪录。本轮融资由Accel领投,Spark Capital联合领投,英伟达、AMD、英特尔三大芯片巨头罕见联手参投,Databricks、OpenAI背景技术领袖亦全线支持。RadixArk由开源推理引擎SGLang团队创立,其产品已成为GitHub 27K+ stars、部署于40万+ GPU的开源推理事实标准,支持Google、Microsoft、xAI等巨头日处理万亿级token。
重点: 三大芯片巨头罕见联手,凸显AI基础设施的战略地位。
来源:
DeepSeek大幅开放“识图模式”内测,正式迈入图文多模态交互时代
DeepSeek于5月9日大幅开放“识图模式”内测,标志着其正式迈入图文多模态交互时代。该功能新增独立入口,支持用户上传图片实现复杂跨媒介交互,具备深度图片识别与语义理解能力,超越传统OCR。此举填补了其在多模态领域的空白,推动国产大模型从文本生成向“视觉语言耦合”转型,有望在自动化办公、工业视觉等场景释放生产力,加速多模态能力普惠。
重点: 填补国产大模型多模态空白,推动视觉语言耦合转型。
来源:
- DeepSeek大范围开放识图模式:多模态理解功能正式开启内测(AI新闻资讯)
MiniMax披露M2系列模型低频词元退化问题及修复方案
MiniMax披露其M2系列大模型因后训练阶段低频词元退化导致人名生成异常,如“马嘉祺”被错误输出。问题源于分词器将低频词元(如“嘉祺”)拆分后训练不足,被高频词元向量挤压,引发4.9%词元性能衰退,其中日文词元退化率达29.7%,甚至出现日语对话混入俄语现象。团队通过全词表合成数据、混入预训练语料及词表监控三项策略修复,使异语混入率从47%降至1%,显著提升模型稳定性。
重点: 揭示大模型训练中的潜在缺陷,提升模型稳定性。
来源:
变更与实践
OpenAI发布Codex for Chrome扩展,实现浏览器深度集成
OpenAI正式推出Codex for Chrome扩展程序,支持AI直接操作浏览器,访问已登录页面(如Gmail、LinkedIn),并支持跨标签页读取上下文。该扩展采用@Chrome语法调用,系统自动选择插件、Chrome或内置浏览器三层工具。目前Codex周活跃用户已突破400万,较年初增长8倍。开发者可关注其API集成与自动化脚本编写能力,优化基于浏览器的复杂工作流。
来源:
- OpenAI 推出 Codex Chrome 扩展,深度集成浏览器工作流(Readhub - 每日早报 - Readhub)
- OpenAI 推出 Codex Chrome 扩展程序,提升浏览器操作效率(AI新闻资讯)
- OpenAI 官宣 Codex 插件接管浏览器,实测复杂任务表现惊人(AI新闻资讯)
- OpenAI Codex 通过新 Chrome 扩展进入浏览器(The New Stack)
- OpenAI发布Codex Chrome扩展程序 深度集成浏览器环境(AI新闻资讯)
阶跃星辰发布StepAudio 2.5 Realtime实时语音大模型
阶跃星辰发布新一代实时语音大模型StepAudio 2.5 Realtime,聚焦副语言感知,可识别语调、语速、叹息等情绪信号,实现智商与情商双重提升。支持通过API进行自定义AI人设,用户体验得分达80.41。企业可评估其在情感交流、客服及多场景智能交互中的应用潜力,提升对话自然感。
来源:
- 阶跃星辰推出 StepAudio 2.5 Realtime,实时语音 AI 再升级!(AI新闻资讯)
- 阶跃星辰发布StepAudio 2.5 Realtime:赋予大模型真人般的情感与智慧(AI新闻资讯)
谷歌更新Gmail移动端应用,底部新增AI Inbox入口
谷歌在移动端Gmail应用中推出重大更新,底部新增“AI Inbox”快捷入口,将生成式AI功能“帮我写”外显化,用户可一键激活AI辅助写作。此举旨在提升AI功能的触达率,推动AI从“可选插件”向“原生核心”转型。开发者和用户可关注其交互优化,以应对微软Copilot的竞争。
来源:
Grok接入苹果CarPlay框架,拓展车载交互场景
马斯克旗下xAI公司通过更新iOS版Grok应用,正式支持苹果CarPlay框架,用户可在驾驶时通过车载中控屏与Grok进行自然语言交互,实现语音优先的对话体验。此次更新在iOS 26.4放宽语音应用限制背景下推出,优化了“临时静音”和语音包切换等功能,提升驾驶安全性与个性化体验。
来源:
安全与风险
React Server Components (RSC) 协议被披露安全漏洞
使用React Server Components的Web应用 React Server Components(RSC)协议的安全漏洞被曝光,暴露了该协议缺乏正式文档的问题,导致攻击链分析与入侵检测困难。Meta在约17小时内完成漏洞确认与响应,并与Cloudflare等厂商协作提前布防。开发者应审查RSC的使用,关注官方安全更新,并考虑RSC架构带来的客户端/服务端边界模糊风险。
来源:
- 😬 React2Shell:RSC 协议失控、Meta 17 小时响应与 React 争议(News Hacker | 极客洞察)
AI正冲击协调漏洞披露和开源社区‘静默修复’安全文化
开源软件维护者、安全研究人员 随着LLM和反编译工具能力提升,公开补丁和代码提交几乎等同于即时漏洞披露,攻击者可快速复现漏洞,使传统“先修复、后公开”的协调披露机制失效。讨论指出,AI放大了透明化趋势,但核心矛盾仍是防御节奏跟不上武器化速度。防御方应考虑自动化修补、强化测试与人工审核结合,以及转向闭源、SaaS或“黑暗森林”式架构以缩小攻击面。
来源:
- 🧨 AI 让补丁一发就成漏洞披露(News Hacker | 极客洞察)
开源与工具
LobeHub发布开源AI聊天机器人框架,打造人机协同空间
LobeHub是一个开源、可扩展的AI聊天机器人框架,旨在打造人类与智能体协同进化的工作与生活空间。项目支持多智能体协作、可视化思维链(CoT)、分支对话、实时联网搜索、插件系统、语音交互等丰富功能,并提供多种一键部署方案,适合希望构建自定义AI助手或集成多智能体工作流的开发者。
来源:
- LobeHub:开源可扩展AI聊天机器人框架(GitHub All Languages Daily Trending)
AWS Labs开源AI-DLC,定义AI驱动的软件开发生命周期
AI-DLC是AWS Labs开源的AI驱动软件开发生命周期自适应工作流系统,旨在通过智能化规则引导AI编码代理实现高质量、可控的软件开发。其核心为三阶段自适应流程:Inception、Construction、Operations。系统支持多平台集成,通过项目级规则文件自动适配不同IDE和AI助手,适合希望规范化AI辅助开发流程的团队。
来源:
- AWS Labs 开源 AI 驱动软件开发生命周期自适应工作流系统(GitHub All Languages Daily Trending)
数据与洞察
英伟达2026年迄今已承诺投入超400亿美元用于AI股权投资
英伟达作为AI生态关键投资者,其大规模资本支出策略虽被批评为“循环交易”,但若成功,或助其构建竞争护城河,深刻影响AI产业格局。(超400亿美元投资总额,其中300亿美元投向OpenAI,其余包括对康宁和数据中心运营商IREN等上市公司的多笔数十亿美元投资。)
来源:
- 英伟达今年已承诺400亿美元用于人工智能股权投资(TechCrunch)
我国人工智能产业日均Token调用量突破140万亿次
Token调用量的飙升反映大模型商业化闭环形成,并加速渗透至生产与消费场景,驱动我国向AI驱动的数智化深度转型,推动算力租赁市场升温。(截至2026年3月,日均Token调用量突破140万亿次,两年涨幅超100,000%,高端GPU出租率超90%。)
来源:
- 我国日均 Token 调用量破140万亿,两年涨幅超千倍(AI新闻资讯)
今日观察
今日AI领域主线集中在学习范式创新、模型能力突破与成本压缩、基础设施融资热潮以及多模态能力普及。OpenAI的启发式学习和百度的文心5.1预示着模型训练效率的飞跃,而RadixArk的融资则凸显底层算力仍是竞争核心。这些变化将加速AI工具的民主化,普通用户能以更低成本体验更强大的多模态交互,开发者则能借助新框架和开源工具提升效率,企业采购需关注模型性价比与基础设施整合。短期内,国产大模型在垂直场景的应用深化和AI Agent工作流的标准化值得持续关注。