内容
声明:完全使用AI生成,可能存在错误,需谨慎甄别。
摘要
今日 AI 领域迎来多项重磅发布。DeepSeek 正式发布 V4 API,推出 Pro 和 Flash 双版本,全系标配 1M 超长上下文,在数学、代码等核心推理评测中超越现有开源模型,Agent 能力接近 Claude Opus 4.6,同时完成华为昇腾芯片适配,被视为中国 AI 算力自主化的重要里程碑。Google 计划向 Anthropic 投资最高 400 亿美元,包括现金与算力支持,Anthropic 估值达 3500 亿美元,并考虑最早 10 月 IPO。OpenAI 发布 GPT-5.5,同时在 Google Cloud Next '26 大会上推出 Workspace Agents,标志着企业 AI 从个人实验走向受治理的共享基础设施。此外,ICLR 2026 获奖论文揭晓,DCGAN 获时间检验奖,ComfyUI 估值达 5 亿美元,AI 生成内容控制权成为创作者关注焦点。
今日大事
DeepSeek V4 API 正式发布,百万上下文成标配
DeepSeek 正式发布 V4 API,推出 V4-Pro(1.6T 总参数/49B 激活)和 V4-Flash(284B/13B 激活)两个版本,全系标配 1M(百万 token)超长上下文。Pro 版本在数学、STEM、代码等核心推理评测中超越现有开源模型,Agent 能力接近 Claude Opus 4.6;Flash 版本主打低延迟与高性价比,缓存命中输入低至 0.2 元/百万 tokens。模型权重已在 Hugging Face、ModelScope 以 MIT 许可证开放,完整保留云端 API 全量能力,无功能阉割,同时完成主流推理与 Agent 框架的 Day 0 适配。V4 引入三大核心升级:mHC(流形约束超连接) 提升深层训练稳定性、混合注意力机制(CSA 与 HCA 交替)实现高效长文处理、以及采用 Muon 优化器替代 AdamW。在 1M 上下文场景下,V4-Pro 的单 token FLOPs 仅为 V3.2 的 27%,KV cache 缩减至 10%,有望缓解 HBM 短缺问题。旧 API 接口将于 2026 年 7 月 24 日停用。
重点: 顶级开源模型首次完整跑通国产算力,定价远低于海外闭源旗舰
来源:
- DeepSeek 正式发布 V4 API:Flash/Pro 双版本齐发,百万上下文成标配(极客公园)
- DeepSeek V4 Pro(1.6T-A49B)和 Flash(284B-A13B),Base 和 Instruct 版本——可在华为昇腾芯片上运行(Latent Space)
- DeepSeek V4报告太详尽了!484天换代之路全公开(量子位)
- 🔥 DeepSeek V4:1M 上下文开权重,数学代码强但中美争议大(News Hacker | 极客洞察)
- 早报|小米YU7 GT定档五月底/罗福莉:中美顶尖模型代差仅两三个月/餐馆「反向抹零」被立案调查(爱范儿)
- DeepSeek-V4 预览版本正式发布并开源(Readhub - 每日早报 - Readhub)
Google 计划向 Anthropic 投资最高 400 亿美元
Google 计划向 AI 公司 Anthropic 投资最高 400 亿美元,其中 100 亿美元立即到位,对应 Anthropic 3500 亿美元估值;若达成特定业绩目标,后续再追加 300 亿美元。作为协议的一部分,Google Cloud 将在未来五年为 Anthropic 新增 5 吉瓦算力容量。Anthropic 严重依赖 Google 的 TPU 芯片及云服务,此前已与 Google、Broadcom 达成 3.5 吉瓦 TPU 算力协议(2027 年起)。近期 Anthropic 动作频频:与 CoreWeave 签署数据中心协议,并获 Amazon 追加 50 亿美元投资。投资者对其估值兴趣已升至 8000 亿美元以上,公司亦考虑最早 10 月 IPO。该交易引发广泛争议,核心在于其循环融资(circular financing)结构——Anthropic 已签下多吉瓦级 Google TPU 采购协议,投资款很可能通过算力账单回流 Google。
重点: AI 基础设施竞争白热化,算力锁定成为巨头博弈核心
来源:
- Google 计划向 Anthropic 投资最高 400 亿美元,包括现金与算力支持(TechCrunch)
- 谷歌计划向人工智能初创公司Anthropic投资至多400亿美元(Readhub - 每日早报 - Readhub)
- 💸 Google 拟向 Anthropic 投 400 亿美元:循环融资、算力回流与 AI 泡沫争议(News Hacker | 极客洞察)
- 早报|小米YU7 GT定档五月底/罗福莉:中美顶尖模型代差仅两三个月/餐馆「反向抹零」被立案调查(爱范儿)
OpenAI 发布 GPT-5.5 及 Workspace Agents
OpenAI 于周四正式发布 GPT-5.5,称其为智能程度最高、使用体验最直观的模型,在智能体化、自然交互计算领域实现重大突破,具备更快的运算速度、更精准的逻辑推理能力,且消耗令牌更少。该模型在多项基准测试中表现优异,综合评分领先旧版及竞品模型,其操控电脑办公及科研能力显著提升,还可应用于药物研发等领域。此外,OpenAI 推出 Workspace Agents,允许企业构建一次 AI Agent 并在团队间共享,通过管理员控制工具访问权限和人工审批流程,将 AI 从分散的个人实验转变为受治理的共享基础设施。Workspace Agents 基于 Codex,目前向部分 ChatGPT Business 账户开放研究预览,免费使用至 5 月 6 日。OpenAI 还发布了 GPT-5.5 提示指南,明确警告用户不要将 GPT-5.5 视为 GPT-5.2 或 GPT-5.4 的直接替代品,而应将其视为全新的模型系列进行调优。
重点: 企业 AI 管理从个人实验走向共享基础设施,标志 AI 治理
来源:
- OpenAI 正式发布 GPT-5.5(Readhub - 每日早报 - Readhub)
- OpenAI本周的真正主角是Workspace Agents,而非GPT-5.5(The New Stack)
- GPT-5.5 提示指南(Andrej Karpathy Curated RSS)
- 引用 Romain Huet 的发言(Andrej Karpathy Curated RSS)
Google Cloud Next '26 大会:迈入 AI 智能体时代
在 Google Cloud Next '26 大会上,谷歌正式迈入AI 智能体(agentic)时代,推出多项重磅更新。核心发布包括全新的 Gemini Enterprise Agent Platform,为开发者提供端到端的 AI 智能体构建、治理与扩展平台,支持 Gemini 3.1 Pro 等先进模型,并新增对 Anthropic Claude Opus 4.7 的开放支持。面向普通用户,Gemini Enterprise 应用通过无代码 Agent Designer 让任何人都能创建基于触发器的工作流。底层算力方面,谷歌发布第八代 TPU 芯片——TPU 8t(训练)与 TPU 8i(推理),后者每美元性能提升 80%,同时率先提供 NVIDIA Vera Rubin NVL72 系统。此外,Agentic Data Cloud 通过 Knowledge Catalog 自动标记企业数据,支持跨云查询(包括 AWS),安全方面整合 Wiz 平台推出威胁狩猎等专用 AI 智能体。
重点: 谷歌全面布局 Agent 生态,算力与平台双轮驱动
来源:
- Google Cloud Next '26 大会七大亮点(The Keyword)
ICLR 2026 获奖论文揭晓,DCGAN 获时间检验奖
ICLR 2026 获奖论文于 4 月 25 日正式揭晓,会议于 4 月 23 日至 27 日在巴西里约热内卢举行,今年共收到约 19000 篇有效投稿,总录取率约 28%。本届共评选出 2 篇杰出论文奖、1 篇荣誉提名,以及 2 篇时间检验奖。获奖杰出论文中,《Transformers are Inherently Succinct》从理论层面证明 Transformer 相比有限自动机和线性时序逻辑能以更简洁的方式表示形式语言;《LLMs Get Lost In Multi-Turn Conversation》则通过大规模实验发现,所有被测模型在多轮对话中的表现明显低于单轮场景,性能平均下降 39%。时间检验奖方面,Alec Radford 等人的经典工作《DCGAN》获奖——三位作者无一人是博士生,包括两位本科生和一位硕士,引用量超 2 万,是 GAN 工程应用的开山之作。另一篇获奖论文提出的 DDPG 算法首次成功解决了强化学习在连续控制中的两大瓶颈。
重点: 多轮对话可靠性问题获学界关注,DCGAN 十年影响力获认可
来源:
- ICLR 2026获奖论文揭晓:两篇杰出论文,大神Alec Radford经典工作获时间检验奖(机器之心)
- 0博士组合拿下ICLR时间检验奖!两个GPT天才本科生+二本逆袭LeCun弟子,十年论文终封神(量子位)
变更与实践
DeepSeek V4 旧 API 接口将于 7 月 24 日停用
优先级:medium;开发者需尽快将现有集成迁移至 V4 对应版本,仅需修改 model_name 即可完成调用切换,当前阶段已平滑指向 V4。建议提前测试新版本的工具调用和 JSON 输出兼容性。
来源:
- DeepSeek 正式发布 V4 API:Flash/Pro 双版本齐发,百万上下文成标配(极客公园)
- DeepSeek-V4 预览版本正式发布并开源(Readhub - 每日早报 - Readhub)
GPT-5.5 不应视为 GPT-5.2/5.4 直接替代品
优先级:medium;OpenAI 明确建议将 GPT-5.5 视为全新模型系列进行调优,从最小化提示开始,逐步针对代表性示例调整推理努力程度、详细程度、工具描述和输出格式。多步骤任务中,建议在工具调用前发送简短用户可见更新以提升体验。
来源:
- GPT-5.5 提示指南(Andrej Karpathy Curated RSS)
- OpenAI 正式发布 GPT-5.5(Readhub - 每日早报 - Readhub)
华为昇腾超节点全面支持 DeepSeek V4
优先级:medium;华为昇腾 950 通过降低 Attention 计算和访存开销提升推理性能,结合量化算法实现高吞吐、低时延部署。昇腾 A3 超节点系列产品全面适配,并提供基于该超节点的训练参考实现。国产算力用户可优先考虑该平台。
来源:
- 华为昇腾超节点系列产品全面支持 DeepSeek V4(Readhub - 每日早报 - Readhub)
- DeepSeek V4 Pro(1.6T-A49B)和 Flash(284B-A13B),Base 和 Instruct 版本——可在华为昇腾芯片上运行(Latent Space)
英伟达要求全体员工使用 OpenAI Codex 编程工具
优先级:low;英伟达 CEO 黄仁勋向全体员工发送邮件,要求使用基于 GPT-5.5 的 Codex 编程工具,已有 10000 员工提前体验并取得成果。双方团队搭建了 Codex 实验室,并将在未来几周举办线上研讨会。AI 编程工具正从可选变为强制基础设施。
来源:
- 黄仁勋要求英伟达所有员工使用 OpenAI 的 Codex 编程工具(Readhub - 每日早报 - Readhub)
美团启动万亿级大模型测试,基于国产算力集群
优先级:low;美团已悄然启动新一代万亿级大模型的测试邀请,该模型完全基于国产算力集群完成训练,目前仅面向受邀用户开放测试。这标志着国产算力在万亿级模型训练方面可能实现重要突破。
来源:
- 美团启动万亿级大模型测试,基于国产算力集群完成训练(Readhub - 每日早报 - Readhub)
安全与风险
Rode 音频接口默认开启 SSH,固件未加密签名
Rode 音频接口用户,设备暴露于局域网中,攻击者可直接修改 rootfs、添加 authorized_keys 并刷回设备 建议用户检查设备网络隔离情况,避免将音频设备接入不可信网络。关注厂商固件更新,欧盟 Cyber Resilience Act(CRA)可能推动厂商采用签名固件和 secure boot 机制。
来源:
- 🔓 Rode 音频接口默认开 SSH,固件可直接改 tarball(News Hacker | 极客洞察)
Palantir 协助 IRS 调查金融犯罪,数据整合引发隐私担忧
美国纳税人,IRS 使用 Palantir 的 Lead and Case Analytics 软件整合并分析多个联邦机构数据,从数百万条记录中识别关联并映射人际关系与通信网络 非营利监督组织 American Oversight 已起诉特朗普政府,要求公开相关记录。关注后续诉讼进展及联邦机构数据使用透明度。
来源:
- Palantir 据报协助 IRS 调查金融犯罪(TechCrunch)
Claude Code 用户大规模退订,token 计费不透明与质量回退
Anthropic Claude Code Pro/Max 订阅用户,面临 token 限额黑箱、5 小时会话窗口和缓存 TTL 缩短等问题 用户可考虑转向 OpenAI Codex、Kimi、DeepSeek 或本地运行工具(如 llama.cpp、Ollama)以降低对单一厂商依赖。关注 Anthropic 后续是否调整计费策略。
来源:
- 😠 Claude Code 限额飙升、质量回退与糟糕支持引发退订(News Hacker | 极客洞察)
Windows 11 4月更新导致部分设备循环重启/像素化画面
搭载 GTX 1080 Ti 显卡的戴尔和惠普 Windows 11 设备用户,故障表现为系统反复重启且自动修复失败 建议受影响用户通过 WinRE 恢复环境强制关机三次进入高级选项,选择卸载最近安装的更新(KB5083769)以尝试恢复系统。微软尚未确认该问题。
来源:
开源与工具
DeepSeek 发布 DeepEP:高效 MoE 专家并行通信库
专为 Mixture-of-Experts 架构设计,提供高吞吐、低延迟的 all-to-all GPU 内核,支持 FP8 低精度运算。在 H800 测试中,节点内 NVLink 带宽可达 153-158 GB/s,跨节点 RDMA 带宽在 43-58 GB/s 之间,低延迟内核在 8 专家并行时延迟仅 77-114 微秒。已在腾讯、蚂蚁集团等机构的优化下性能提升达 30%。
来源:
- DeepEP:deepseek-ai 开发的高效专家并行通信库(GitHub All Languages Daily Trending)
HuggingFace 发布 ml-intern:自主机器学习工程师工具
能够自动阅读论文、训练模型并部署 ML 模型,深度集成 Hugging Face 生态系统。核心架构包含最大 300 轮迭代的智能体循环,具备上下文管理(自动压缩至 170k)、工具路由和循环检测机制,支持 Claude、GPT 等多种大模型。
来源:
- huggingface/ml-intern(GitHub All Languages Daily Trending)
Free Claude Code:免费使用 Claude Code CLI 的开源代理
将 Claude Code 的 API 请求路由至 NVIDIA NIM(40次/分钟免费)、OpenRouter、DeepSeek、LM Studio 或 llama.cpp 等五个提供商,零成本使用,仅需设置两个环境变量。支持通过 Discord 或 Telegram 机器人远程控制 Claude Code。
来源:
- Alishahryar1/free-claude-code(GitHub All Languages Daily Trending)
微软发布 TypeScript-Go:TypeScript 编译器的 Go 语言重写版
旨在提升性能,目前处于预览阶段,npm 上可通过 @typescript/native-preview 包安装。核心功能如程序创建、解析、类型检查、JSX 支持、代码发射和增量构建已完成,语言服务(LSP)接近完成。长期计划是将此仓库合并回主仓库。
来源:
- microsoft/typescript-go(GitHub All Languages Daily Trending)
宽德 Will 联合斯坦福清北发布 SimpleTES 科学发现框架
将科学发现中的"试错"过程系统化为可规模化的计算流水线,通过三个可调度的维度实现测试时扩展。在 21 个前沿科学任务中,基于开源模型的 SimpleTES 不仅刷新多项 SOTA,还在数学构造、代码优化等领域反超人类专家和顶级闭源模型。
来源:
数据与洞察
阿里云中国市场份额升至 32.8%,AI 需求成关键驱动力
AI 需求成为推动阿里云领先优势持续扩大的关键动力,海外业务国际化进程明显加速,云+AI 融合趋势下阿里云持续扩大优势。(2025年阿里云中国市场份额 32.8%,同比提升 2.7 个百分点,收入增速 34.4%;全球市场份额从 7.2% 升至 7.7%,全球收入增速约 35%)
来源:
- Gartner:阿里云市场份额升至 32.8%,再度扩大中国第一优势(Readhub - 每日早报 - Readhub)
ComfyUI 估值达 5 亿美元,创作者寻求 AI 生成媒体控制权
在 AI 生成内容泛滥的时代,"人类介入循环"的节点式工作流方式赢得更多关注,标志着创作者对 AI 生成过程精细控制的需求日益增长。(完成 3000万美元 融资,估值 5亿美元,拥有超过 400万用户)
来源:
- ComfyUI估值达5亿美元,创作者寻求对AI生成媒体的更多控制权(TechCrunch)
Mac mini M4 因 AI 本地化需求激增全面缺货
Mac mini 因低功耗、静音及适合 24/7 运行,成为运行 OpenClaw 等本地 AI 模型的热门选择,叠加全行业内存紧张,供需失衡短期内难以缓解。(基础款售价 599美元,eBay 加价至 715-795美元(全新)和 979美元(优质翻新),溢价超百美元)
来源:
- 加价Mac mini涌入eBay,AI需求激增导致缺货(TechCrunch)
X-energy 上市首日股价大涨 27%,核能受 AI 数据中心需求推动
投资者对核能兴趣高涨,主要受 AI 驱动的数据中心电力需求推动,亚马逊已签约购买最多 5 吉瓦产能,模块化核反应堆被视为满足稳定供电需求的关键方案。(开盘价 30.11美元,收盘价 29.20美元,高于 23 美元发行价,收盘估值达 115亿美元)
来源:
- X-energy上市首日股价大涨27%,此前IPO规模扩大(TechCrunch)
今日观察
今日多条主线交织:DeepSeek V4 的发布标志着开源模型在能力与性价比上对闭源旗舰发起全面挑战,同时华为昇腾的适配为中国 AI 供应链自主化注入强心剂;Google 对 Anthropic 的 400 亿美元投资揭示了算力锁定已成为巨头博弈的核心战场,循环融资结构引发对 AI 估值泡沫的深层思考;OpenAI GPT-5.5 与 Workspace Agents 则表明 AI 正从个人工具走向企业级治理基础设施。短期内,开发者需关注 DeepSeek 旧 API 迁移窗口和 GPT-5.5 的调优策略变化,企业采购应警惕单一云厂商锁定风险。预计未来一个月内,围绕 DeepSeek V4 的本地部署生态将快速成熟,而 Anthropic 的 IPO 进程与估值变化将成为行业风向标。