2026-06-25 AI 日报

来源:40 个引用生成:2026/06/26 06:25

内容

声明:完全使用AI生成,可能存在错误,需谨慎甄别。

摘要

2026-06-25 AI 领域呈现模型升级、智能体工具化与安全收紧并行格局,值得关注的信息:Gemini 3.5 Flash强化 computer use 并落地谷歌生态,GPT-5.5 Instant提升意图理解,Qwen-AgentWorld开源面向智能体的世界模型;同时,Dify 漏洞与模型蒸馏争议也在提醒企业同步补齐权限、审计与合规治理。

热点事件

Google 发布 Gemini 3.5 Flash,computer use 直接指向“电脑管家”

Google 正式发布 Gemini 3.5 Flash,重点强化 computer use 能力,让模型能直接接管电脑界面,完成跨软件、长链条任务。官方称其在编码和自主代理任务上已超过 3.1 Pro,响应速度也明显提升。该模型已进入 Gemini 应用和搜索 AI 模式默认栈,开发者可通过 API 调用,企业侧也会因此更容易把 AI 接入桌面与办公流程。

重点: computer use 成熟落地

来源:展开 9 条收起 9 条

OpenAI 升级 GPT-5.5 Instant,意图理解更进一步

OpenAI 推出 GPT-5.5 Instant 新版本,核心变化是更强的意图洞察力与更稳定的任务执行,尤其在购物、本地服务推荐和多约束任务里表现更自然。官方还强调其在医学、金融、法律等高风险场景中的幻觉率已显著下降。此次更新延续了模型从“会回答”走向“更会办事”的方向,付费用户已可体验,免费用户也将很快覆盖。

重点: 意图理解与稳定性增强

来源:展开 5 条收起 5 条

阿里 Qwen 开源 Qwen-AgentWorld,智能体世界模型再推进

阿里巴巴 Qwen 团队开源 Qwen-AgentWorld,定位为面向智能体的语言世界模型。它可在单一模型内模拟 MCP、搜索、终端、SWE、Web、操作系统、Android 等 7 种环境,并同步开放 Qwen-AgentWorld-35B-A3BAgentWorldBench。模型支持 256K 上下文,强调把单轮环境预测能力迁移到多轮智能体任务,这意味着智能体训练不再只靠指令跟随,而是更依赖环境建模能力。

重点: 面向智能体的世界模型

来源:展开 2 条收起 2 条

高通收购 Modular,AI XPU 软件栈竞争升温

高通宣布收购 Modular,交易预计在 2026 年下半年完成。Modular 的价值不在硬件,而在面向多种 AI XPU 的软件栈:一次构建即可跨架构运行,减少开发者为不同芯片重复适配的成本。此次收购被视为高通向 AI 软件生态补位的重要动作,也显示出算力竞争正从单纯卖芯片,转向更完整的推理与编译器栈争夺。

重点: 芯片竞争延伸到软件栈

来源:展开 4 条收起 4 条

变更与实践

Figma 把代码层、动画和工作流生成塞进协作画布

Figma 新版本首次把代码层直接引入协作画布,并原生支持动画、转场和 3D 变换,还进一步整合 Weavy 工作流生成能力。对设计团队来说,这意味着设计稿与工程代码之间的衔接更紧,AI 助手也更接近从辅助创作走向直接产出可复用资产。

来源:展开 2 条收起 2 条

Cloudflare 向所有客户开放自托管 OAuth

Cloudflare 将 自托管 OAuth 全面开放给所有客户,开发者可用标准 OAuth 流程构建 SaaS 集成、内部平台和智能体工具,不必继续依赖 API Token。配套升级还包括同意页体验、撤销机制和底层 Hydra 引擎优化,适合需要更细颗粒度授权与撤销控制的企业应用。

来源:展开 2 条收起 2 条

腾讯 Marvis iOS 版上线,手机与电脑远控打通

腾讯系统级 AI 助手 Marvis 推出 iOS 版后实现全平台覆盖,重点能力是手机与电脑之间的远程连接、文件传输和跨设备任务处理。它把 AI 从单一聊天入口推进到操作系统层,适合经常在多设备之间切换、又希望把文件整理和办公任务交给助手的人群。

来源:展开 2 条收起 2 条

百度文心网站整合升级,入口与能力一起收拢

百度把原本分散的文心相关服务统一到新的百度文心网站,同步升级文心 5.1 底座,并加入 Office 在线编辑、AI PPT、学术研究辅助和 AI 音乐等功能。对用户而言,这类整合降低了入口切换成本,也说明大模型产品正在从单点能力竞争,转向一站式工作台竞争。

来源:展开 2 条收起 2 条

安全与风险

Dify 被披露存在高危跨租户泄露漏洞

开源 AI 应用平台 Dify 被披露存在多个高危漏洞,可能导致跨租户数据泄露,影响范围包括企业用户的 RAG 管道和权限隔离。对已在生产环境部署的平台来说,这类问题会直接威胁敏感数据与租户边界,尤其在多租户和外网暴露场景下更需要优先排查。

影响: 使用 Dify 的企业和多租户应用

建议: 尽快检查权限配置、网络暴露面和依赖版本

来源:展开 1 条收起 1 条

Anthropic 指控阿里 Qwen 团队蒸馏 Claude

Anthropic 在给美国议员的信中指控阿里巴巴 Qwen AI 实验室在特定时间窗口内,通过大量欺诈账户与 Claude 进行高频交互,涉嫌非法蒸馏模型。若指控成立,受影响的不只是双方公司关系,还会进一步放大前沿模型训练数据、调用审计与跨境合规的争议。

影响: Claude 服务、Qwen 团队及相关监管讨论

建议: 企业应强化调用审计、账号风控与模型使用合规检查

来源:展开 3 条收起 3 条

苹果在 iOS 27 Beta 2 中限制 Siri 读取 URL

苹果在 iOS 27 Beta 2 中修改 Siri 底层提示词,要求在用户提供 URL 并请求总结、阅读或提取内容时,直接说明无法访问网页,也不得给出绕过建议。此举主要针对提示词注入等风险,意味着网页摘要类工作流会更受限制,依赖链接直读的助手能力短期内会继续收紧。

影响: iOS 27 测试用户、网页摘要与链接处理场景

建议: 若需网页摘要,优先使用 Safari 页面内能力并避免暴露可被注入的链接流程

来源:展开 1 条收起 1 条

开源与工具

Scrutineer 把漏洞扫描做成“先验证再披露”的自动化流程

Scrutineer 是面向开源仓库的安全扫描工具,特点不是单纯找漏洞,而是把代码审计、去重、威胁建模、补丁生成、破坏性评估和发布跟踪串成完整工作流。它适合想减少误报、又希望把漏洞发现结果直接交给维护者处理的安全团队与研究项目。

适用场景: 开源仓库漏洞扫描、误报控制和私密漏洞披露

来源:展开 1 条收起 1 条

AWS Agent Toolkit 面向编码代理提供 AWS 技能库

AWS Agent Toolkit for AWS 为 Claude Code、Codex、Cursor、Kiro 等代理提供可插拔技能与 MCP 支持,覆盖服务选型、基础设施、数据分析、DevSecOps 等场景。它把 300+ AWS 服务能力封装成更适合代理调用的工具层,适合需要让 AI 编码代理直接参与部署、审计和云资源管理的团队。

适用场景: AI 编码代理接入 AWS、云上部署与安全运维

来源:展开 1 条收起 1 条

MinerU 3.4 把文档解析继续推向企业级基础设施

MinerU 新版本把 OCR 后端升级到 PP-OCRv6,并继续优化长文档处理、自动模型源选择和本地缓存复用,提升识别精度与安装体验。它面向大模型、RAG 和 Agent 工作流,把 PDF、PPT、表格和图片更稳定地转成结构化数据,适合做企业文档中台或知识库底座。

适用场景: RAG、文档中台、企业知识抽取和批量解析

来源:展开 1 条收起 1 条

数据与洞察

全球独角兽估值继续向 AI 集中

胡润研究院发布的《2026全球独角兽榜》显示,全球独角兽总估值同比增长 43% 至 5.4 万亿元人民币,其中 AI 独角兽 215 家,总价值占全榜 36%。这说明资本仍在向少数头部模型和基础设施公司集中,AI 赛道在估值层面的主导地位还在强化。

数据: 总估值 5.4 万亿元;AI 独角兽 215 家,占比 36%

意义: 资本继续向头部 AI 公司集中

来源:展开 2 条收起 2 条

OpenAI 内部与外部都在更深度使用 Codex

OpenAI 研究显示,内部员工使用 Codex 的比例已从不足 10% 升至 85% 以上;到 2026 年 5 月,80.6% 的个人用户曾发出超过 30 分钟人类工作的请求,25.6% 甚至超过 8 小时。非开发者用户增长也非常快,说明智能体工具正从开发场景外溢到更多知识工作环节。

数据: 内部使用率 85%+;80.6% 请求超 30 分钟;25.6% 超 8 小时;个人用户增长 137 倍

意义: Agent 正从编程工具变成通用任务承接层

来源:展开 1 条收起 1 条

工程岗位暂时仍是 AI 冲击下的高韧性岗位

SignalFire 的招聘数据追踪显示,大型科技公司总招聘量较 2019 年下降 25%,但工程岗位只下降 11%;2025 年工程师占 12 家科技巨头新员工的 55%。这说明在 AI 叙事最强的阶段,工程岗位并没有率先收缩,反而仍是企业最愿意保留和扩张的核心能力。

数据: 总招聘 -25%;工程招聘 -11%;工程师占新员工 55%

意义: AI 先提升工程效率,短期未必压缩工程需求

来源:展开 1 条收起 1 条

趋势观察

接下来更值得观察的是,AI 产品正从“会回答”转向“能代办”,但真正决定能否进入企业和个人工作流的,不只是模型能力,而是权限、审计、撤销和成本是否足够成熟。

趋势观察

接下来更值得观察的是,AI 产品正从“会回答”转向“能代办”,但真正决定能否进入企业和个人工作流的,不只是模型能力,而是权限、审计、撤销和成本是否足够成熟。