2026-06-23 AI 日报

来源:88 个引用生成:2026/06/24 06:11

内容

声明:完全使用AI生成,可能存在错误,需谨慎甄别。

摘要

2026-06-23 AI 领域呈现模型视频化、Agent 产品化与基础设施竞争并进的格局,值得关注的信息:Seedance 2.5将视频生成时长推至30秒,微信、豆包等入口继续把AI嵌入生活服务;SpaceX与Reflection AI签署63亿美元算力协议;同时,Meta员工数据泄露、Claude身份验证和提示注入研究凸显安全与隐私治理压力。

热点事件

火山引擎发布 Seedance 2.5,视频生成长度提升至 30 秒

火山引擎正式发布视频生成模型Seedance 2.5,预计7月初上线。新模型将单条视频生成长度提升至最高30秒,突破行业常见15至20秒限制;多参考能力支持50个全模态素材联合输入,可一次性编排多位演员图像资产;视频编辑还支持更换商品、模特等局部修改。Seedance 2.0同步升级原生4K,强调高密度细节保留。火山引擎还将其定位扩展至具身智能和自动驾驶训练数据合成,显示视频模型正向世界模型能力延伸。

重点: 视频生成时长与多参考能力跃升

来源:展开 12 条收起 12 条

SpaceX 与 Reflection AI 签署 63 亿美元算力协议

SpaceX与开源AI初创公司Reflection AI签署价值最高63亿美元的合作协议,允许后者使用其超级计算机 Project Colossus 及 Nvidia GB300s 训练开源AI模型。这笔交易显示,前沿模型竞争正在进一步转向算力基础设施竞争。对SpaceX而言,向外部AI公司提供训练资源可强化其在AI和数据中心领域的商业化地位;对Reflection AI而言,稳定的大规模算力将直接影响其开源模型训练节奏。

重点: 算力租赁成为AI基础设施新战场

来源:展开 5 条收起 5 条

Google DeepMind 与 A24 达成 7500 万美元影视 AI 合作

Google DeepMind与独立电影公司A24达成总额7500万美元的战略合作,双方将共同开发用于电影制作的AI工具。DeepMind希望通过直接接触制片人和艺术家,获得创作流程中的专业反馈,以提升工具实用性。A24的创作经验和影视资源将成为验证场景。该合作也延续了影视行业引入生成式AI的趋势,表明AI工具正从后期辅助逐步进入剧本、镜头、叙事和制作流程的核心环节。

重点: 前沿AI进入好莱坞创作流程

来源:展开 4 条收起 4 条

微信上线原生 AI 助手“小微”,试图成为生态内统一入口

微信悄然上线原生AI助手“小微”,可通过文字或语音操作微信原生功能,包括发消息、拨电话、点外卖、调起小程序挂号、打车、订酒店、充话费,也支持公众号内容搜索、图片生成和一句话生成小程序。底层采用微信自研WeLM模型,并接入DeepSeek等开源模型兜底。与独立聊天机器人不同,小微更像微信生态内的服务调度入口,依托小程序、支付和社交关系链扩展AI助手边界。

重点: 微信把AI嵌入高频生活入口

来源:展开 2 条收起 2 条

美光与 Anthropic 达成战略合作,Claude 进入芯片设计流程

美光科技Anthropic达成战略合作,内容包括美光参与Anthropic H轮融资、向Anthropic供应HBM高带宽内存、DRAM和数据中心SSD,并共同研究AI训练和推理负载下的存储子系统表现。美光还将在内部全面部署Claude,用于编码、工程、制造和企业运营,并探索使用Claude设计存储芯片架构。合作显示AI模型供应商与上游存储厂商的关系正从采购扩展到联合研发。

重点: AI模型深入芯片供应链协同

来源:展开 2 条收起 2 条

变更与实践

Google Interactions API 正式 GA,成为 Gemini 智能体主接口

Google宣布Interactions API正式GA,定位为Gemini模型与智能体的主要API接口。它提供统一端点,支持服务端状态、后台执行、工具组合、多模态生成和远程Linux沙箱。旧版generateContent API仍受支持,但前沿长运行与智能体能力将优先在Interactions API上线。

来源:展开 2 条收起 2 条

豆包 App 灰测一键打车,由曹操出行提供服务

豆包App正在北京、杭州灰测一键打车功能,由曹操出行提供运力。用户可在对话框口述出行需求,系统自动识别起止地点、人数和用车偏好后匹配车辆并派单。该功能显示AI助手正从信息问答进一步进入本地生活服务闭环。

来源:展开 4 条收起 4 条

企业微信内测“大圆”AI Agent,聚焦客户跟进与服务总结

企业微信启动代号“大圆”的AI Agent内测,用户可在消息页等界面左滑唤起。它可基于群聊、文档、会议、邮件和日程理解诉求,并自动生成群聊总结、服务总结、客户画像和智能表格,面向销售、客服和私域经营场景提升跟进效率。

来源:展开 2 条收起 2 条

Hugging Face 将 huggingface_hub 改为每周发布

Hugging Face把huggingface_hub发布节奏从每4至6周缩短到每周一次,并采用“模型起草、代码校验、人工审核”的流程。发布说明由开源权重模型GLM-5.2起草,脚本校验PR清单,人工最终审核;同时使用OIDC Trusted Publishing和Sigstore减少密钥风险。

来源:展开 1 条收起 1 条

Omio 与 OpenAI 合作推进对话式旅行规划

旅行平台Omio与OpenAI合作,把实时交通供应商、价格和库存接入ChatGPT,并将Codex嵌入内部研发流程。Omio称部分新产品开发工作量降至过去的20%,以往需多名开发者一个季度完成的项目,现在约1名开发者1个月完成。

来源:展开 1 条收起 1 条

安全与风险

Meta 暂停 MCI 员工跟踪项目,约 4.5 万份数据表曾全员可见

Meta名为MCI的AI训练项目因数据泄露被暂停。该项目原计划记录员工鼠标移动、点击和键盘输入等操作数据,用于训练AI Agent,但ACL配置错误导致约45000份员工数据表一度全员可见,内容包括私聊记录、绩效数据和AI工具提示词。Meta称暂无证据显示数据被不当访问。

影响: Meta员工隐私、内部AI训练数据治理与信任关系。

建议: 暂停高敏行为数据采集,补做权限审计与隐私评审。

来源:展开 8 条收起 8 条

Anthropic 将对部分 Claude 能力引入身份验证

Anthropic更新政策,自2026年7月8日起对Claude某些能力推出身份验证,由第三方Persona处理,可能要求政府带照片身份证件和实时自拍。公司称此举用于防止滥用并履行法律义务,但用户担忧数据保留、验证范围扩大和第三方处理风险,也可能推动部分开发者转向开源模型。

影响: 被标记账户、Claude高级能力用户与重视隐私的开发者。

建议: 明确触发条件、数据保留周期,并提供申诉和删除机制。

来源:展开 5 条收起 5 条

提示注入研究显示模型会因“角色口吻”发生混淆

Charles Ye、Jasmine Cui与Dylan Hadfield-Menell的论文《Prompt Injection as Role Confusion》指出,LLM难以稳定区分特权指令与不受信任输入,甚至更重视文本风格而非语义。研究发现,destyling可将平均攻击成功率从61%降至10%,说明角色标签、内部思考块风格等可被攻击者利用。

影响: 基于工具调用、网页读取和多来源输入的AI Agent系统。

建议: 对外部输入做去风格化处理,并避免把文本标签当安全边界。

来源:展开 2 条收起 2 条

Tata Electronics 确认数据泄露,疑涉苹果与特斯拉文件

Tata Electronics确认遭遇数据泄露,黑客论坛出现据称来自该公司的超过630GB数据,包含逾20.4万份文件。样本中疑似包含苹果供应商规格和特斯拉制造文件,但真实性和完整性未获独立验证。塔塔称业务未受影响,苹果据称正在调查,事件凸显关键供应链企业的文档安全风险。

影响: Tata Electronics及其苹果、特斯拉等供应链客户。

建议: 核验泄露范围,通知客户并轮换敏感制造与访问凭据。

来源:展开 1 条收起 1 条

知名 Chrome 插件曝严重逻辑漏洞,数百万用户或受影响

安全研究人员披露某知名Chrome插件存在严重逻辑漏洞,攻击者可利用恶意接口渗透并控制用户账号,影响数百万活跃用户。目前相关漏洞仍在紧急排查和修复中。事件提醒用户和企业在使用AI相关浏览器插件时,需要关注权限范围、更新频率和来源可信度。

影响: 安装相关Chrome插件的个人用户和企业浏览器环境。

建议: 立即更新或停用可疑插件,审查授权权限与异常登录。

来源:展开 1 条收起 1 条

开源与工具

智谱 GLM-5.2 开源 MoE 模型发布

GLM-5.2采用744B总参数、40B激活参数的MoE架构,支持1M上下文,在编程、工具调用和长程规划上表现突出。模型以MIT许可证开放权重,API定价为每百万tokens输入1.4美元、输出4.4美元,被视为开源模型在软件工程场景追赶闭源前沿模型的重要进展。

适用场景: 代码生成、长上下文Agent、本地部署和模型独立性需求。

来源:展开 14 条收起 14 条

百度开源 Unlimited OCR,长文档解析保持恒定 KV cache

百度开源Unlimited OCR,基于DeepSeek OCR编码器并引入R-SWA参考滑动窗口注意力,仅保留最近128个输出token作为工作记忆,使长程解码中的KV cache和显存占用保持恒定。在OmniDocBench v1.5上总分达93.23%,40页以上文档一次性解析编辑距离仍低于0.11。

适用场景: 长文档OCR、版式解析和本地化文档处理流水线。

来源:展开 3 条收起 3 条

AWS 开源 AWS Blocks,面向 AI 代理编程的 TypeScript 后端框架

AWS以公共预览形式开源AWS Blocks。每个Block把应用代码、本地开发实现和AWS基础设施打包在一起,开发者无需AWS账户即可本地运行包含Postgres、认证、实时消息和文件存储的应用;部署时同一代码可零修改运行在Lambda、DynamoDB、Aurora、API Gateway和Bedrock等服务上。

适用场景: AI代理生成后端应用、本地优先开发和AWS生产部署。

来源:展开 1 条收起 1 条

Lucide 1.0 发布,移除品牌图标并显著缩小包体积

开源图标库Lucide发布1.0正式版,包含1600多个图标。此次移除GitHub、Facebook、Figma、Slack等所有品牌图标,以降低法律压力和维护负担;同时放弃旧UMD构建,仅保留ESM和CommonJS,使lucide-react包体积减少32.3%,对每周下载超3000万次的前端生态有实际影响。

适用场景: 前端项目图标体系升级、包体积优化和无障碍改进。

来源:展开 1 条收起 1 条

IBM 发布 CUGA 与 24 个可运行 Agent 应用示例

IBM开源CUGA Agent Harness,并发布cuga-apps仓库,包含24个单文件FastAPI应用。CUGA内置规划、执行循环、工具调用和状态管理,支持OpenAI、watsonx、Ollama等模型,以及MCP工具、多代理委派和策略控制,帮助开发者快速构建可配置通用代理。

适用场景: 企业Agent原型、MCP工具编排和可控多代理应用开发。

来源:展开 1 条收起 1 条

数据与洞察

OpenRouter 数据显示开源模型 API 份额升至约 60%

Dirac的OpenRouter Token份额仪表盘显示,开源或开放权重模型在API流量中的市场份额从2026年3月约40%升至6月中旬约60%,总使用量接近每日6万亿tokens。尽管该数据不能代表全球市场,但反映开发者群体对开源模型采用率快速提升。

数据: 开源份额约60%;每日总使用量接近6万亿tokens。

意义: 开发者对成本、可控性和本地部署的偏好正在强化。

来源:展开 1 条收起 1 条

SK 海力士市值超越三星电子,AI 内存改写韩国科技股格局

SK海力士在韩国综合股价指数成分股普通股市值上超越三星电子,结束三星电子约25年的纪录。当日海力士股价上涨约5.6%,收盘市值达2080.4万亿韩元,今年以来股价累计涨幅超过340%。HBM和定制化AI内存需求显著抬升其产业链地位。

数据: 市值2080.4万亿韩元;年内涨幅超340%。

意义: AI算力需求正把存储厂商推向产业链核心位置。

来源:展开 1 条收起 1 条

AI 引发内存短缺,DDR2 与 DDR3 价格也被带动上涨

受AI热潮导致内存短缺影响,DDR4和DDR5价格已数倍增长,部分硬件厂商为控成本转向DDR3甚至DDR2方案。TrendForce预测,2026年第二季度DDR2合约价格将上涨约55%至60%,第三季度还将上涨35%至40%。成熟制程产能被重新争夺,嵌入式、工控、网络和汽车电子设备也受到波及。

数据: DDR2 Q2合约价涨55%-60%,Q3预计再涨35%-40%。

意义: AI高端内存需求外溢,影响传统硬件供应链成本。

来源:展开 2 条收起 2 条

甲骨文一年裁员 2.1 万人,AI 转型成本显性化

甲骨文年报披露,2026财年员工总数从约16.2万人降至14.1万人,裁员约2.1万人,降幅13%;离职补偿及相关成本达18.4亿美元。公司一边与OpenAI、Meta签下大型数据中心合作,一边计划约700亿美元净资本开支和400亿美元再融资,反映AI基础设施转型对组织和现金流的双重压力。

数据: 裁员2.1万人;补偿成本18.4亿美元;净资本开支约700亿美元。

意义: AI投入正推动科技巨头重配资本、岗位和组织结构。

来源:展开 5 条收起 5 条

高考志愿 AI 测评显示千问在多项任务超过人类咨询师

友松实验室发布《高考志愿AI测评基准》,以千问高考志愿填报Agent与53名平均从业4.6年的人类咨询师对照。结果显示,44道客观题中千问准确率100%,人类平均89.3%;100场匿名对比中,专家有58次更倾向千问回答。报告也指出,人类在就业判断、亲子协商和价值取舍上仍不可替代。

数据: 客观题100%;人类平均89.3%;匿名对比58次倾向千问。

意义: AI适合信息核验和方案初筛,人类价值转向沟通判断。

来源:展开 1 条收起 1 条

趋势观察

本期信息显示,AI正在从“模型能力竞赛”转向“入口、流程和基础设施重构”:视频模型进入创作管线,微信、豆包把AI嵌入日常服务,企业则围绕算力、内存、Agent工作流和数据治理重新分配资源。后续更需要观察的是,用户便利性提升能否与隐私、安全和成本控制同步推进。