2026-05-25 AI 日报

来源:17 个引用生成:2026/05/26 08:30

内容

声明:完全使用AI生成,可能存在错误,需谨慎甄别。

摘要

2026-05-25 AI 领域呈现多线并进格局,值得关注的信息:基础科学研究取得颠覆性突破,日本团队发现分布式微粗糙度可大幅降低空气阻力;产业应用层面,全球首个全自动AI科学家Robin发布,微软、OpenAI等巨头在智能体与AI基础设施上持续布局;模型与工具方面,面壁智能发布中国首个1.58-bit大模型,DeepSeek用户迎来可降本80%的缓存优化工具;风险与治理上,日本首例AI声音侵权诉讼开庭,国家标准委发布AI伦理安全指引,SaaS-Bench评测揭示当前AI Agent距离全自动办公尚存巨大鸿沟。

今日大事

日本科学家推翻空气动力学光滑表面原则,微粗糙结构可降阻43.6%

日本东北大学研究团队发布论文,推翻了空气动力学中“表面必须光滑以降低阻力”的传统原则。研究发现,应用一种肉眼不可见的分布式微粗糙度(DMR)表面结构,可使空气阻力降低高达43.6%。通过高精度测量系统验证,DMR涂层表面的阻力系数显著低于光滑表面。这一发现可能重塑飞行器、汽车等交通工具的设计理念,为减阻技术开辟全新路径。

重点: 颠覆百年空气动力学认知,为交通与工业设计开辟新范式。

来源:展开 2 条收起 2 条

全自动AI科学家Robin发布,两小时完成人类900小时工作

非营利机构FutureHouse在《自然》期刊发布全球首个全自动AI科学家Robin。该系统整合“乌鸦”(文献分析)、“猎鹰”(策略评估)和“雀鸟”(数据分析)三个AI智能体,实现从假设提出到验证的全闭环自动化科研。在针对干性年龄相关黄斑变性(dAMD)的测试中,Robin仅用两小时完成人类需900小时的工作,并锁定潜在新药机制。这标志着AI驱动的科研范式进入全新时代。

重点: 标志AI从辅助工具进化为自主科研主体,可能颠覆传统研发流程。

来源:展开 1 条收起 1 条

SaaS-Bench评测显示AI Agent全自动办公远未落地,最强模型完全通过率仅3.8%

UniPat AI发布SaaS-Bench评测基准,将23个真实SaaS系统部署于Docker,测试106个跨应用、长流程办公任务。结果显示,最强的Claude Opus 4.7完全通过率仅为3.8%,Gemini 3.1 Pro等模型完全通过率甚至为零。评测揭示了当前Agent的四种结构性失败模式:任务越长越做不对、一步错步步错、做完不检查、执行不稳定

重点: 为“AI替代白领”论泼下冷水,揭示当前Agent范式的根本局

来源:展开 1 条收起 1 条

中国发布首个AI伦理安全国家标准《人工智能应用伦理安全指引1.0》

国家标准委发布《人工智能应用伦理安全指引1.0》,由阿里、华为、深度求索等企业联合起草。该指引从开发、服务、使用三个维度构建全生命周期安全闭环,首次将伦理安全审计设为硬性标准,要求源头治理数据与模型安全、过程管控“AI幻觉”风险、使用层保护用户隐私。这标志着我国AI伦理治理进入技术标准落位阶段。

重点: 为中国AI产业从“野蛮生长”转向“合规深耕”提供国家级标准框

来源:展开 1 条收起 1 条

日本声优起诉TikTok,要求删除AI模仿其声音的视频,或成首例AI声音侵权诉讼

日本声优津田健次郎因有人利用生成式AI模仿其声音制作视频并获利,向东京地方法院起诉TikTok。涉诉账号在一年间发布188个AI模仿视频,月收益达50万至75万日元。被告辩称声音为“普通男性声音”,否认侵权。此案或为全球首例AI声音侵权诉讼,将对AI生成内容的版权与人格权边界产生重要判例影响。

重点: 首例AI声音侵权诉讼,将定义AI时代人格权保护的新边界。

来源:展开 2 条收起 2 条

变更与实践

DeepSeek用户省钱工具Reasonix发布,缓存命中率高达99.82%

Reasonix工具通过优化缓存机制,将DeepSeek V4的缓存命中率提升至99.82%,使原本61美元的账单降至12美元,成本直降约80%。该工具专为DeepSeek设计,采用append-only运行循环和前缀缓存策略,并已在GitHub开源。建议DeepSeek重度用户评估集成该工具以优化成本。

来源:展开 2 条收起 2 条

面壁智能发布中国首个1.58-bit大模型BitCPM-CANN,8B模型可在手机运行

面壁智能联合清华大学发布中国首个基于华为昇腾平台训练的三值(1.58-bit)大模型BitCPM-CANN,涵盖0.5B至8B四个尺寸。该模型推理阶段可节省约6倍显存,使8B模型可在主流旗舰手机上运行。模型权重已在HuggingFace和ModelScope开源。建议关注端侧AI部署的开发者可评估此模型。

来源:展开 1 条收起 1 条

苹果OS27将大幅提升Image Playground,集成Gemini算力

苹果计划在OS27系统中对Image Playground进行“大幅提升”,通过升级Apple Foundation模型并集成谷歌Gemini算力,显著改善图像生成能力。该功能将深度嵌入系统应用,并增强Genmoji的主动推荐能力,同时坚持本地或绿色云端处理。建议iOS用户关注后续系统更新中的AI功能变化。

来源:展开 1 条收起 1 条

腾讯ima全面开放Copilot,取消10万用户排队限制

腾讯ima宣布全面开放其AI智能体产品Copilot,取消此前超10万用户排队的限制。Copilot具备记忆、个性化定制及全场景感知能力,可自动执行复杂任务如全网调研与报告生成。同时推出知识技能分享平台,支持用户将工作流程封装为“Skill”并共享。建议有复杂任务自动化需求的用户可尝试使用。

来源:展开 1 条收起 1 条

安全与风险

AI生成代码质量隐患警告,OpenClaw工程师呼吁加强审核

开发者、初创公司 OpenClaw项目工程师警告,AI生成的代码存在严重质量隐患,可能引发安全漏洞和运行效率低下问题。开发者对其过度依赖,常未审核即发布代码,导致底层结构混乱。专家呼吁开发者应加强代码审核,避免盲目信任AI生成结果。

来源:展开 1 条收起 1 条

GitHub Actions在Python包发布流程中存在严重安全风险

开源Python项目维护者与用户 研究指出,约44,000个Python仓库仍使用不安全的PYPIAPITOKEN,且Actions工作流普遍未固定到具体提交SHA,导致标签劫持攻击频发,已引发至少10起恶意包上传至PyPI的事件。建议采用最小权限、固定action版本、迁移至可信发布(trusted publishing)机制,并使用zizmor等工具进行静态检测。

来源:展开 1 条收起 1 条

开源与工具

AudioMass:核心不到100KB的免费开源在线多轨音频编辑器

AudioMass是一款完全运行在浏览器中的多轨音频编辑器,核心JS文件压缩后不足100KB,无需下载安装,所有操作均在本地完成保障隐私。支持录音、波形编辑及多种音效处理,采用原生JavaScript手写,无框架依赖,适合快速处理播客、配音等轻量级音频任务。

来源:展开 2 条收起 2 条

Anthropics开源11个知识工作插件,将Claude转化为专业岗位助手

Anthropics开源了11个知识工作插件,专为Claude Cowork和Claude Code设计,涵盖销售、法务、财务、产品管理、客户支持等职能,集成Slack、Notion、Jira等多种工具。这些插件可将Claude快速适配为企业专属流程,提升团队协作效率与输出一致性。

来源:展开 1 条收起 1 条

今日观察

今日AI领域呈现出基础研究突破、产业标准落地与应用瓶颈显现三重主线。从空气动力学的颠覆性发现到全自动科学家的诞生,AI正加速渗透科学与工程领域;而伦理国家标准的发布与SaaS-Bench的“冷水”,则为狂热的Agent和自动化浪潮划定了现实边界。短期内,AI成本优化工具(如Reasonix)和端侧模型(如1.58-bit模型)将直接影响开发者和企业的部署策略,而声音侵权首案的判决,或将重塑AIGC内容创作的权利框架。对普通用户而言,AI正变得“能用”但远未“好用”,关键仍在于人机协作的流程设计。