AI开始自己写自己了:本周7件大事,每一条都在改写规则

AI开始自己写自己了:本周7件大事,每一条都在改写规则
本周AI圈密集爆发:苹果WWDC重构Siri接入Gemini、Anthropic披露Claude写了80%自家代码并发出"AI自我进化"警报、ChatGPT月活破10亿、谷歌开源扩散模型DiffusionGemma、英伟达RTX Spark让消费级设备跑千亿参数模型、中国AI融资提速且智源发布世界模型新范式。AI正从聊天框变成操作系统,从云端塞进笔记本。

苹果 — WWDC发布全新Siri AI,接入谷歌Gemini,支持屏幕感知和跨App操作,今秋随iOS 27推送。

Anthropic — 披露Claude已生成其80%生产代码,警告"AI自我进化"时代提前到来。同期完成650亿美元融资(估值965亿,首超OpenAI),秘密提交IPO,发布新旗舰模型Claude Opus 4.8。

OpenAI — ChatGPT月活破10亿,史上最快。正推进代号"Aria"的超级应用改版,统一Codex与Agent能力,集成第三方服务,内部判断"对话界面已死"。

谷歌 — 开源DiffusionGemma 26B,首个文本扩散模型,单张H100上超1000 tokens/秒,比同规模自回归模型快4倍。

英伟达 — 发布RTX Spark超级芯片,128GB统一内存,可本地跑1200亿参数模型。华硕、联想、微软等今秋推出搭载产品。

中国AI — 月之暗面估值涨至300亿美元,发布Kimi Work和开源代码模型K2.7 Code;智源大会发布悟界·Physis-v0.1,从"预测下一个Token"转向"预测下一个物理状态",成果登上Nature正刊。

其他 — 微软发布7个自研MAI模型(不依赖OpenAI);特朗普签AI行政令;Alphabet砸850亿美元建AI基础设施,巴菲特跟投100亿。


学界进展

Nature | AI数学基准:人类仍领先 — 6月11日Nature发布"First Proof"首轮测试结果,10道研究级数学难题由AI团队与顶级数学家同场竞技。最佳表现来自ETH苏黎世团队(ChatGPT + 多模型验证),解出6题;UCLA、OpenAI、普林斯顿(Gemini 3.1 Pro)紧随其后。背景:OpenAI上月刚解出一道存在80年的Erdős难题,但系统性评测显示AI与顶尖人类数学家仍有真实差距。此外,"人类最后的考试"更新数据显示,Gemini 3.1 Pro和Claude Opus 4.6最高得分40%–50%,人类专家约90%。

DeepMind | 57页AGI到ASI路线图 — 6月10日,DeepMind联合创始人Shane Legg领衔发布《From AGI to ASI》,系统梳理四条路径:扩展现有模型、新算法突破、递归自我改进、多智能体集体涌现。核心判断:四条路径不互斥,极可能同时推进;"研究品味"(判断哪些实验值得做)是人类工程师最后的核心优势,但也将被自动化。这是DeepMind"AGI三部曲"收官之作(2025年4月安全框架→2026年3月认知分类→本周ASI路线图)。


一句话总结:AI正在从聊天框变成操作系统、从云端塞进笔记本、从数字世界走向物理世界——但数学和科学前沿,人类仍是最后的防线。

Read more

2026世界杯小组赛第三轮前瞻(6月25-28日)

2026世界杯小组赛第三轮前瞻(6月25-28日)

2026世界杯小组赛第三轮(6月25-28日)全部24场前瞻分析。覆盖A至L共12个小组的收官战,包含每场对阵双方的当前积分榜、出线形势、赛前分析和胜负预测。预测模型基于Elo评分、Dixon-Coles泊松分布与XGBoost/LightGBM集成,采用draw_aware策略——当平局概率≥18%且≥50%×最大胜率时,将预测修正为平局。最终预测分布:主胜6场、平局10场、客胜8场,其中高信心预测8场。涵盖姆巴佩vs哈兰德(挪威vs法国)、C罗关键一役(哥伦比亚vs葡萄牙)、日本vs瑞典风格对决等多场五星级关注战。

By 仙踪问道
简历优化工具横评:仙踪问道·简历优化与AI简历姬、Hermes的效果、功能、定价全面对比

简历优化工具横评:仙踪问道·简历优化与AI简历姬、Hermes的效果、功能、定价全面对比

同一份真实简历,分别用仙踪问道、Hermes+tailored-resume-generator、AI简历姬三款工具优化后投递"AI应用高级测试工程师"岗位。实测发现:仙踪问道基于真实经历的克制优化让简历可信度较高;AI简历姬大量虚构经验有面试翻车风险;Hermes+resume skill将差距包装为成长空间,诚实又有策略性。附两款产品功能深度对比。

By 仙踪问道