Cobb's Lab
Preview Image

Atlassian 默认开启 AI 训练数据采集:30 万客户的数据,你 Opt-out 了吗?

作为 OfoxAI(ofox.ai)的开发者,我每天都在和各种 AI 产品打交道。但今天看到 Atlassian 的这波操作,还是觉得有必要聊聊 — 因为这事关每一个用 Jira 和 Confluence 的开发团队。 发生了什么 Atlassian 宣布从 2026 年 8 月 17 日起,将默认采集旗下 30 万客户的数据用于 AI 模型训练。采集范围包括两类: 元数据(Metad...

Preview Image

OpenAI Agents SDK 大更新:沙箱执行 + MCP + AGENTS.md,Agent 开发终于有了标准基建

4 月 15 日,OpenAI 发布了 Agents SDK 的重大更新。这不是一次小修小补 — 它标志着 Agent 开发从”各自为战”走向”标准化基建”的转折点。 核心变化:Agent 终于有了自己的工作空间 OpenAI Agents SDK 的多 Agent 编排架构 过去做 Agent 开发,最痛苦的不是模型能力不够,而是基础设施太碎片化。你需要自己搞定文件系统访问、代码执...

Preview Image

AI Agent 的成本也在指数增长?Toby Ord 的冷水泼得好

METR 的 AI Agent 时间线基准测试一直是行业最关注的指标之一:AI 能独立完成多长时间的软件工程任务?从 2023 年的几分钟到现在的几小时,进步曲线看起来令人振奋。 但牛津大学哲学家 Toby Ord 最近提了一个被所有人忽略的问题:完成这些任务花了多少钱? 被忽略的成本维度 Ord 的核心洞察很简单:METR 基准测试衡量的是”最佳性能”,不计成本。为了找到模型的能力上...

Preview Image

Stanford AI Index 2026:五张图看清 AI 行业的真实状态

Stanford HAI 刚发布了 2026 年度 AI Index 报告,超过 400 页。我把里面最值得关注的几个趋势拎出来,加点自己的判断。 美国继续领跑模型发布,但中国在追 2025 年美国发布了 50 个”notable”模型,中国正在缩小差距。更值得注意的是:超过 90% 的重要模型来自工业界,学术界的占比从 2015 年的近 50% 跌到了个位数。 这不是新闻,但数据让趋...

Preview Image

OpenAI Agents SDK 大更新:原生沙箱 + MCP 集成,Agent 开发进入标准化时代

作为 OfoxAI(ofox.ai)的开发者,我每天都在跟不同的 AI 模型和 Agent 框架打交道。4 月 15 日 OpenAI 发布的 Agents SDK 更新,是我今年看到的最值得关注的基础设施级变化之一。 不是因为它多酷炫,而是因为它在做一件正确的事:把 Agent 开发从”各自造轮子”推向标准化。 三个核心变化 1. 原生沙箱执行 Agent 需要一个工作空间 —— ...

Preview Image

Claude Design:Anthropic 让 AI 开始做设计了,这意味着什么?

昨天 Anthropic 发布了一个新产品 —— Claude Design,归属于 Anthropic Labs 实验室产品线。一句话概括:你可以和 Claude 协作,生成设计稿、原型、幻灯片、单页文档等视觉产出物。 这不是又一个 AI 生图工具。它瞄准的是「设计协作」这个场景。 不是生图,是设计流程 市面上 AI 生图工具已经泛滥了。Midjourney、DALL-E、Stabl...

GPT-Rosalind:OpenAI 发布首个生命科学专用推理模型

作为 OfoxAI(ofox.ai)的开发者,我每天都在跟踪各家模型的动态。昨天 OpenAI 发了一个让我眼前一亮的东西 —— GPT-Rosalind,一个专门为生命科学研究打造的前沿推理模型。 这不是又一个通用大模型的版本号升级。这是 OpenAI 第一次为特定垂直领域发布专用模型系列。 为什么叫 Rosalind 模型以 Rosalind Franklin 命名 —— 她的 X...

Preview Image

OpenAI Codex 大更新:Computer Use、后台 Agent、记忆系统,开发者工作流要被重写了

OpenAI 昨天发布了 Codex 的一次重大更新。不是小修小补 —— 是把 Codex 从一个代码助手,推向了一个能操作你电脑的通用开发 Agent。 每周 300 万开发者在用 Codex。这次更新之后,他们用的东西本质上变了。 Computer Use:AI 有了自己的光标 最引人注目的是 Background Computer Use。Codex 现在可以看到你的屏幕、点击、...