复制 3 层 Transformer,推理能力从 0.22 飙到 0.76:不训练、不改权重
昨天 HN 上一个 240+ 赞的帖子让我眼前一亮:有人在 Qwen2.5-32B 和 Devstral-24B 上复制了特定的 3 层 Transformer,不训练、不改权重,逻辑推演(BBH)成绩直接从 0.22 跳到 0.76。 两张 AMD 消费级显卡,一个晚上搞定。 什么是 Layer Duplication? 这个方法基于 David Ng 的 RYS(Repeat Yo...
昨天 HN 上一个 240+ 赞的帖子让我眼前一亮:有人在 Qwen2.5-32B 和 Devstral-24B 上复制了特定的 3 层 Transformer,不训练、不改权重,逻辑推演(BBH)成绩直接从 0.22 跳到 0.76。 两张 AMD 消费级显卡,一个晚上搞定。 什么是 Layer Duplication? 这个方法基于 David Ng 的 RYS(Repeat Yo...

项目地址: KittenML/KittenTTS 在线体验: Hugging Face Demo License: Apache 2.0 一句话总结 KittenTTS 是一个开源的轻量级文本转语音库,最小模型只有 25MB,基于 ONNX 推理,不需要 GPU,纯 CPU 就能跑出高质量语音。今天在 Hacker News 上拿了 320+ 赞。 为什么值得关注 TTS(Text...

原文出处: Push events into a running session with channels(Anthropic 官方文档) 原作者: Anthropic 配图来源: 无 一句话总结 Claude Code 推出 Channels 功能(研究预览),让你可以通过 Telegram、Discord 等渠道,把消息推送到正在运行的 Claude Code 会话中。Claud...

AI 编码 Agent 越来越强,但安全问题也在同步升级。这次轮到了 Snowflake。 发生了什么 安全公司 PromptArmor 披露了 Snowflake Cortex Code CLI 的一个严重漏洞:攻击者可以通过 indirect prompt injection,让这个编码 Agent 绕过人工审批、逃出沙箱、执行任意命令。 Cortex Code 是 Snowfla...

Mistral AI 这两天放了个大招 — Forge,一个让企业在自己的私有数据上训练 frontier 级别模型的系统。HN 上 700+ 点,讨论热度很高。 这件事值得聊聊,因为它触及了一个行业拐点:通用大模型的天花板已经近了,下一轮竞争在企业私有知识上。 Forge 是什么 简单说,Forge 让企业把自己的内部文档、代码库、合规政策、运营流程等私有数据喂给 Mistral 的...

Anthropic 刚发布了一份规模惊人的调研报告:81,000 人参与,覆盖 159 个国家、70 种语言。这可能是迄今为止最大规模的 AI 用户定性研究。 不是问卷打分,不是 A/B 测试 —— 是让 Claude 作为访谈员,和每个人进行一对一的深度对话。方法本身就很 Anthropic:用 AI 来研究人们对 AI 的看法。 人们最想要什么? 排名第一的需求不是”帮我写代码”,...

本文是对 Google Cloud Tech 原文 的翻译与解读,原作者 @Saboo_Shubham_ 和 @lavinigam。原文配图均来自原作。 当 30 多个 Agent 工具(Claude Code、Gemini CLI、Cursor 等)都标准化了同一个 SKILL.md 格式后,格式问题已经基本解决了。真正的挑战是内容设计——规范告诉你怎么打包一个 skill,但对里面的...

今天早上刚写了 Cursor AI 的代码质量问题,下午就在 HN 上看到一篇切入角度完全不同的文章:Toward automated verification of unreviewed AI-generated code。83 points,讨论热度不低。 作者 Peter Lavigne 的核心问题很直接:如果我不逐行 review AI 生成的代码,需要什么条件才能信任它? 这个...

MSR ‘26 上发了一篇研究,标题很直白:Speed at the Cost of Quality: How Cursor AI Increases Short-Term Velocity and Long-Term Complexity in Open-Source Projects。HN 上 130+ points,评论区吵翻了。 这篇论文做的事情是:用因果推断方法,对比 GitHu...

GTC 2026,Jensen Huang 发布了 NVIDIA Vera CPU。不是又一个通用处理器的迭代,而是一颗明确为 Agentic AI 设计的 CPU。 这很有意思。因为它暗示了一个行业判断:AI 的瓶颈正在从 GPU 计算转向 CPU 编排。 为什么 Agent 需要专用 CPU? 过去两年,所有人都在抢 GPU。训练大模型、跑推理,H100/B200 供不应求。但当 ...