复制 3 层 Transformer，推理能力从 0.22 飙到 0.76：不训练、不改权重

昨天 HN 上一个 240+ 赞的帖子让我眼前一亮：有人在 Qwen2.5-32B 和 Devstral-24B 上复制了特定的 3 层 Transformer，不训练、不改权重，逻辑推演（BBH）成绩直接从 0.22 跳到 0.76。两张 AMD 消费级显卡，一个晚上搞定。什么是 Layer Duplication？这个方法基于 David Ng 的 RYS（Repeat Yo...

2026/03/20 AI, Dev

KittenTTS：25MB 的开源 TTS 模型，不用 GPU 也能跑

项目地址： KittenML/KittenTTS 在线体验： Hugging Face Demo License： Apache 2.0 一句话总结 KittenTTS 是一个开源的轻量级文本转语音库，最小模型只有 25MB，基于 ONNX 推理，不需要 GPU，纯 CPU 就能跑出高质量语音。今天在 Hacker News 上拿了 320+ 赞。为什么值得关注 TTS（Text...

2026/03/20 AI, Dev

Claude Code Channels：让 AI 在你不在时自动响应消息（译+解读）

原文出处： Push events into a running session with channels（Anthropic 官方文档）原作者： Anthropic 配图来源：无一句话总结 Claude Code 推出 Channels 功能（研究预览），让你可以通过 Telegram、Discord 等渠道，把消息推送到正在运行的 Claude Code 会话中。Claud...

2026/03/20 AI, Dev

Snowflake AI 编码 Agent 沙箱逃逸：Prompt Injection 的又一次胜利

AI 编码 Agent 越来越强，但安全问题也在同步升级。这次轮到了 Snowflake。发生了什么安全公司 PromptArmor 披露了 Snowflake Cortex Code CLI 的一个严重漏洞：攻击者可以通过 indirect prompt injection，让这个编码 Agent 绕过人工审批、逃出沙箱、执行任意命令。 Cortex Code 是 Snowfla...

2026/03/19 AI, Security

Mistral Forge：企业级 AI 的下一个战场不是模型，是数据

Mistral AI 这两天放了个大招 — Forge，一个让企业在自己的私有数据上训练 frontier 级别模型的系统。HN 上 700+ 点，讨论热度很高。这件事值得聊聊，因为它触及了一个行业拐点：通用大模型的天花板已经近了，下一轮竞争在企业私有知识上。 Forge 是什么简单说，Forge 让企业把自己的内部文档、代码库、合规政策、运营流程等私有数据喂给 Mistral 的...

2026/03/19 AI, 观点

8 万人告诉 Anthropic 他们想要什么样的 AI

Anthropic 刚发布了一份规模惊人的调研报告：81,000 人参与，覆盖 159 个国家、70 种语言。这可能是迄今为止最大规模的 AI 用户定性研究。不是问卷打分，不是 A/B 测试 —— 是让 Claude 作为访谈员，和每个人进行一对一的深度对话。方法本身就很 Anthropic：用 AI 来研究人们对 AI 的看法。人们最想要什么？排名第一的需求不是”帮我写代码”，...

2026/03/19 AI

Agent Skill 的五种设计模式：从 SKILL.md 格式到内容设计

本文是对 Google Cloud Tech 原文的翻译与解读，原作者 @Saboo_Shubham_ 和 @lavinigam。原文配图均来自原作。当 30 多个 Agent 工具（Claude Code、Gemini CLI、Cursor 等）都标准化了同一个 SKILL.md 格式后，格式问题已经基本解决了。真正的挑战是内容设计——规范告诉你怎么打包一个 skill，但对里面的...

2026/03/19 AI, Agent

AI 生成的代码不用看？用自动化验证替代人工 Review

今天早上刚写了 Cursor AI 的代码质量问题，下午就在 HN 上看到一篇切入角度完全不同的文章：Toward automated verification of unreviewed AI-generated code。83 points，讨论热度不低。作者 Peter Lavigne 的核心问题很直接：如果我不逐行 review AI 生成的代码，需要什么条件才能信任它？这个...

2026/03/18 AI, Dev

Cursor AI 真相：短期飙速，长期还债

MSR ‘26 上发了一篇研究，标题很直白：Speed at the Cost of Quality: How Cursor AI Increases Short-Term Velocity and Long-Term Complexity in Open-Source Projects。HN 上 130+ points，评论区吵翻了。这篇论文做的事情是：用因果推断方法，对比 GitHu...

2026/03/18 AI, Dev

NVIDIA Vera CPU：第一颗为 Agentic AI 设计的 CPU 意味着什么？

GTC 2026，Jensen Huang 发布了 NVIDIA Vera CPU。不是又一个通用处理器的迭代，而是一颗明确为 Agentic AI 设计的 CPU。这很有意思。因为它暗示了一个行业判断：AI 的瓶颈正在从 GPU 计算转向 CPU 编排。为什么 Agent 需要专用 CPU？过去两年，所有人都在抢 GPU。训练大模型、跑推理，H100/B200 供不应求。但当 ...

2026/03/17 AI, Hardware

复制 3 层 Transformer，推理能力从 0.22 飙到 0.76：不训练、不改权重

KittenTTS：25MB 的开源 TTS 模型，不用 GPU 也能跑

Claude Code Channels：让 AI 在你不在时自动响应消息（译+解读）

Snowflake AI 编码 Agent 沙箱逃逸：Prompt Injection 的又一次胜利

Mistral Forge：企业级 AI 的下一个战场不是模型，是数据

8 万人告诉 Anthropic 他们想要什么样的 AI

Agent Skill 的五种设计模式：从 SKILL.md 格式到内容设计

AI 生成的代码不用看？用自动化验证替代人工 Review

Cursor AI 真相：短期飙速，长期还债

NVIDIA Vera CPU：第一颗为 Agentic AI 设计的 CPU 意味着什么？

热门标签