inference 2 KV Cache 压缩 50 倍不掉精度:MIT 的 Attention Matching 做到了 2026/03/08 antirez 的 voxtral.c:用纯 C 实现语音转文字,零依赖的 AI 推理 2026/02/10