“内存条降价”的词条登上热搜,引发网友广泛讨论。然而,与大众期待的 “价格亲民” 不同,部分网友的评论满是嘲讽与无奈。“这也叫降价?这叫高位盘整,依然是我买不起的样子。”“厂商的刀法很精准:涨价时翻五倍,降价时打八折,最后还是赚翻了”。

谷歌
这看似是普通消费市场的价格波动,或许暗藏科技行业的深层逻辑。CNMO认为,此次内存降价并非网友所解读的“高位盘整”,其核心诱因或与谷歌近日推出的TurboQuant极限压缩算法密切相关。它有望降低人工智能系统对内存资源的需求,进而打破当前内存市场的原有格局。
谷歌TurboQuant极限压缩算法
根据谷歌介绍,TurboQuant极限压缩算法能降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着AI模型上下文窗口不断扩大,这些缓存正成为主要的内存瓶颈。
值得关注的是,TurboQuant无需重新训练或微调模型,便可将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma、Mistral等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果。

观察数据




