Google TurboQuant 壓縮演算法引爆記憶體股跳水 業界:DDR5 缺貨潮延燒到 2027 才是真正考驗
【2026-06-05】Google 於 3 月 24 日發表 AI 模型 KV 快取壓縮技術「TurboQuant」,宣稱可讓大型語言模型(LLM)的記憶體用量最高降低 6 倍、推論效能提升 8 倍。消息一出,記憶體族群股價集體跳水,DDR5 現貨價在 48 小時內回檔 8-12%。然而,PCMag 與 Wccftech 同步引述美光副總裁在 CES 2026 受訪內容,強調「TurboQuant 仍處於早期研究階段,短期內不會改變供需結構」。DIGITIMES 6 月 4 日報導指出,兩岸記憶體業界普遍認為,這波壓縮技術恐慌只是雜訊,真正的大缺貨潮將延續到 2027 年。
TurboQuant 原理:KV 快取壓縮的「6 倍省 RAM」承諾
TurboQuant 是 Google Research 發表的向量量化(vector quantization)演算法,專門針對 Transformer 架構 LLM 的 KV cache(鍵值快取)進行壓縮。根據 Google 公開論文,TurboQuant 在三項測試中將記憶體消耗壓低 6 倍、推論速度提升最高 8 倍,且「在長上下文工作負載上,使用壓縮層後與未壓縮的結果無明顯差異」。DropReference 整理的時序顯示,3 月 25 日論文公開後記憶體現貨價曾一度回落,但僅維持 72 小時即恢復漲勢。
業界對 TurboQuant 的質疑集中於「實驗室 vs 部署環境」的落差。Resell Calendar 與 Unibetter 同步指出,目前主流 LLM 服務(ChatGPT、Claude、Gemini、Llama)的推論環境高度異質,量化方案在邊界案例(edge case)上可能產生不可預測的精度損失。「Google 自己也說,這是研究階段,不是產品路線圖」,一位記憶體分析師對 Wccftech 表示。
DDR4/DDR5 現貨價實況:Q2 將觸頂、部分規格年漲 480%
Counterpoint Research 數據顯示,記憶體價格從 2025 年第四季到 2026 年第一季「季增 80-90%」,幾乎所有記憶體細分市場都經歷了 V 型反轉。Resell Calendar 預測,DDR5 64GB RDIMM 伺服器模組「將在 2026 年第二季觸頂,價格是 2025 年初的兩倍」。Unibetter 的追蹤更為驚人:32GB DDR5 套裝 2025 年中約 95 美元,2026 Q2 預估將觸及 550-600 美元,漲幅逼近 480%。
Sourceability 整理的「2026 季增時序」顯示,DDR4 與 DDR5 同步漲價且供貨被砍半,主因為三星、SK 海力士、美光同步將產能優先配置給 HBM 與 DDR5 高階伺服器模組。Counterpoint 指出,DDR4 供給急速下滑,業者堅守 EOL(停產)策略,舊製程機台甚至延後報廢以維持出貨。「DDR4 現貨價在 2026 Q2 達到與 DDR5 倒掛的歷史罕見現象」,Tom's Hardware 5 月 30 日報導。
台灣記憶體廠實況:南亞科、華邦、群聯各有盤算
南亞科(2408)5 月合併營收受惠漲價與 DDR5 良率提升,連續 4 個月創同期新高;法人圈指出,南亞科 1B 製程 DDR5 已於 Q2 進入量產,毛利率從 2025 年同期的 12% 大幅回升至 35-40% 區間。華邦電子(2344)則受惠於利基型 DRAM 與 NOR Flash 漲價,5 月營收年增 41%;執行長焦佑鈞在法說會強調「NOR Flash 供需吃緊將延續到 2027 年」。
群聯(8299)雖以 NAND 控制 IC 為主,但因 AI PC 與企業級 SSD 需求同步爆發,5 月合併營收年增 28%,創單月歷史第三高。執行長潘健成 5 月 11 日於 DIGITIMES 受訪時指出,「全球 NAND 市場嚴重失衡,ASP 將持續走高且供給吃緊」,並把 2026 年定位為「群聯 3.0 全面轉型 AI 賦能者」的關鍵年。
兩岸業界觀點:恐慌已被消化、缺貨潮才剛開始
DIGITIMES 6 月 4 日焦點報導引述兩岸記憶體業界看法,普遍認為 TurboQuant 衝擊已被市場消化,真正要關注的是「AI 推論帶動的 HBM 與 DDR5 結構性需求」。一位台系記憶體大廠高層透露:「TurboQuant 連我們內部評估都不把它列為風險因子,反而 HBM4、HBM4E 良率爬升的進度才是今年下半年的關鍵。」
中國業界的反應更為樂觀。東方財富網與 Cnyes 引述中國半導體分析師,認為 TurboQuant 反而凸顯「Google 也承認記憶體是 AI 瓶頸」,對長鑫、長江存儲是利多而非利空。一位中國 IC 設計公司高層表示:「壓縮演算法每推進一版,模型參數量與上下文長度就跟著放大,最終記憶體總用量不減反增,這就是 Jevons paradox(傑文斯悖論)在 AI 時代的真實寫照。」
後續觀察:6 月底 Computex、HBM4 量產時程、CSP 採購價
下半年記憶體市場的三大觀察節點包括:第一,6 月底至 7 月初的 Computex 與 SEMICON West,各大廠將釋出 HBM4 量產時程與產能規劃。第二,美光、SK 海力士、三星於 7-8 月發布的 Q2 法說會,將揭露 HBM 與 DDR5 客戶長約(LTA)價格,市場普遍預期「合約價年增 30-50%」。第三,Google、微軟、Meta 等 CSP 對 HBM 的採購規模將在 10 月晶片大會上公開,若年增幅低於 60% 代表需求降溫。
整體而言,TurboQuant 衝擊只是記憶體超級週期中的一段插曲。DIGITIMES 業界共識是:DDR4/DDR5 缺貨潮將延續到 2026 年底,2027 年才會隨著長鑫、長江存儲、SK 海力士新產能開出逐步緩解。台廠若能把握這段「結構性缺貨紅利期」,同步卡位 HBM 與 AI 端運算雙引擎,將是未來 18 個月的最大成長動能。
資料來源
- RAM Shortage 2026 Explained: Why AI Is Causing a DDR5 Crisis & When It Ends(Wccftech,2026-03)https://wccftech.com/roundup/memory-crisis/
- DDR5 Prices Drop After Google's TurboQuant News. Don't Expect It to Last(PCMag,2026-03-26)https://www.pcmag.com/news/ddr5-prices-drop-after-googles-turboquant-news-dont-expect-it-to-last
- 2024–present global memory supply shortage(Wikipedia,2026-06-04 更新)https://en.wikipedia.org/wiki/2024%E2%80%93present_global_memory_supply_shortage
- RAM price tracking 2026: Daily lowest price on DDR5 and DDR4 memory of all capacities(Tom's Hardware,持續更新)https://www.tomshardware.com/pc-components/ram/ram-price-index-2026-lowest-price-on-ddr5-and-ddr4-memory-of-all-capacities
- Memory price increase timeline QoQ in 2026(Sourceability,2026-Q2)https://sourceability.com/post/tracking-memory-price-increases-across-the-last-several-quarters
- DRAM Price Trend 2026: Upward Surge Explained(Accio Business,2026-Q1)https://www.accio.com/business/dram_price_trend
- RAM Memory Shortage 2026 Guide: Price Trend and Market Outlook Analysis(Unibetter,2026)https://en.unibetter-ic.com/ram-memory-shortage-2026/
- Phison targets AI storage and edge computing growth through Phison 3.0 strategy(DIGITIMES English,2026-05-11)https://www.digitimes.com/news/a20260511PD203/phison-growth-revenue-nand-2026.html