AI 推論需求全面引爆,特別是長上下文(Long Context)模型的普及,正讓記憶體產業陷入前所未有的結構性缺貨。業界指出,長情境任務產生的 KV 快取需求,使儲存重心從 HBM 擴散至企業級 SSD(eSSD),導致 NAND Flash 供應極度吃緊。慧榮科技預警,這波缺貨潮將延續至 2026 年甚至 2027 年,且目前需求缺口已達產出的兩倍之巨。三星、SK 海力士與美光等大廠正全力將產能轉向高毛利的 AI 產品,引發 DDR5 與大容量 QLC SSD 價格飆漲,甚至迫使美光等業者退出部分消費性業務,以優先供應資料中心客戶。
這場變革的核心在於 AI 運算邏輯從「訓練」轉向「推論」,長上下文處理對 IOPS 與總體擁有成本(TCO)提出了嚴苛要求。HBM 雖具備高頻寬,但容量與成本限制使其難以獨撐大局,這促使雲端服務商大規模導入 eSSD 取代傳統硬碟,並推動高頻寬快閃記憶體(HBF)等異構架構發展。這種產能排擠效應已瓦解過去的週期性規律,記憶體廠的議價權大幅提升,焦點從價格轉向供應能力。對於中下游廠商而言,這不僅是成本上漲的挑戰,更是供應鏈韌性的考驗,未來幾年「有貨為王」將成為產業鏈的新常態。