TechNews Logo

Groq 效能翻倍,會加速 AI 普及?

Answer | Powered by TechNews Smart AI

AI 推論新創 Groq 憑藉其獨特的 LPU(語言處理單元)架構,在推論速度上展現出超越傳統 GPU 十倍的效能,成為加速 AI 普及的關鍵動能。輝達(NVIDIA)已斥資 200 億美元達成技術授權與人才延攬,並計畫於 2026 年第三季推出整合 Groq 技術的「NVIDIA Groq 3 LPU」。這項技術核心在於利用 SRAM 取代 HBM,大幅降低資料搬移延遲,使大語言模型(LLM)的輸出速度能比人類打字快 75 倍。隨著 Groq 完成 7.5 億美元融資並積極在全球佈建資料中心,AI 運算正從高耗能的訓練階段,轉向追求極致效率與低成本的即時推論應用。

輝達重金收編 Groq 並非單純的技術補強,而是為了在 AI 推論市場成長至 3,500 億美元規模前,先行壟斷低延遲技術的定價權。對企業而言,AI 普及的最後一哩路在於「首字生成時間」(TTFT)的體感優化,Groq 的 LPU 技術讓即時語音、自動化編碼等應用不再受限於等待時間。這種從「算力規模」轉向「推論效率」的策略轉移,將促使 Token 價格分層化,讓開發者能以更低廉的成本部署大規模應用。當 AI 回應能像真人般即時且成本可控,AI 將從實驗室的展示品,真正轉化為各產業不可或缺的基礎生產力工具。

back_icon 解鎖更多問題

參考資料