Vera Rubin 需要 1152 TB SSD,有多誇張?先看「規模」意味著什麼
在 Vera Rubin 平台中,每套系統配備 1152 TB、且是 16 TB 等級的 SSD,代表的是「為 AI 推論專門打造的記憶體階層」正在重組,而不只是單純堆容量。傳統 GPU 伺服器多依賴 HBM、DRAM 作為主記憶體,但在巨量 KV 快取與長序列推論需求下,這些昂貴且受限的記憶體已無法承擔全部負載,因此才需要藉由 16 TB SSD 形成龐大的外部顯存池,支撐代理式 AI 與長上下文模型的運算。
從產業角度看,1152 TB 不只是「多」,而是為了讓 GPU 不被記憶體拖累,將大量溫資料搬到 SSD 階層,再靠預取與 DPU 加速來縮小延遲落差。這也說明,未來 AI 系統設計不再只追求算力峰值,而是將記憶體容量、頻寬與延遲一併視為瓶頸管理的核心。
ICMS 與 G3.5 記憶體層,如何放大 NAND 需求?
ICMS 架構下的 G3.5 Context Memory,多半由 16 TB TLC SSD 組成,透過 BlueField-4 DPU 與高速乙太網路,讓這一層具備高頻寬、較低延遲的特性,成為介於 HBM/DRAM 與傳統儲存之間的關鍵緩衝區。相較於以往數據一旦溢出就落入慢速 G4 儲存、造成 GPU 閒置,G3.5 等級的 SSD 能讓模型在需要時更快讀回「已算過的記憶」,提升整體推論吞吐量。
在實務上,這代表每台 Rubin 伺服器不再只配置少量 SSD 做系統或冷資料,而是把 SSD 當成「延伸顯存」與「大規模 KV 快取容器」。若 Rubin 類平台擴散到雲端服務商與大型企業資料中心,NAND 需求將不只是線性成長,而是隨 AI 模型規模與服務用戶數疊加放大。讀者在解讀這類報告時,可進一步思考:這波需求是短期題材,還是與 AI 推論長期結構性變化綁在一起?
記憶體是不是 AI 的「超級循環」核心?還需要觀察什麼?
從 Vera Rubin 的設計來看,記憶體與儲存的確正從配角變成 AI 基礎設施的主角之一。HBM 決定單卡效能天花板,DRAM 與 SSD 則決定系統能否負荷長上下文、多人同時使用的推論場景。若未來更多 AI 平台採用類似 ICMS 架構,NAND、DRAM、HBM 都可能同步受惠於「容量 × 頻寬」雙重升級需求。
不過,將「超級循環」視為既定事實前,仍需批判式看待幾個變數:AI 模型是否會在演算法上變得更省記憶體?資料壓縮、稀疏化技術是否削弱對大容量 SSD 的依賴?不同雲端業者是否都會採用類似 Rubin 的架構?這些問題都會影響產業實際成長斜率。對關注產業的讀者來說,關鍵不只是看到 1152 TB 這個聳動數字,而是持續追蹤:記憶體在 AI 架構中的角色,是否真的已從「選配」變成「決定性瓶頸」。
FAQ
Q1:為什麼 Vera Rubin 需要高達 1152 TB 的 SSD?
A:主要是為了承載龐大的 KV 快取與上下文資料,把 SSD 作為延伸顯存,減少重複運算與 GPU 閒置。
Q2:ICMS 架構和傳統 AI 伺服器最大差異是什麼?
A:ICMS 透過 DPU 加速與 G3.5 記憶體層,讓 SSD 成為可被積極存取的快取層,而非單純冷資料儲存。
Q3:記憶體會持續成為 AI 產業成長主軸嗎?
A:目前趨勢指向記憶體與儲存在 AI 系統中的重要性提升,但最終強度仍取決於模型設計、壓縮技術與雲端業者的實際採用策略。
你可能想知道...
相關文章
美光財報超預期卻跌4.7%:市場在算什麼帳?
美光(Micron,NASDAQ:MU)公布第二季財報,營收達238.6億美元,較市場預期高出22%;非GAAP每股盈餘12.20美元,也明顯優於預估的8.73美元。毛利率則由一年前的36.8%升至74.4%,自由現金流年增837%,來到69億美元。 更受市場關注的是第三季展望。美光預估營收335億美元、毛利率81%,顯示公司正快速走出過去記憶體價格波動大、獲利不穩的商業模式。市場卻在財報後讓股價收跌4.7%,反映投資人不只看當季數字,也在重新評估後續能否持續。 AI供應鏈也是這份財報的核心亮點。NVIDIA已認證美光為Vera Rubin平台的HBM4供應商,代表美光在AI伺服器關鍵零組件上的地位進一步提升。HBM屬於AI晶片運算架構中的高頻寬記憶體,供應與議價能力都備受關注。 這項進展也牽動台灣供應鏈的觀察重點。台積電(2330)的CoWoS先進封裝需求能見度,可能因HBM4導入而受到市場重新檢視;南亞科(2408)、威剛(3260)等DRAM相關公司,則可留意美光對毛利率與報價展望是否意味著整體記憶體價格仍有支撐。 另一方面,散戶資金近期明顯分流。市場資料顯示,過去三天散戶買入單一股票的淨金額降至2020年3月以來低點,資金部分轉向SpaceX、Anthropic與OpenAI等新題材。這使得美光的財報利多,並未完全反映在短線股價上。 分析師看法也出現明顯分歧。Susquehanna給出1,750美元目標價,顯示極度樂觀;但賣方共識目標價僅939美元,代表市場主流觀點對後續評價仍偏保守。美光今年以來股價累計漲幅已達212.5%,波動本來就很大,財報後回跌也可視為市場重新定價的一部分。 接下來,市場會聚焦三個重點:第一,第三季營收能否真的達到335億美元;第二,HBM4在Vera Rubin平台的出貨占比是否持續提升;第三,散戶資金是否在新題材退燒後回流AI硬體主線。這些變數,將決定美光這波上漲是來自基本面重估,還是仍帶有循環性成分。
技嘉(2376)AI伺服器訂單看到年底,成長動能與毛利波動怎麼看
技嘉(2376)近期釋出營運展望,受惠 AI 伺服器需求強勁,預期今年營收將逐季成長,下半年表現可望優於上半年。目前在手訂單能見度已達年底。市場關注重點包括: 一、伺服器出貨放量 下半年將以 GB300 與 B300 平台為出貨主力,並同步推動整機櫃與貨櫃式資料中心等模組化解決方案,回應快速部署需求。 二、新世代產品推進 Vera Rubin 相關新品將於下半年陸續出貨,部分客戶也已開始規劃 2027 年的採購。 三、終端應用擴展 技嘉近期展示搭載 NVIDIA Blackwell 架構的 RTX 50 系列 AI BOX 外接顯示卡,透過智慧軟體分配算力,切入地端 AI 應用。 法人預估,技嘉(2376) AI 伺服器業務未來幾年可維持雙位數成長,2026 年營收上看 5,273 億元,每股盈餘預估介於 28.15 至 33.98 元。不過也有法人提醒,中階雲端服務商伺服器市場競爭加劇,未來產品毛利率與營益率仍可能出現波動。 同族群盤中觀察方面,主機板與顯示卡族群近期受 AI 伺服器與邊緣運算題材交錯影響,資金呈現輪動與分歧: 承啟(2425)盤中上漲 9.95%,大戶買盤力道偏正向,短線動能明顯。 青雲(5386)盤中下跌 4.65%,大戶力道偏空,資金動能較保守。 麗臺(2465)盤中下跌 4.02%,賣壓較重,後續仍看支撐。 精英(2331)盤中下跌 3.55%,量能偏弱,賣壓相對明顯。 整體來看,技嘉(2376)在 AI 伺服器訂單能見度高與新平台推進下,基本面仍有支撐;但供應鏈記憶體吃緊與同業競爭,可能影響後續獲利表現。後續也可觀察 AI PC 滲透率與同族群資金輪動狀況。
技嘉(2376)AI伺服器訂單看到年底,後市成長動能與族群輪動怎麼看?
技嘉(2376)近日釋出最新營運展望,受惠 AI 伺服器需求強勁,預期今年營收將逐季成長,下半年表現可望優於上半年。目前在手訂單能見度已達年底,後續成長動能主要來自三個方向:伺服器出貨放量、 新世代產品推進,以及終端應用擴展。 在伺服器出貨方面,技嘉下半年將以 GB300 與 B300 平台為出貨主力,並同步推動整機櫃與貨櫃式資料中心等模組化解決方案,以滿足快速部署需求。新世代產品部分,Vera Rubin 相關新品預計於下半年陸續出貨,且部分客戶已開始規劃 2027 年採購計畫。終端應用方面,技嘉近期也展示搭載 NVIDIA Blackwell 架構的 RTX 50 系列 AI BOX 外接顯示卡,透過軟體分配算力,切入地端 AI 應用市場。 法人評估,技嘉的 AI 伺服器業務未來幾年可望維持雙位數成長,並預估 2026 年營收上看 5,273 億元,每股盈餘約落在 28.15 至 33.98 元。不過,法人同時提醒,中階雲端服務商市場競爭加劇,未來產品毛利率與營益率仍可能出現波動。 同一時間,電子中游主機板與顯示卡族群也受 AI 伺服器與邊緣運算題材影響,盤中資金呈現明顯輪動與分歧。承啟(2425)盤中股價上漲 9.95%,大戶買盤力道偏正向;青雲(5386)下跌 4.65%,資金動能偏保守;麗臺(2465)下跌 4.02%,賣壓較明顯;精英(2331)下跌 3.55%,量能相對疲弱。 整體來看,技嘉(2376)在 AI 伺服器訂單能見度高與新平台出貨助攻下,基本面具備支撐,但仍需留意供應鏈記憶體吃緊與同業競爭對獲利的影響。後續可持續觀察 AI PC 滲透率與同族群概念股的資金輪動變化。
技嘉(2376)AI伺服器需求旺,下半年營運成長動能看俏
技嘉(2376)近期釋出正向展望,受惠於AI運算需求從雲端延伸至地端,今年營運可望逐季成長,全年成長幅度有機會優於去年。公司目前AI伺服器訂單能見度已看到年底,部分客戶也開始規劃明年採購,顯示需求延續性仍在。 下半年出貨主力將聚焦GB300與B300平台,Vera Rubin相關新產品也會依客戶導入進度陸續出貨。同時,技嘉(2376)也推出搭載新架構的AI BOX外接顯示卡,延伸AI PC應用場景,進一步帶動終端AI滲透率。 從營運表現來看,技嘉(2376)今年4月合併營收達522.67億元,創下歷史新高,年增73.66%;5月營收490.53億元,維持高檔。法人認為,AI伺服器業務將持續成為營收成長主力,未來相關營收占比有望進一步提高。 籌碼面方面,截至6月上旬,外資與投信操作互有進出。6月10日三大法人合計買超873張,其中外資買進1214張。不過近五日主力買賣超為-5.9%,顯示短線仍有逢高調節跡象。 技術面上,技嘉(2376)5月底股價收在370元,單月漲幅約9.63%;6月上旬則在340元至399元區間震盪,6月10日收在344.50元。整體趨勢仍受基本面支撐,但短線急漲後的高檔震盪,反映乖離率擴大與量能續航力需持續觀察。 整體而言,技嘉(2376)在AI伺服器與AI PC雙引擎帶動下,營運動能維持向上,但短線籌碼與技術面波動也不容忽視。後續可留意新世代伺服器出貨節奏、供應鏈變化,以及AI相關產品的滲透進度。
輝達(NVDA) AI需求強勁,HBM4與供應鏈布局透露什麼訊號
輝達(NVDA)近期在人工智慧算力市場持續擴張,主力系統產品需求強勁。為確保產能,公司積極布局記憶體供應鏈,並與SK海力士建立多年期技術合作,共同研發AI工廠所需的下一代專用記憶體,涵蓋Vera Rubin AI超級電腦等計算平台。 公司也確認下一代AI算力平台的核心零組件HBM4供應商,並推動量產階段,以保障未來供貨需求。法人機構觀察指出,Grace Blackwell系統產品需求上升速度優於預期,公司已提前鎖定至2027年的記憶體供應。 在技術與製造方面,輝達也推動晶圓廠自主化營運,合作夥伴將導入CUDA-X庫及PhysicsNeMo框架,以提升晶片模擬與光刻計算效率。 輝達(NVDA)為圖形處理單元設計領導商,近年營運重心擴展至人工智慧與自動駕駛領域。公司提供AI GPU硬體產品,並透過軟體平台Cuda支援大型語言模型的開發與訓練,同時擴展資料中心網路解決方案,以處理複雜的工作負載。 根據最新交易資料,輝達於2026年6月9日股價呈現震盪,開盤價210.615美元,最高211.4000美元,最低199.3400美元,終場收在208.1900美元,單日下跌0.4500美元,跌幅0.22%,成交量達180,962,450股,成交量變動達30.78%。 整體來看,輝達(NVDA)面對強勁的AI基礎設施需求,正透過產業鏈合作確保關鍵零組件供貨穩定。後續可持續留意高階運算平台的市場出貨動能,以及整體半導體供應鏈的產能規劃,作為觀察產業發展的參考。
NVIDIA(NVDA)擴大AI基礎設施與物理AI布局,Vera Rubin交付與PC晶片進展受關注
NVIDIA(NVDA)近期在AI基礎設施與物理AI領域展現實質進展。執行長黃仁勳接連宣布多項戰略合作,推動AI技術從雲端走向實體製造與個人運算設備。 首先,NVIDIA與SK海力士達成多年期技術合作,將聯合研發下一代AI儲存產品,以支援Vera Rubin AI超級電腦與AI工廠建設。針對市場對HBM供應的疑慮,黃仁勳也確認Vera Rubin晶片已全面投產,預計於今年第三季開始交付。 其次,NVIDIA接受與現代汽車的合作提案,預計在韓國新萬金地區建立資料中心。現代汽車預計採購最多5萬顆AI晶片,雙方並將加速推動波士頓動力人形機器人Atlas於2026年進入量產,持續深耕實體製造的機器人市場。 此外,NVIDIA也預計在秋季與主流品牌推出搭載RTX Spark超級晶片的個人電腦,進一步擴展終端設備版圖。 從基本面來看,NVIDIA是頂級獨立圖形處理單元設計商,晶片應用涵蓋遊戲、資料中心與汽車資訊娛樂系統。近年營運重心已從傳統PC圖形應用,擴充至人工智慧與自動駕駛等高附加價值領域。除了提供AI GPU,公司也具備Cuda軟體開發平台,用於AI模型訓練,並持續擴充資料中心網路解決方案,以支援複雜運算工作負載。 就近期股價表現而言,根據2026年6月5日交易資料,NVIDIA開盤價為214.53美元,盤中最高214.87美元,最低204.33美元,終場收在205.10美元,單日下跌13.56美元,跌幅6.20%,成交量為219,655,531股,較前一交易日增加29.96%。 整體來看,NVIDIA透過結盟SK海力士與現代汽車,持續穩固其在AI算力基礎設施與物理機器人領域的產業鏈位置。後續可留意Vera Rubin平台第三季交付進度、PC晶片終端產品的市場接受度,以及全球總體經濟政策對高成長科技股帶來的波動影響。
NVIDIA Vera Rubin 規格傳聞下,華邦電(2344)與南亞科(2408)為何先被市場拋售?
最近半導體族群波動加劇,市場先把最悲觀的劇本反映在股價上,焦點之一來自外界對 NVIDIA 下一代 Vera Rubin 伺服器規格調整的解讀。雖然有人將單機櫃記憶體容量從約 55TB 降到 28TB,直接聯想到需求下滑,但相關研究也提醒,單看規格變動,不能直接推論實際需求轉弱。 回到營運面,華邦電(2344)前 5 個月合併營收年增超過 128%,5 月營收還創下新高,顯示記憶體市況並未明顯轉冷。南亞科(2408)則較像是受到整體族群氣氛與半導體風險偏好下降的影響,短線股價同步承壓,但未必代表營運出現結構性轉差。 這波下跌更像是籌碼面先鬆動。當市場開始擔心 AI 伺服器記憶體需求可能調整,資金往往先撤離先前漲幅較大、又與半導體景氣高度連動的個股,形成族群性賣壓。此時與其只盯單一新聞,不如同步觀察盤後籌碼、分點進出、法人動向與大戶散戶買賣超,會更接近真實資金流向。 接下來能否穩住,重點可觀察三件事:AI 伺服器實際拉貨是否延續、記憶體產品價格是否回穩,以及法人籌碼能否重新回流。華邦電與南亞科同時被納入高股息 ETF 成分,也反映中長線資金並未完全離場,只是短線風險偏好下降,使股價先行反映市場擔憂。 整體來看,記憶體族群同時受產業需求、價格循環與市場情緒影響,新聞常常先放大最壞情境,但後續仍要回到基本面與籌碼面是否同步改善。
輝達深耕南韓供應鏈,HBM合作與Vera Rubin藍圖受矚目
輝達(NVIDIA)執行長黃仁勳近日抵達南韓首爾,與SK集團、LG集團及Naver等南韓科技企業高層會面。黃仁勳於晚宴期間正式宣布,輝達將在南韓市場引進四項全新業務,並規劃設立一座大型前沿研究中心,藉此深化與南韓記憶體及科技大廠的跨界供應鏈合作。同時,他也提及輝達下一代AI超級電腦「Vera Rubin」與全新CPU「Vera」的技術藍圖。 在公開行程中,黃仁勳與企業高層於首爾街頭發放印有「HBM」縮寫的餅乾,象徵雙方在高頻寬記憶體技術上的合作關係。此次到訪在南韓引發高度關注,成均館大學學生為此開發「黃仁勳足跡即時地圖」,上線五日即吸引超過10萬人次瀏覽。該網頁系統還將黃仁勳的行程動態與三星電子及SK海力士等半導體類股的即時股價連動,反映市場對輝達動向及相關供應鏈發展的高度關注。
輝達重挫6.2%:算力需求沒消失,市場在怕什麼?
輝達6月5日收在205美元,單日重挫6.2%,Broadcom也跌了8%,把半導體族群一起拉下來。但同一天,Google與SpaceX簽下每月9.2億美元、總值上看300億美元的算力租用協議,合約裡包含11萬張輝達GPU,顯示算力需求並沒有消失。 Broadcom第二季AI半導體營收翻倍、AI訂單突破300億美元,卻沒有上調長期AI營收目標,成為市場失望的關鍵。投資人要的不是好成績,而是比好成績更好的展望。這種情緒也延伸到輝達:如果連Broadcom都不敢拉高目標,市場自然會追問,輝達下季910億美元指引還有多少上修空間。 台股AI供應鏈短線跟著美股波動,但真正值得觀察的,是Google這筆算力合約最後會把硬體訂單落在哪些環節。台積電、CoWoS封裝、散熱模組、高速銅連接等供應鏈,下一次法說會上,資料中心客戶的接單能見度是否拉長到2027年,將是重要驗證點。 記憶體端也有新進展。黃仁勳確認三星、SK海力士、美光三家同時通過HBM4認證,並已進入量產,目標支援Vera Rubin平台第三季出貨。這代表輝達在供應鏈上更強調多元化,避免重演HBM3e時期過度依賴單一供應商的情況。對記憶體族群而言,這是需求確認,但誰能拿到最大份額,仍有待後續觀察。 Google與SpaceX的合作,本質上是Google以租用方式取得算力,而不是自己直接買GPU蓋資料中心。SpaceX提供的11萬張輝達GPU,代表有人先幫輝達預訂了一批硬體需求。更早前,SpaceX也把Colossus 1資料中心的22萬張GPU算力租給Anthropic,顯示算力租用市場正在形成獨立商業模式,而輝達正是底層硬體供應者。 目前S&P 500中,有51%的市值集中在本益比超過10倍的公司,輝達也在其中。研究機構TS Lombard甚至把輝達與2000年網路泡沫時期的思科相比,核心意思是:市場對AI基礎建設的期待,可能已經走在實際需求前面。輝達第一財季營收816億美元、年增85%,下季指引910億美元,數字本身沒有問題;問題在於,市場可能已經把這些數字先算進去,還要求更多。 如果股價後續止跌回穩,可能代表市場把這次下跌視為情緒性超賣,願意重新用910億美元指引定錨;如果在財報後仍持續走弱,則更可能反映的是估值壓力,而不只是單季數字的問題。 接下來有三個觀察點。第一,看下季營收是否真的落在910億美元以上;第二,看Vera Rubin第三季出貨量是否如預期落地;第三,看Oracle 6月10日法說會的資本支出指引,是否仍維持高檔。這三個訊號,會決定這波下跌是雜訊,還是市場開始重新定價AI鏈的成長速度。
輝達(NVDA)敲定HBM4供應鏈,Vera Rubin量產與機器人布局受關注
輝達(NVDA)近期迎來供應鏈與業務版圖的雙重進展。執行長黃仁勳近日敲定下一代 Vera Rubin 人工智慧算力平台的核心零組件供應商,並展開亞洲行程,顯示公司正加速推進新平台量產準備。 在供應鏈方面,輝達已批准三星電子、SK海力士與美光科技供貨 HBM4,以支應預計於今年第三季出貨的 Vera Rubin 平台需求。這代表先進記憶體供應鏈正為新一代 AI 算力平台做最後整合。 除了晶片與伺服器相關布局,輝達也把合作範圍延伸到機器人與實體 AI 領域。黃仁勳訪韓期間,與現代汽車、LG 集團、SK 海力士、三星電子與 Naver 等企業交流,並宣布將合作版圖從晶片延伸至 AI 工廠與機器人應用。 同時,輝達也已啟動韓國研發中心的籌備作業,並開始招募人才。公司看重韓國成熟的半導體供應鏈與工業機器人應用環境,未來若研發園區落地,將有助於強化在地技術合作。 從市場表現來看,輝達股價近期受整體半導體族群波動影響,盤中曾下跌 5.01% 至 207.7 美元;不過在 2026 年 6 月 4 日的交易中,輝達開盤 213.905 美元,盤中高點 221.6 美元,低點 210.97 美元,收在 218.66 美元,單日上漲 1.82%,成交量也較前一交易日增加 5.04%。 整體而言,輝達目前的重點不只在 AI 晶片出貨節奏,也包括 HBM4 供應鏈、Vera Rubin 平台量產,以及機器人與實體 AI 的跨領域拓展。後續可持續觀察第三季出貨後的營收轉換,以及半導體板塊資金變化對股價的影響。