TPU
張量處理單元(Tensor Processing Unit)。Google 自研嘅客製化晶片,專為 AI 矩陣數學運算而生,而非通用圖形處理。
GPU
圖形處理單元(Graphics Processing Unit)。NVIDIA 旗艦晶片,起初為電競遊戲開發,現為全球 AI 模型訓練嘅主導硬件。
推理 (Inference)
將訓練好嘅模型投入實際應用運行。與模型訓練相比,推理嘅運算成本較低,但商業落地嘅重要性正呈幾何級數上升。
CUDA
NVIDIA 獨家嘅軟件生態層。呢個先係實質嘅競爭護城河 —— 數以百萬計嘅開發者被代碼生態牢牢綁定,而非單純因為硬件晶片。
Google 究竟發佈咗啲乜?
喺拉斯維加斯舉行嘅 Google Cloud Next 2026 大會上,Google 釋放出兩個震撼市場嘅強烈訊號。首先,官方確認第七代 TPU「Ironwood」正式進入全面商用(General Availability),呢款晶片係首款專為 Google 所謂大規模推理的「智能體時代(Agentic Era)」量身打造。與此同時,Google 亦提前披露其第八代晶片架構:兩款分工專屬的 ASIC 晶片 —— 專攻超大規模訓練的 TPU 8t,以及主打高速推理的 TPU 8i。兩者均鎖定台積電(TSMC)的 2 納米(2nm)先進製程,預計將於 2026 年下半年全面落地。
簡單來講,TPU 就是 Google 用來對抗 NVIDIA 繪圖晶片(GPU)的皇牌武器。GPU 屬於甚麼都能做的「通用軍火箱」,而 TPU 則是從零開始、純粹為 AI 矩陣運算而設計的「特種專門晶片」。Google 自 2016 年起就默默佈局自研矽晶片,而這第八代架換更是其歷史上野心最大的一次「雙軌分流」,首次將 AI 生態週期的「訓練」與「推理」徹底拆解成兩款獨立晶片設計。
據官方公佈的規格,TPU 8t 訓練叢集(Pod)的算力表現,幾乎是同等 Ironwood 叢集的三倍,且每瓦特性能(Performance per watt)直接翻倍。而負責推理的 TPU 8i,則旨在為企業客戶同時驅動數以百萬計的 AI Agent(智能體)在線運作。
「呢點要留神:最後呢部分帶嚟嘅結構性影響極深。」行政總裁 Sundar Pichai 在財報電話會議上明確放風:隨著 AI 實驗室、頂級量化基金及高效能運算(HPC)應用對 TPU 的需求呈井噴式增長,Google 將打破以往「只供雲端租用」的傳統,開始將 TPU 硬件直接交付予特定大客的「本地數據中心(On-premise data centres)」。Google 顯然已不滿足於將自研晶片優勢藏在自家雲端內部,而是要正式化身成硬件供應商。
講到交易層面,關鍵唔係 headline,而係背後嘅資金流:Google 唔再單純係 TPU 嘅用家,佢正轉身變成硬件賣家,而且班科技巨頭早就簽好哂「大碼合約」。
Anthropic 的算力多元化佈局
開發 AI 模型 Claude 的頂級獨角獸 Anthropic,日前確認已與 Google 簽署了一項極具指標性的基礎設施協議,合約鎖定高達 100 萬顆 Ironwood TPU 晶片的算力供應。這筆涉及數百億美元的超級大單,已獲雙方官方正式確認。
要透視這筆交易的本質,市場參與者需要完整解讀 Anthropic 的多元算力策略:
市場之所以需要看清這個「三足鼎立」的宏觀全景,是因為不少海外财經媒體在報導時,往往將其誇大為 Anthropic 要「拋棄」NVIDIA 轉投 Google。這種觀點顯然缺乏對跨國科技龍頭「複合式架構」的精準認知。這筆 Google 大單實質上是一次高瞻遠矚的「擴產」,而非與 AWS 或 NVIDIA 劃清界線。
點解比拼晶片跑分(Benchmarks)搞錯咗重點?
單從逐顆晶片(Per-chip basis)的角度來看,現今世代的對決其實比媒體吹朋的更為膠著。全面投入商用的 Ironwood 能夠輸出約 4.6 Petaflops 的 FP8 算力。而 NVIDIA 的 Blackwell B200 在 FP16 精度下則提供約 4.5 Petaflops。不過,跨精度對比(Cross-precision comparisons)在技術上必須保持審慎,開因兩者的運算維度並不完全對等。
但如果交易員天天跟著這群工程師比拼「跑分」,那就完全忽略了背後更龐大的商業敘事。
當晶片真正落地部署成超級叢集(Pod Scale)時,兩者的商業分化才真正顯現。一個由 9,216 顆晶片組成的 Ironwood Superpod 能夠爆發出 42.5 Exaflops 的恐怖算力;而即將面世的第八代 TPU 8t 叢集(9,600 顆晶片),在 FP4 精度下更是直指 121 Exaflops。更關鍵的是,Google 宣稱其技術能在單一邏輯叢集內實現高達 100 萬顆晶片的「近線性擴展(Near-linear scaling)」。對於動輒調動數十萬顆晶片同時運作的 Hyperscalers(超大規模雲端商)而言,**「叢集層面的經濟學(Pod-level economics)」**遠比單顆晶片的跑分高低重要得多。
性能基準跑分
核心晶片對決:算力與每瓦特效率
精度說明:直接對比需保持審慎。Ironwood 算力基於 FP8 精度測算,NVIDIA B200 基於 FP16,而 TPU 8t 叢集數據則基於 FP4。將 FP4 數據減半可作粗略的 FP8 等效參考。每瓦特性能(Perf/Watt)以 NVIDIA H100 作為基準 100 進行指數化,數據反映 Google 官方宣稱之規格,並非第三方獨立驗證。實際跑分隨工作負載及環境變化而異。
NVIDIA 牢不可破的王座?
根據權威數據機構 IDC 的最新統計,NVIDIA 目前仍強勢鯨吞全球 AI 數據中心晶片市場高達 81% 的市佔率。這種市場集中度在金融史上堪稱奇蹟,而且短期內的訂單「能見度」依維持得極具韌性。
近期華爾街大行對 NVIDIA 的盈利增長預期依然樂觀,這主要受到全球 AI 基礎設施擴產潮未見降溫,以及 Blackwell 平台在各大雲端巨頭中被瘋狂採用所支撐。NVIDIA 自身給出的前瞻指引(Guidance)更是驚人 —— 2026 至 2027 年底前,Blackwell 以及下一代 Vera Rubin 架構的累計在手訂單已直逼 1 萬億美元大關。
不過,挑戰者正從四面八方湧入。AMD(超微半導體)憑藉其機架級伺服器系統正攻城掠地。IDC 調研顯示,AMD 目前已成功搶下 AI 加加速器市場約 10% 的份額,相比兩年前低個位數的窘境大幅躍升。與此同時,亞馬遜和 Google 的自研客製化矽晶片業務(Custom Silicon)正以幾何級數擴張。單是亞馬遜旗下的晶片業務(涵蓋 Trainium、Graviton 及 Nitro),其年化營收(Revenue run rate)就已悄然突破 200 億美元大關,同比錄得三位數暴漲,2026 年第一季度的環比增長更接近 40%。
「睇到呢度,NVIDIA 嘅多頭邏輯依然好清晰:」市場實質需求依舊極度強勁,且 NVIDIA 的生態圈在短期內依然深度嵌死在 AI 算力棧的最底層。
但作為長線配置者,真正值得考量的核心變數,不是眼前的季度財報有多亮眼,而是**在下一輪算力升級週期中,NVIDIA 是否還能保有如此暴利的定價權(Pricing power)**。Google、亞馬遜及微軟在自家矽晶片上每多累積一份底氣,NVIDIA 談判桌上的籌碼就會減少一分。背後的博弈動機非常單純:這群萬億級科技巨頭有著一萬個理由去終結「單一供應商鎖定」,而且佢哋兜裡有著全世界最雄厚的資本開支(CapEx)去落實這件事。
市場結構透視
全球 AI 數據中心加速器市佔率預估 (2026)
以 AI 加速器營收為統計標準。客製化晶片(Custom Silicon)在三年前幾乎為零,如今已成氣候。市場對 AMD 的市佔預估因統計口徑而異,近期華爾街分析師給出的預期落在 4% 至 10% 之間。
數據來源:IDC 預估報告、Silicon Analysis、公開披露及各大上市公司財報。圖表數據為近似值,隨市場定義及統計方法不同或有實質性修訂。
策略師眼中的美股與板塊部署
對於 NVIDIA 而言,短期的盈利神話與長期的競爭格局正在發生「結構性背離」。爆發式的財報表現固然能為短期的市盈率(P/E 多倍體制)保駕護航,但大客戶紛紛走向自研晶片的歷史巨輪,一旦啟動就很難逆轉。
對於 Alphabet (Google 母公司) 來講,Ironwood 的正式商用以及第八代晶片的預期,代表著一個遠超廣告業務的第二增長曲線。2026 年第一季度,Google Cloud 同比狂飆 63%,在全球三大 Hyperscalers 中增速傲視同群。倘若企業級推理(Enterprise Inference)的工作負載繼續瘋狂向 Google 基礎設施遷移,這條由 Anthropic 和 Meta 作為錨定大客的「TPU 算力即服務(TPU-as-a-service)」渠道,將實質性地拉長 Google 的估值溢價空間。
「講到交易層面,更聰明嘅資金流,其實正悄悄湧入那些沒那麼顯眼的供應鏈影子贏家。」
無論這場晶片大戰最終是 NVIDIA 續寫神話,還是 Google ASIC 成功突圍,兩者的晶片都必須交由台積電(TSMC)生產(TPU 8t/8i 已鎖定台積電 2nm 先進製程)。同時,博通(Broadcom)作為 Google 訓練晶片的共同設計者,聯發科(MediaTek)作為推理晶片的合作方,都將在 ASIC 浪潮中直接收割利潤。此外,高密度液冷散熱供應商(Liquid cooling companies)、電力基礎設施商,以及受惠於雲端巨頭資本開支暴增的數據中心房地產信託(Data Centre REITs),都是極具防守性的結構性主線。要知道,2026 年全球四大雲端龍頭的累計 CapEx 預估將衝破 7,000 億美元大關,相比 2025 年的 3,880 億美元幾近翻倍。這種級數的資金鐵流,才是市場最強烈的宏觀訊號。
納斯達克 100 (NAS100)
透視 NVIDIA 與四大 Hyperscaler 財報表現的最直觀風向標。任何板塊層面的財報驚喜或暴雷,都會引發該指數的劇烈震盪。
離岸人民幣 (USD/CNH)
用來捕捉中美晶片科技戰、關稅及貿易政策敏感度的核心工具。全球地緣政治的持續不確定性,令該貨幣對的風險溢價維持高企。
美國 10 年期債息 (US10Y)
美債息 4.5% 水平向來是全球科技股估值的分水嶺。在高息維持的鷹派環境下,債息若因通脹預期走高,將直接擠壓高估值科技板塊。
注意:以上內容僅供一般市場評論,並不構成任何交易訊號或個人投資建議。CFD(差價合約)槓桿交易涉及高風險,損失可能超過初始入金。過往表現並不預示未來結果。
真正的風險隱藏在哪裡?
AI 基建開支的暴增,並不等同於買入任何美股都能穩賺不賠。要在這場「晶片內戰」中全身而退,以下四大結構性風險必須時刻警惕:
估值透支風險
NVIDIA 乃至整個 AI 硬件板塊目前的股價,早已深度定價(Priced in)了未來數年的爆發式增長。一旦前瞻指引(Guidance)出現任何微小瑕疵、毛利率因競爭壓縮、或大廠基建需求出現哪怕是短暫的停頓,都可能引發整個科技板塊的估值劇烈修正。
被低估的 CUDA Moat
NVIDIA 真正撕不開的護城河從來不是硬件,而是百萬工程師日夜賴以生存的軟件生態。Google 雖然推出了 TorchTPU 倡議試圖降低開發者的「轉移成本(Switching costs)」,但軟件生態的慣性極其頑固,這條護城河的黏性是市場最容易低估的因素。
商業化交付風險
寫在發佈會 PPT 上的跑分數據永遠完美。但對 Google 而言,將自研 ASIC 大規模量產、按時交付、並為外部企業客戶提供商業級(Commercial-grade)的 SLA 服務承諾,其營運難度與以往供給自家內部使用完全是兩個概念。
市佔侵蝕 vs 營收絕對值
隨著 AMD 和各大雲端 ASIC 崛起,NVIDIA 在整體市場的「百分比份額」下滑幾成定局,但由於成個 AI 算力蛋糕(Total Addressable Market)膨脹得太快,NVIDIA 的「絕對營收」依然可能錄得增長。交易員在做空或做多時,必須分清市佔率被蠶食與實質盈利萎縮的差別。兩者並非同一回事。
投資者最終應如何落筆?
這場 AI 晶片世紀大戰,絕非簡單的「非黑即白」或者「你死我活」。這是一個規模太過龐大、甚至上升到國家戰略高度的超級市場,註定不可能由任何單一龍頭永久性地無限期壟斷。
NVIDIA 憑藉純粹的技術遠見和長達十年的軟件長征,贏得了應有的王座,其近期的財務回報也將繼續印證這一點。
但在 2026 年的今天,站在擂台對面的挑戰者,不再是拿著融資商業計劃書的初創公司,而是手握萬億資源、掌控全球雲端基礎設施、且有著絕對動力去「終結單一壟斷」的超級巨無霸。佢哋砸向台積電 2nm 先進製程的每一張資本開支支票,都是實實在在的歷史轉折信號。
在 Warsh 式聯儲局高息壓頂的時代,我們不妨換個思考框架:未來 AI 算力需求的總量是否增長,可能不再是核心變數。**誰能把這份算力轉化為實質的利潤率(Margins),而市場又願意給予其多少倍的估值溢價(Valuation multiple)**,這才是每位成熟投資者需要根據自身風險偏好,仔細權衡的終極考驗。
情景模擬免責聲明:本報告中提及之所有前瞻性情景及「未來 30 天/3 個月」的市場路徑,僅作為壓力測試與催化劑邏輯推演之教學模型,並不代表本機構的官方核心預測或投資保證。市場所涉之原油價格目標、聯儲局貨幣政策轉向或任何宏觀金融工具水平皆為假設性模擬。真實市場瞬息萬變,請務必保持審慎。過去表現並不代表未來回報。