“卷王”英偉達的真面目

2022-04-04 19:02 來源:互聯網

GTC 2022過后,廣大人民群眾紛紛奔走相告,黃仁勛又帶著他的新“核彈”來“炸街”了。

具體發布的新產品和技術,很多文章都已經詳盡地介紹過了,一言以蔽之:牛!其中最炸裂的是H100 GPU,采用了臺積電4納米制程工藝,集成1800億個晶體管,浮點計算能力相比前一代A100快了三倍,被看作英偉達的新一代“核彈”。

一時間鑼鼓喧天、鞭炮齊鳴,工業界盼到了“算力怪獸”,消費者們也迎來了顯卡降價的日子。

但冷靜下來想一想,英偉達是“為AI繼算力,為眾人送溫暖”的大善人嗎?無論粉絲還是看客,都必須承認,英偉達是一個商業奇才。作為最傳奇的數字經濟股,它的營收遠低于英特爾或Meta,但市值卻遙遙領先,這顯然不是“技術信仰”所能夠解釋的。

用黃仁勛本人的說法,英偉達歷史上幾次具有里程碑意義的關鍵技術推出,背后其實都是對自家 GPU 技術的發展成果進行了“泛化”(generalize),發現它居然可以做更多不同的事情。

“卷王”英偉達的真面目

究竟是新需求催生了新產品,還是新產品激活了新需求,這是一個“雞生蛋蛋生雞”的問題。但我們可以從英偉達的行動與結果的相關性中,總結出一個屢試不爽的模板:

在主流需求未曾觸頂的時候,擴充豐富產品線,哪怕“穿馬甲”也要全面布局,將利基市場挖掘到最大價值;而一旦主流需求出現頹勢和退潮,超過當前市場需求的核彈級產品就會被拋出(當然功耗也爆炸了),再次點燃大眾和華爾街對GPU的想象空間,進一步英偉達的估值推向新高。

比起“卷王之王”,英偉達更像是穩坐釣魚臺的姜太公,把全球消費者和產業界拿捏得明明白白。

四次供需“反彈”,英偉達的算力霸主之路

英偉達的算力霸主地位,究竟是怎么實現的呢?細數歷史上的幾次里程碑事件,會發現有四次關鍵“反彈”。

第一次反彈:個人電腦的增長風暴。

從1993年成立到1999年這段時間里,英偉達在群雄林立的顯卡市場中并沒有占據太大的領先優勢。

當時研發顯示芯片的廠商多如牛毛,除了IBM、索尼、東芝等半導體巨頭,垂直賽道如Matrox、3dfx、Trident、S3 Graphics都曾引領風騷。英偉達先后發布的NV1、NV2都沒有什么競爭力,差點破產。1999發布的TNT2(也就是“NV5”)雖然奪得了性能桂冠,但速度只比NV4提高了10%至17%,跟主要競爭對手3dfx Vodoo3也沒有拉開差距。

于是,第一個“核彈”來了,英偉達推出了NV10,也就是GeForce 256——第一款專業圖形處理核心,直接轟開了個人電腦游戲加速的市場。

“卷王”英偉達的真面目

在此之前,GPU顯示芯片都屬于固定功能的芯片,而GeForce 256的出現,成為了第一款“集成了轉換、照明、三角形設置/剪裁和渲染引擎的單芯片處理器”,能夠每秒處理至少1000萬個多邊形,讓GPU可以從CPU手里接管大量幾何運算的工作,解決通用計算無法解決的問題,極大地推動了PC游戲、創意設計等對GPU的需求。

為了充分發揮GeForce 256的計算潛力,英偉達還基于該芯片推出了Quadro框架,服務于專業繪圖工作站,用來幫助創意和技術人員更高效地工作。隨后又推出了可編程 shader,讓開發者可以在GPU上發揮更多創意,比如3D渲染、游戲開發、特效制作等……

用黃仁勛的話來說就是:鼓勵或者調動全球人民的激情,讓他們了解什么叫三維的圖形處理器,給他們提供很多工具進行創新。

“卷王”英偉達的真面目

GeForce256發布的第二年,英偉達就接到了微軟的訂單,為Xbox視頻游戲機開發顯卡。此后靠的則是“半年更新、一年換代”的市場操作。GeForce系列產品線不斷豐富、全面布局,覆蓋了高中低端各類市場,還學會了穿“馬甲”,在原有芯片基礎上稍作提升和改進,就作為新系列快速推向市場。將競爭對手卷得苦不堪言,英偉達也因此占據了GPU市場70%以上的份額。

到了2007年,英偉達市值已經上漲了500%以上,被《福布斯》雜志評為年度公司。

第二次反彈:并行計算的強勁推力。

早在2006年,英偉達就推出了革命性的通用計算架構CUDA,以及通用計算硬件Tesla GPU。但在當時,深度學習并沒有現在這般受歡迎,只有一些大型企業、研究機構需要GPU來進行藥物發明、天氣建模、金融分析等高性能計算任務。

英偉達是從何時起開始加大力度激活對GPU并行計算能力的需求呢?答案是2009年。

這一年,英偉達舉辦了首屆“GPU技術會議”,面向“使用GPU解決重要計算工作的開發者、工程師和科研人員”布道。

“卷王”英偉達的真面目

2006-2009年間,市場發生了什么變化?受摩爾定律的統治,個人消費者對電腦顯卡的性能需求開始倦怠了。

期間,英偉達其實也有不錯的產品發布,比如重量級的Tegra移動處理器,集成了ARM架構處理器和Geforce GPU,功耗比普通PC筆記本電腦低30倍。產品雖好,卻很難激發起消費者的澎湃熱情,畢竟市場上還有那么多顯卡在賣,只要愿意等,就能以更香的價格入手。

同時,因為一些被OEM整合到蘋果、戴爾、惠普的筆記本當中的GPU缺陷,導致“異常故障率”而成為集體訴訟的對象。僅2008年第一季度,英偉達的收入減少了約2億美元。股價也從37美元一路跌到6美元左右。

“卷王”英偉達的真面目

于是英偉達開始加大高性能計算領域的布局,在首屆GPU技術會議上,推出了代號為 “Fermi” 費米的下一代CUDA GPU架構,并大力宣傳GPU在大規模并行計算任務的優勢。

費米架構作為“核彈”是稱職的,一方面,它的性能很高,基于該架構的Geforce 4系列產品在性能上成功壓制了競爭對手,但這一架構的功耗和發熱量也十分恐怖。

“卷王”英偉達的真面目

無論如何,自此之后,英偉達在計算領域廣受歡迎,2010年全球最快的超級計算機天河-1A,就采用了7168顆英偉達的Tesla M2050 GPU,將大規模并行GPU與多核CPU結合,成為當時異構計算的代表。

2012年深度學習三巨頭之一Geoffrey Hinton及其學生Alex,使用GPU來加速訓練深度神經網絡,在ImageNet競賽中一鳴驚人,掀開了人工智能第三次浪潮的大幕,進一步帶動了英偉達GPU的銷量。

“卷王”英偉達的真面目

(Geoffrey Hinton 和 Alex Krizhevsky、 IIya Sutskever)

AI需求的增長,還幫助英偉達開拓了汽車市場,緊接著2013年發布的Geforce GTX Titan泰坦,代表了開普勒架構的頂級水準,成為自動駕駛汽車和高級駕駛輔助系統的算力基礎,支撐關鍵的計算機視覺功能。

人工智能從學術界到工業界的強勁需求,推動了GPU價格和英偉達股價水漲船高,完成了一次驚艷世界的“反彈”。

“卷王”英偉達的真面目

(NVIDIA DRIVE)

第三次反彈:礦難之后,圖靈破局。

英偉達在深度學習領域的身位持續領先,但別忘了,規模龐大的零售市場可是現金牛啊。

2018年8月14日的SIGGRAPH 2018上,英偉達全新一代“圖靈”架構GPU問世,支持實時光線追蹤,專用于AI加速計算的張量核心首次加入了民用3D計算產品,為游戲世界帶來了逼真的照明和反射效果。

在此之前,普通消費者早就“苦挖礦久矣”。

“卷王”英偉達的真面目

數字貨幣的爆火,讓挖礦成了一門好生意,GPU被“礦廠”大量收購,一時間供不應求,加上黃牛囤積居奇,導致顯卡的市場價格比零售價格高出了好幾倍,普通消費者只能望洋興嘆。直到時間進入2018年,數字貨幣的潮水逐漸褪去,礦卡銷量急劇下滑,顯卡庫存增加,一卡難求的局面有所緩解。

顯卡廠商不僅面臨降價殺估值的壓力,隨著大量礦卡流通到零售渠道中,還亟須打消消費者持幣觀望的情緒。這個時候,黃仁勛帶著“英偉達十多年來在計算機圖形領域最重要的創新”,再一次刺激了市場。

全新的技術和架構,將GPU的性能和英偉達的市值,又推到了一個全新的高度。

“卷王”英偉達的真面目

第四次反彈:幣圈走熊,但產業智能方興未艾。

今年最大的變化,是缺芯情況有所緩解,同時幣圈再次走熊,比特幣和以太坊價格都創下新低,GPU價格再一次回落。根據國外媒體報道,英偉達已經通知合作伙伴 GPU 的生產成本將下調 8% - 12%。如果顯卡價格進一步下降,市場對英偉達的信心也會過度反映到股價上。

“卷王”英偉達的真面目

不過,你永遠可以相信英偉達“核彈工廠”的能力。誠如大家在GTC 2022大會所看到的,全新一代產品和技術全部瞄準了最具想象空間的產業AI應用場景。

最新一代“核彈”H100 GPU,和Hopper 架構,專為Transformer大參數模型打造,可以說是完美迎合了預訓練大模型的需求。

“卷王”英偉達的真面目

NVIDIA Quantum-2,主芯片包含570億個晶體管,為云服務商和超算中心提供AI算力,正對應著如火如荼的AI基礎設施建設。

AI超級計算機NVIDIA Jetson AGXOrin,簡直是自主機器人研發人員“捕獲器”。

更不要提開放式平臺 NVIDIA Omniverse,試問哪個想做元宇宙的公司能不心動呢?Meta就用英偉達DGX A100系統構建了自己的首臺AI超級計算機。

“卷王”英偉達的真面目

(Meta的AI超級計算機)

憑借這幾個“大餅”,黃仁勛也在GTC大會上自信地指出,英偉達未來有能力實現萬億美元的銷售收入,可以說是完美化解(或者說讓大眾忽略)了GPU市場波動。

英偉達的“核彈”背后,都是跟隨著GPU市場變動,不斷創造需求、刺激供給的過程。商業價值不斷飆升的同時,確實給GPU技術帶來了巨大提升。

這能說明,黃仁勛是“商業奇才”嗎?恐怕不行。

姜太公釣魚,把反彈效應玩明白了

憑借GPU在圖形計算上的貢獻,黃仁勛也被江湖人稱“AI教父”,甚至一度想要干掉摩爾定律,推動自己的“黃氏定律”主宰計算市場。

但其實從四次供需“反彈”中可以看到,英偉達不過是把摩爾定律的“反彈效應”拿捏得明明白白了。

所謂“反彈效應”(Rebound effect),也被叫做“收回效應”(take-back effect),最早是由威廉·斯坦利·杰文斯在《煤炭問題》一書中提出的,指的是提高效率的新技術,最終預期收益減少的情況。

放在IT領域,就是“What Andy gives,Bill takes away”安迪(英特爾CEO安迪·格羅夫)帶來的CPU硬件性能提升,最終會由比爾(微軟CEO比爾蓋茨)通過軟件/服務不斷擴大而收回。

“卷王”英偉達的真面目

結果就是,雖然摩爾定律會推動計算硬件不斷提效降價,但因為“反彈效應”,不斷產生新的需求/應用/場景,吃掉硬件性能提升帶來的好處。

只有這樣,用戶才會愿意掏錢更新機器,以便能享用到更新更消耗資源的服務。

回望個人電腦、智能手機的發展歷程,無不是在摩爾定律及其反彈效應下發展起來的。而英偉達所在的GPU市場,顯然沒有脫離這一范疇。

“卷王”英偉達的真面目

一方面,英偉達的產品性能提升速度,雖然超過了摩爾定律所規定的“18個月翻一倍”,實現了AI計算性能的逐年翻倍,也就是“黃氏定律 (Huang’s Law)”。但從最新一代H100 GPU的性能提升上,顯然還依賴于延續了半個多世紀的半導體制程工藝限制,采用了臺積電的4nm(而非此前業界猜測的5nm)工藝,再結合全新的架構設計,才能達到“核彈”級別。

另外,性能提升必須通過新的服務/應用“take back ”,不然用戶只需要等相同性能的GPU降價就可以了,沒有必要花大價錢去買新的。這也是為什么AI大模型訓練、自動駕駛、元宇宙、機器人……作為GTC大會的“全家桶”才會同時登場,通過各行各業的智能化來消耗掉新技術帶來的AI算力資源。

黃仁勛也曾在采訪中提到過,英偉達“甚至用了市場營銷的預算,幫開發者營銷他們用我們架構開發的產品,來創造市場需求”。

“卷王”英偉達的真面目

(云服務市場的增長規模)

所以說,英偉達的每一次“核彈”炸街,其實都是在硬件性能回收出現不順利的時候,再一次開辟出更大的需求空間,以緩解技術收益減少的局面。

“What NVIDIA gives,AI takes away”,英偉達靠這一手,把全球玩家和華爾街投資人拿捏得明明白白,市值也就次次化險為夷“穩坐釣魚臺”了。

愿者上鉤:自己卷自己有什么問題嗎?

某種角度來說,英偉達對“反彈效應”和大眾需求的拿捏,是“姜太公釣魚,愿者上鉤”。只要研究人員覺得模型訓練時間從十幾天縮短到幾個小時很值;只要游戲玩家覺得更逼真的渲染效果真香;只要Meta覺得GPU對元宇宙來說不可或缺……這不就夠了嗎?

確實,乍一看,好像通過刺激需求來避免技術收益降低,是在和大家作對,但實際上,科技企業對反彈效應的努力規避,也會帶來很多衍生好處。

一方面,新技術的反彈效應是不可避免的。

這會直接降低技術產品的成本,除非你是追逐最新顯卡的發燒友游戲玩家,否則只要愿意等待,總能以更低的價格買到更高性能的GPU,誰跟真金白銀有仇呢?

此外,為了避免新技術收益降低,科技企業不得不投入大量精力開發下一代產品,卷過了競爭對手還不行,還得自己卷自己。如今英偉達已經占據GPU的絕對優勢地位,但依然在不斷推陳出新,不然就要被罵“擠牙膏”。對于有替換需求的群體來說,總有更好的產品可以選擇。

同時,更高的性能和資源,也會孕育出很多前所未有的應用和服務,計算機剛誕生時格外昂貴,只能為美國頂尖大學研究機構所用,而且還只會下棋,現在一部千元手機就可以讓偏遠山區的農民上網直播賣水果。同樣,我們往后看五到十年,如果自動駕駛汽車的比例從現在的不到1%變成50%,人們停留在元宇宙的時間和現在玩手機一樣頻繁,那么這會催生多少新興的服務和商業公司呢?

“卷王”英偉達的真面目

黃仁勛本人曾回憶第一個GPU產品的研發過程,他說:“可能也沒有人知道自己需要什么。因為事情經常是這樣,你沒看到過一個東西,就不會知道自己是否需要。”

不過回想一下,很多曾經我們以為可有可無的功能,比如視頻通話、在線直播、高清視頻……在今天都已經成為必備功能。需求確實是可以被創造的,不過,需求也有輕重緩急,英偉達不斷甩出的“魚鉤”,對你是否有吸引力呢?

延伸 · 閱讀