文/黃清晏
輝達NVDA(NVIDIA)公司目標就是努力「創造技術、創造市場」,30年後的今天,輝達在做的事情還是「創造技術、創造市場」不忘初心始終如一!「公司距離倒閉只有30天」是輝達(NVIDIA)共同創辦人黃仁勳的名言-輝達的「戒慎恐懼」成為公司成長的助力。
人工智能和資料科學:
世界只有兩個學科「語言和數學」。未來只有一個去處,就是「人工智能(AI)」。
人工智能正在推動所有產業的變革。從生成式人工智能(Generative AI)和自然語言處理NLP(Neuro-Linguistic Programming)、電腦視覺(Computer vision)、語音識別(Speech Recognition)、到醫學影像 (Medical Image)-通用醫療AI(GMAI)和供應鏈管理(SCM)改良,人工智能(AI)技術為企業提供所需的運算能力、工具和演算法,讓公司團隊得以追求更遠大目標。
生成式 AI 加快了人工智能領域進入商業領域的速度,根據管顧公司麥肯錫(McKinsey & Company)預估,隨著生成式 AI 在各領域應用愈趨成熟,創造更高的生產力和經濟效益,預估可為全球經濟貢獻 2.6 兆~4.4 兆美元。與此同時,傳統的工作技能也將被重新定義。麥肯錫評估,生成式 AI 能夠持續透過大型語言模型學習、模擬對話的形式,高度近似白領階級活動的一環,可能對於知識工作者產生最大影響,包括「教育、法律、藝術」⋯等領域的專業人士。
高盛(Goldman Sachs)在 3 月發布的研究報告也表示,歐美有近 2/3 的工作會受到 AI 自動化的影響,推測全球將有 3 億個職位被 AI 取代,其中「律師和行政」⋯等工作被取代的風險最大。
輝達共同創辦人暨執行長黃仁勳(Jensen Jen-Hsun Huang)說:「輝達將不只是晶片公司,而是個「AI平台企業」;「輝達要當AI領域的台積電(TSMC)」。
這樣也代表著輝達不只是晶片供應商,反倒會更像平台供應商,幫助其他公司更加輕鬆的建立自己想要的AI模式。
隨著人工智能(AI)風潮席捲全球,輝達(NVIDIA)公司的股價也隨之飆漲,本周更是一舉超越「沙烏地阿美石油公司」(Saudi Aramco)、成為全球市值第3大的公司,僅次於蘋果(Apple)和微軟(Microsoft)。華爾街(Wall Street)對「人工智能」(AI)重塑科技產業潛力始終抱持著樂觀態度,輝達目前不斷升高的表現也印證這一論點,主因為該公司在全球GPU「圓形晶片」(Graphics Chip)市場佔據主導地位。
GTC (Graphics Technology Conference) 是 NVIDIA 主辦的一個年度盛會,主要展示 AI 和圖形技術的最新發展和應用,吸引許多科技界的專家、學者、開發者和媒體參與,並且是 NVIDIA 發表其新產品和計畫的重要平台。
美西時間3月18日-21日,輝達執行長黃仁勳,在年度最重要的GTC 2024舞台上,秀出一顆更大、更高算力的圖形處理器 GPU (Graphics Processing Unit)架構BlackWell B200,輝達(NVIDIA)「地表最強AI晶片」(Blackwell架構B200)新品功耗激增,被動元件電感用量飆增二至三倍,單價更比一般產品高五至八倍。
分析師估計輝達 H100 硬體成本約 3,100 美元,B200 大幅提高到 6,000 美元。如果輝達真以 3 萬至 4 萬美元出售 B200,毛利率將高達 80%~85%。
輝達 GTC 2024 發表新 AI 晶片 B200,採台積電 N4P (N4P可提供高效能運算(HPC)與行動裝置應用一個更強化且先進的技術平台),電晶體量達 2,080 億個,是 H100 兩倍多;192 GB HBM3E 記憶體,遠高於僅 80GB HBM (High Bandwidth Memory)的 H100 晶片。AI 運算性能於 FP8 及新 FP6 都達 20petaFLOPS,是前代 (Hopper 構架的 H100 )運算性能 8 petaFLOPS 的 2.5 倍。新 FP4 格式更達 40petaFLOPS,支援全新FP4/FP6格式,27兆個參數模型,是前一代 Hopper 架構 GPU 運算性能 8petaFLOPS 五倍,為全球算力最強大 AI 晶片。
(註)
peta(千兆)
FLOPS:注意全大寫,是(floating point operations per second)的縮寫,意指(每秒浮點運算次數),理解為計算速度。是一個衡量硬件性能的指標。
FLOPs:注意s小寫,是(floating point operations)的縮寫(s表複數),意指(浮點運算數),理解為計算量。可以用來衡量算法/模型的複雜度。
輝達新增了許多軟體選項。
其中最新的是推理微服務(Nvidia Inference Micorservices,簡稱「NIM微服務」),用來簡化生成式AI模型的佈署流程。
「NIM微服務是預先訓練好的模型(例如:電腦視覺、語音辨識、機器人技術),這些模型被包裝在一起並優化,以在輝達為企業客戶安裝的基礎(installed base)上跨平台運作,輝達計劃佈署數百種不同的模型,預期這會推動公司軟體業務的強勁成長。」
再掀「黃仁勳供應鏈」和資本市場對AI的狂潮。
黃仁勳表示:「未來全球在建置數據中心上,每年將花費2500億美元,而輝達憑藉旗下的晶片和軟體,有信心拿下龐大份額。」
輝達正為不同產業打造軟體,降低採用和利用人工智能門檻。輝達也提供AI模型和其他軟體,並根據客戶使用的算力收費。
黃仁勳說:「我預期這將成為非常龐大的業務」。
但就「數據中心」這一塊,長遠來說,輝達列出的主要競爭對手還是科技巨頭: 包括華為(HUAWEI)、英特爾(Intel)、超微(AMD)、博通(Broadcom)和高通(Qualcomm),以及亞馬遜(Amazon)和微軟(Microsoft)⋯等數家大型雲端運算公司。,當然科技巨頭會希望建立自己的解決方案,而不是靠像輝達這樣的外部供應商。
黃仁勳喊出:「全球每年會砸2500億美元建置數據中心」, 美研究公司(Futurum Group)執行長紐曼(Daniel Newman)說:「但市場想等著看這個市場究竟有多大?」。
除了狂買AI晶片的大客戶,許多晶片製造商與新創公司也想分一杯羹,畢竟輝達的豐厚獲利與AI晶片市場的快速成長太讓人眼紅。
想在AI晶片領域擊敗NVIDIA,為何是不可能的任務?《經濟學人》指出:「光是設計研發出更好的硬體還不夠,因為他們手中同時擁有「最好的晶片、網路技術與軟體」,想在AI晶片市場取代輝達,需要在這三個領域同時擊敗它。」
隨著AI模型的不斷發展,「數據中心」需要同時運用數千個GPU提高處理能力。輝達透過基於Mellanox(邁倫科技、2020年4月以70億美元正式完成收購)的高效網路連接這些GPU、並且優化其晶片網路的性能,讓競爭對手根本找不到超車機會;輝達的另一個優勢則是CUDA(Compute Unified Device Architecture、即「統一計算架構」),這套輝達研發的平行運算平台與編程模型,讓客戶得以利用GPU的性能大幅提升深度學習的運算效能。
輝達今年9月計劃將以400億美元收購英國晶片設計巨頭安謀(ARM)。安謀的專長是設計智慧型手機晶片,而輝達想做的是藉用安謀的設計能力來為資料中心與人工智能用途設計中央處理器(CPU),恰好與輝達目前製作圖形處理器(GPU)的專長相輔相成。
安謀(ARM)與輝達(NVDA)的觸角遍及全球,因此美國、英國、中國、歐盟全部都要核准,併購案才能通過。由於兩家企業在各自的領域都具備堅實的市場力量,因此能不能順利獲得各方監理單位同意還很難說,但兩強聯手一旦成真,輝達在「加速運算領域」將取得幾乎無懈可擊的領導地位。
即使併購案最終遭反壟斷單位阻斷,輝達前景仍然樂觀亮眼。