從董事會會議室到休息室,生成式 AI 在今年掀起了一場風暴,引發各行各業對該怎麼更加善用這項技術來增強創新和創造力、改善客戶服務、改變產品開發以及甚至促進溝通的討論。
根據彭博研究(Bloomberg Intelligence)的報告指出,隨著現有及新加入市場的業者重新構想產品與服務,幾乎每個產業都開始採用生成式 AI 和大型語言模型,預計到 2032 年時將創造出 1.3 兆美元的營收。
就算這項技術的發展速度之快讓人咋舌,部分企業及新創公司在採用 AI 方面依舊腳步緩慢,還是停留在實驗和單打獨鬥進行各種案子。有部分原因是 AI 帶給他們的效益會因公司、使用個案和投資程度而不一。
謹慎的方式取代了樂觀的態度。在 Forrester Research 的 2024 年 AI 現狀調查中,有三分之二的受訪者認為他們的組織在考慮 AI 計畫是成功時,所需的投資回報率低於50%。
未來的另一件重大趨勢便是代理型 AI(agentic AI),這種自主或「推理型」 AI 需要使用到多樣化的語言模型、複雜精密的檢索增強生成堆疊,還有先進的資料架構。
各產業垂直領域的 NVIDIA 專家已經分享了他們對未來一年的期望。現在來一起聽聽看在企業、研究與新創企業生態系統裡推動 AI 創新的 NVIDIA 專家們又有什麼樣的說法:
IAN BUCK
超大規模與 HPC 部門副總裁
推論推動 AI 的發展: 隨著 AI 模型的規模和複雜性不斷增加,對高效率推論解決方案的需求也將與日俱增。
生成式 AI 的興起已將推論從單純辨識查詢和回應,變成複雜的資訊生成 – 這其中包括對多個來源和大型語言模型(例如 OpenAI o1 和 Llama 450B)所提供的資料進行摘要 – 這顯著提高對運算能力的需求。新的硬體創新,再加上持續改善軟體,將會提升運算效率,而總持有成本也可望縮減五倍以上。
加速一切:GPU 的應用越來越廣泛,各行各業都希望加快從規畫到生產的一切流程。新的架構將促進這個良性循環,每一代都能提供成本效益與更大幅提高運算效能。
國家和企業競相建立 AI 工廠以加快處理更多工作負載,預料許多人都會尋求平台解決方案和參考資料中心架構或藍圖的幫助,以便在數週內就能蓋好一座資料中心並且讓它開始運作,而不用花到幾個月的時間。這將有助於他們解決一些世界上最頭痛的難題,包括量子運算和藥物探索。
量子運算 – 所有試驗,沒有錯誤:研究人員將投注心力於發展超級運算與模擬,以解決這個新興領域所面臨的最大挑戰:錯誤。量子運算領域將取得重大進展。
量子運算中的基本資訊單位量⼦位元(Qubits)極易受到雜訊影響,在執行數千次運算後就會變得不穩定。這使得今日的量子硬體無法解決有用的問題。預計在 2025 年,量子運算領域將會朝著具挑戰性又非常重要的量子糾錯技術發展。需要快速、低延遲的計算才能糾出錯誤。我們也期待看到在專用基礎設施的支援下,實際將量子硬體安裝在超級電腦中。
AI 也將在管理這些複雜的量子系統、改善糾錯和提升整體量子硬體效能上扮演重要角色。量子運算、超級運算和 AI 融合為加速量子超級電腦,將推動實現量子應用的進展,以解決各個領域的複雜問題,包括藥物發現、材料開發和物流。
BRYAN CATANZARO
應用深度學習研究部門副總裁
更深入認識 AI:AI 將變得更容易使用、對情緒有更敏銳的反應,還能發揮更大的創意,創造出更多樣化的內容。第一批用於繪圖的生成式 AI 模型難以完成繪製牙齒這一類簡單的任務。AI 的快速發展讓它有能力輸出看起來具有真實感的圖片和影像,而 AI 產生出的聲音也開始逐漸聽起來不像機器人發出的聲音。
更加完善的演算法和資料集帶動了這些進步,而企業也明白 AI 需要有臉孔和聲音,才能對全球八十億人產生影響。這也將使得 AI 從回合式互動變成流暢自然的對話。與 AI 的互動將不再像是一連串的交換,而是提供更有吸引力、更像是真人的對話體驗。
重新思考產業基礎設施與都市規畫:國家與產業將開始研究 AI 如何在經濟的各個面向落實自動化,即使在全球人口數量變少的情況下,仍能維持目前的生活水準。
這些作為或許有助於推動永續發展及解決氣候變遷的問題。比如農業將開始投資使用自主機器人,用這些機器整理田地、清除害蟲和雜草。這便能減少使用農藥和除草劑,讓地球更健康,還能釋放更多人力資源去做其他有意義的事情。我們也期待在都市規畫辦公室看到新的思維,考慮使用自動駕駛車輛和改善交通管理。
長遠來看,AI 可以幫助找到減少碳排放與儲存碳的解決方案,這是一項全球民眾所面臨的迫切挑戰。
KARI BRISKI
生成式 AI 軟體部門副總裁
代理的交響樂 – AI 協調器:企業將擁有大量的 AI 代理,這些代理是經過訓練的半自主模型,可以在內部網路上協助處理客戶服務、人力資源、資料安全等工作。而為了徹底發揮這些代理的工作效率,預計將會出現 AI 協調器,這些協調器可在眾多代理之間運作,流暢引導人類的查詢和解釋集體結果,以便推薦解決辦法給使用者,讓他們可以採取行動。
這些協調器可以更深入瞭解內容、具備多語言能力,且能流暢處理從 PDF 到影片串流等多種資料類型。在自我學習資料飛輪的支援下,AI 協調器將持續精進用於特定業務的洞察力。例如在製造業中,AI 協調器能夠分析即時資料,就生產計畫和供應商談判提出建議,以改善供應鏈。
在企業 AI 方面的這種發展將顯著提各產業的生產力和創新能力,同時變得更容易使用。知識工作者可以利用由 AI 專家組成的個人專屬團隊,提高他們的工作效率。開發人員將能使用客製化的 AI 藍圖建立這些先進的代理項目。
多步驟推理讓 AI 有更強大的洞察能力:AI 多年來擅長於回答特定問題,而無需深入研究特定查詢的脈絡背景。隨著加速運算和全新模型架構的進步,AI 模型將能夠處理日益複雜的問題,作出更精準和更深入的分析。
AI 系統使用一種稱為多步驟推理的功能,將複雜的大型問題拆成較小的任務,有時甚至執行多次模擬,從不同角度解決問題以增加「思考時間」。這些模型會動態評估每個步驟,以確保作出與脈絡有關且透明的回應。多步驟推理還包括整合各種來源的知識,讓 AI 能夠建立邏輯關聯,綜合不同領域的資訊。
這可能會影響到從金融、醫療保健到科學研究和娛樂等領域。像是具備多步驟推理能力的醫療模型,會按照病患的診斷、藥物和對其他治療的反應,提出多項建議供醫師考慮。
啟動你的 AI 查詢引擎:企業和研究機構坐擁 PB 等級的海量資料,所面臨的挑戰就是如何快速取得資料,以提出可行的寶貴看法。
AI 查詢引擎將改變企業挖掘資料的方式,公司專用的搜尋引擎將能夠篩選結構化和非結構化的資料,包括文字、圖片和影片,使用自然語言處理和機器學習技術來解釋使用者的意圖,並且提供更相關、更全面的結果。
這將使得各行各業能夠更聰明地做出各種決定、提供更美好的客戶體驗,以及提高工作生產力。AI 查詢引擎的持續學習能力將創造自我改善的資料飛輪,協助提高應用程式的執行效率。
CHARLIE BOYLE
DGX 平台部門副總裁
代理型 AI 使得企業必須具備進行高效能推論的能力:代理型 AI 的出現將推動複雜的多重模型系統做到近乎即時回應的需求。這將使得高效能推論與高效能訓練基礎設施同樣重要。IT 領導者將需要具擴充能力、專門建置且最完善的加速運算基礎設施,以因應代理型 AI 的需求,提供即時決策所需的效能。
企業擴大 AI 工廠的規模,將資料處理成智慧:企業 AI 工廠能夠將原始資料變成商業智慧。企業在明年將擴大這些工廠,以利用大量的歷史和合成資料,然後針對從消費者行為和供應鏈最佳化,再到金融市場動態以及工廠和倉庫的數位孿生等各種情況進行預測和模擬。AI 工廠將成為重要的競爭優勢,能夠協助早期採用者預測和塑造未來情境,而不單只是對它們做出反應。
冷卻因素 – 液冷式 AI 資料中心:隨著 AI 工作負載持續推動成長,這些一馬當先的組織將改為使用液冷技術,以徹底提高運作效能及能源效率。超大規模雲端服務供應商和大型企業將引領潮流,在容納數十萬個 AI 加速器、網路和軟體的嶄新 AI 資料中心裡使用液冷技術。
企業會逐漸選擇在託管設施中部署 AI 基礎設施,而不是自行建造 – 有部分原因是為了減輕大規模設計、部署和營運智慧製造的財務負擔。又或是他們會根據需要租用容量。這些部署將有助於企業利用最新的基礎設施,而無需自行安裝和操作。這種轉變會讓業界更快、更廣泛地採用液冷技術,作為 AI 資料中心的主流解決方案。
GILAD SHAINER
網路部門資深副總裁
再見網路,你好運算結構:資料中心架構開始改為採用整合式運算結構,這樣子的運算架構可以讓數千個加速器以縱向及橫向擴充通訊的方式,跨越數英里的佈線和多個資料中心設施,彼此之間高效率地傳遞資料,資料中心裡的「網路」一詞將顯得過時。
這種整合式運算結構將包含 NVIDIA NVLink,這項技術支援縱向擴充通訊,還有由智慧型交換器、SuperNIC 與 DPU 所支援的橫向擴充功能。這將有助於安全地將資料移入或移出加速器,並且執行動態即時計算,大幅減少移動資料的情況。對於大規模的 AI 資料中心部署來說,在網路上進行橫向擴充通訊是一項非常重要的功能,也是讓資料中心能在數週裡,而非要用上幾個月或幾年的時間才能啟動和運作的關鍵。
隨著代理型 AI 工作負載的成長 – 需要在多個互連的 AI 模型之間傳遞交換資料,而非單一和本地化的 AI 模型 – 運算結構將是提供即時生成式 AI 的關鍵。
分散式 AI:隨著設計乙太網路新方法的出現,讓上萬個 GPU 可以支援處理單一工作負載,所有資料中心都將加速。這將有助於普及多租戶生成式AI雲端與企業AI資料中心的AI工廠部署。
這項突破性技術也將使得 AI 快速擴展至企業平台,將 AI 雲端的建置與管理事宜化繁為簡。
電力限制加上需要蓋在更靠近可再生能源的地方,企業將把資料中心資源蓋在地理位置更分散的地方 – 相隔數百甚至數千英哩。橫向擴充通訊技術將能夠確保可靠穩定地長距離傳輸資料。
LINXI (JIM) FAN
AI 代理部門資深研究科學家
機器人將更進化為人類機器人:機器人將開始理解任意的語言指令。目前必須由人工替工業機器人編寫程式,對於無法預測的輸入或者非被編寫過的語言,機器人無法聰明地做出回應。結合了視覺、語言和任意動作的多模態機器人基礎模型,將發展出這種「AI 大腦」,而代理型 AI 同樣也將發展出這種「AI 大腦」,將擁有更強大的 AI 推理能力。
可以肯定的是,不要期望馬上就能在住家、餐廳、服務區和工廠看到智慧型機器人。不過政府正在想辦法解決高齡化社會和勞動力資源短缺的問題,這些使用案例可能比你想像的還要接近。實體自動化將會逐漸發生,十年後就會像 iPhone 一樣無所不在。
AI 代理的核心是推論:OpenAI 在九月時宣布推出一款全新的大型語言模型,經強化學習訓練後,能夠執行複雜的推理作業。被稱為 Strawberry 的 OpenAI o1 在回答問題之前會先思考:它可以在回應使用者之前,產生一條長長的內部思考鏈,糾正錯誤,且將棘手的步驟拆成簡單的步驟。
2025 年將是大量運算開始轉向在邊緣進行推論的一年。應用程式將需要數十萬個詞元來執行單一查詢,小型語言模型會在幾微秒內一次又一次進行查詢,然後才會產生出答案。
小型模型將更加節能,對於機器人而言也會越來越重要,創造出可以協助人類處理日常工作的人形機器人和機器人,且促進發展行動智慧應用項目。
BOB PETTE
企業平台部門副總裁
尋求可持續的擴充性:企業準備採用新一代半自主式 AI 代理來強化各種業務流程時,他們將著重於建立強大的基礎設施、治理及類似人類的能力,以進行有效的大規模部署。同時 AI 應用程式逐漸使用本機端的處理能力,直接在工作站(包括輕薄的筆記型電腦和小尺寸電腦)上執行更複雜的 AI 功能,且在減少使用 AI 任務的延遲時間之際又能提高執行效能。
經過驗證的參考架構可為建造適當的硬體與軟體平台提供指引,是充分提升效能與加快部署 AI 的重要因素。這些架構將成為企業在複雜的 AI 實作領域中的重要工具,協助確保他們的投資符合當前的需求與未來技術方面的進步。
利用 AI 徹底改變建築、工程與設計:預期針對建築、工程和設計產業量身打造的生成式 AI 模型的數量將會增加,這將提高工作效率及加速創新。
在建築領域,代理型 AI 將從建築工地的感應器和攝影機所收集到的大量營造資料中提取意義,提供見解,提高建案時間表和預算管理的效率。
AI 將不間斷地評估實景捕捉資料(光達、攝影測量與輻射場),針對品質、安全與是否遵求規定提出重要觀點,減少錯誤與工地發生人身傷害的機會。
對於工程師而言,以物理資訊神經網路為基礎的預測物理學將加速處理洪水預測、結構工程和計算流體力學等方面的作業,以針對建築物的個別空間或樓層量身打造氣流解決方案,加快提出新的設計。
在設計方面,檢索增強生成功能可確保在建立建築物設計與施工的資訊模型時符合當地的建築規範,在一開始設計時便符合相關規定。擴散式 AI 模型可以讓建築師和設計師結合關鍵字提示和粗略草圖,產生豐富詳盡的概念圖以展示給客戶觀看,加快概念設計和工地規畫作業。這樣就會有更多時間去進行研究和設計。
SANJA FIDLER
AI 研究部門副總裁
預測無法預測的東西:期待看到更多可以在日常生活裡學習的模型,幫助數位人類、機器人甚至是自動駕駛車理解混亂且有時無法預測的情況,在幾乎不用人為介入的情況下使用非常複雜的技能。
從研究實驗室到華爾街,我們正在進入一個類似於五到七年前樂觀看待自動駕駛技術的炒作週期。Waymo 與 Cruise 等公司花了多年時間才推出一套的可行系統,這些公司與包括特斯拉在內的其他公司所收集到的大量數據資料,可能適用於某個地區,但不適用於其他地區,所以依然無法擴充。
我們使用今年推出的模型,如今可以更快利用網路上到處都有的資料來理解自然語言,並且觀察人類和其他行動來模擬動作,而且所需的資本支出也更少。機器人、汽車和倉庫機械等邊緣應用將會快速學習協調、靈活運作和其他技能,以便穿梭在現實環境裡,還有適應現實環境及與之互動。
機器人會在你的廚房裡煮咖啡、煎蛋,然後再打掃乾淨嗎?現在還沒有。但它可能會比你所想像的更早到來。
更加真實:繪圖與模擬管道裡的生成式 AI 會加上逼真度與真實感,便能製作出超逼真的遊戲畫面、AI 生成的電影與數位人類。
與傳統繪圖技術不同的是,絕大多數的影像將來自產生出的像素,而非渲染出的結果,因此動作與外觀也會更加自然。開發和反覆調整情境行為的工具將協助創作出更複雜的遊戲,而所花的錢只是目前 3A 級遊戲的零頭而已。
各行各業採用生成式 AI:幾乎每個行業都準備好使用 AI 來提升與改善人們的生活與娛樂方式。
農業將運用 AI 來改進食物鏈,改善食物的運送。例如可以使用 AI 預測個別農場不同作物的溫室氣體排放量。這些分析可以幫助制定有助於減少供應鏈中溫室氣體的設計策略。同時教育領域的 AI 代理將製作出個人專屬的學習體驗,用一個人的母語說話,且視特定科目的教育程度提出或回答問題。
隨著下一代加速器進入市場,你也會看到提供這些生成式 AI 應用程式的運作效率大幅提升。提高這些受測模型的訓練及效率,企業和新創公司將會看到這些應用程式更快帶來更好的投資報酬。
ANDREW FENG
GPU 軟體部門副總裁
無需修改程式碼,加速資料分析解決方案就能提供重要觀點:在 2025 年,企業需要應付不斷增加的資料量,將會主要使用加速資料分析這項技術。
企業每年會產生數百 PB 的資料,而每家公司都在找方法來運用它們。許多公司為此將採用加速運算技術來分析資料。
未來的關鍵在於加速資料分析解決方案,實現「無需更改代碼」和「無需更改配置,使企業只要最小的工作量,將現有的資料分析應用程式加上加速運算技術。有著生成式 AI 驅動的分析技術將進一步擴大加速資料分析的採用,讓即使不具備傳統程式設計知識的使用者也能輕鬆創建新的資料分析應用程式。
透過簡化開發者體驗而完美整合加速運算技術,將有助於消除採用障礙,讓組織能夠利用其獨特的資料來開發新的 AI 應用程式和更豐富的商業智慧。
NADER KHALIL
開發者技術部門總監
新創公司的勞動力:要是你還沒有聽過太多關於提示工程師或 AI 個性設計師的事情,那麼在 2025 年你會聽到更多。隨著企業採用 AI 來提高生產力,預計新創公司和企業都會看到融合新技能和現有技能的新一類重要員工。
提示工程師會根據建立、測試和反覆調整聊天機器人和代理式 AI 的提示設計,設計和完善精確的文字字串,以得到最佳的 AI 訓練結果及產生預期結果。對提示工程師的需求將超越科技公司,延伸至法律、客戶支援和出版等行業。隨著 AI 代理的大量增加,企業和新創公司將越來越倚重 AI 個性設計師,讓有著獨特個性的代理變得更強大。
正如電腦的興起催生出電腦科學家、資料科學家和機器學習工程師等職位,AI 將創造出不同類型的工作,為具有強大分析能力和自然語言處理能力的人才提供更多機會。
瞭解員工效率:將 AI 融入實務工作的新創公司,在與投資人和業務夥伴交談時,會逐漸將員工平均產值(RPE)一字加入他們使用的詞彙裡。
與其抱著「不惜代價求成長」的心態,AI 對勞動力的補充將讓新創公司的老闆們能夠明白,僱用每一位新員工如何幫助公司裡的其他人創造更多產值。在新創公司的世界裡,RPE 適合討論 AI 的投資報酬率,以及在與大型企業和科技公司競爭時,如何填補職位空缺所面臨的挑戰。