智能工業革命

作者 Crowd Favorite

序言:過去六周以來,我們為NVIDIA的開發者舉辦了世界巡迴會議。GTC技術大會(GPU Technology Conference)2009年開始舉辦,目的在提倡利用GPU大量平行處理,來達到高效能運算的新方法。GTC技術大會,儼然已成為GPU深度學習的技術軍火庫創新的運算模型,足以引燃現代AI人工智慧的大爆炸。AI人工智慧正如火如荼地進展著,GPU深度學習開發者的數量,在短短兩年間躍升了25倍。大約有1,500AI相關的新創公司竄出,如此爆炸性的成長,加速了GTC技術大會在全球召開的需求。目前,我們已經在北京、台北、阿姆斯特丹、東京、首爾與墨爾本舉辦GTC大會。接下來還有華盛頓DC,下個月則會在孟買持續舉辦。我已經為四場GTC大會作開場演講,以下是我演講中的精華摘要,包括我對AI的理解與未來的看法,下一波電腦運算,將如何變革每一個產業。

電腦運算的新時代

由AI人工智慧電腦驅動的智能機器,可以學習、推論、並與人類互動,這將不再是科幻小說中的情節。現在,AI人工智慧驅動的自駕車,可以漫遊在鄉間蜿蜒的小路,在夜晚裡也不會迷失方向,AI驅動的機器人可以透過嘗試與錯誤學習駕駛的技巧。這真是一個絕無僅有的時刻,依我在電腦產業30多年的經驗,沒有什麼技術比AI更有潛力、更有趣味。AI的時代已然來臨。

我們所處在的電腦產業推動大規模的工業與社會變革,隨著運算方法進化,新公司形成,新的產品出現,我們的生活隨之改變。回想起過去幾波的運算革新,每次的革新皆以革命性的運算模型為基礎,新的架構同時擴展了運算效能與應用範圍。

1995年,PC互聯網的時代開端,是低成本微處理器(CPU)、標準化的作業系統(Windows 95)、掌握全球資訊的入口網站(Yahoo!),三者匯集而成就的輝煌。PC互聯網時代為10億的人口帶來了電腦的便利,並且實現了微軟(Microsoft)的願景,真正”讓每張書桌、每個家庭都有電腦”。十年之後,iPhone將”一個網路通訊”裝置放入了我們的口袋。加上亞馬遜(Amazon)推出的AWS雲端運算服務,行動雲端的時代因運而生。我們的日常生活多了各類App應用軟體,30億人口開始享受行動運算所帶來的方便與自由。

今天,我們正站在下個時代的開端,AI人工智慧運算的時代,正被一個全新的運算模型給點燃,那就是GPU深度學習。這個新模型,讓深度神經網絡接受訓練學習,從海量的數據資料中辨識出規律,且被認為是”不合邏輯”地有效,足以解答最複雜難解的資訊科學難題。在這個時代,軟體可以自己寫程式,機器可以學習。很快地,數以百億計的設備會擁有智能,AI人工智慧將顛覆各行各業。

GPU 深度學習大爆炸

為什麼是現在?我之前寫過的一篇文章中提到(透過 GPU 加快人工智慧運算速度:嶄新的運算模型Accelerating AI with GPUs: A New Computing Model),2012是AI的關鍵年。多倫多大學的Alex Krizhevsky創造了深度神經網絡,可以自動學習,從1百萬張範例中辨識出影像。使用兩張NVIDIA GTX 580 GPU,僅僅訓練了幾天,他打造的”AlexNet”即贏得了當年的ImageNet競賽,擊敗所有磨練了數十年的傳統辨識演算法。也是同一年,史丹佛大學的Andrew Ng與NVIDIA的研究單位,認為神經網絡模型越大,就等於擁有更大的大腦,於是合作推出運用大規模GPU運算系統,來訓練神經網絡的方法。

得到的結果震驚全世界,AI的研究學者於是轉向採用GPU進行深度學習。百度、Google、Facebook以及微軟是第一批採用這種方式來進行影像辨識的公司。到了2015年,這些公司已經獲得了”超人類”的成果,讓電腦比人類更精於分辨影像。在語音辨識方面,微軟的研究單位利用GPU進行深度學習,達到了歷史性的里程碑,獲得接近”人類水平”的對話辨識率。

在影像辨識和語音辨識領域,GPU深度學習提供了技術基礎,讓機器得以學習、感知、推論、並且解決問題。GPU以模擬人類的想像作為出發,幻化出電腦遊戲中驚奇的虛擬世界,以及夢幻的好萊塢電影。現在,NVIDIA的GPU可以運作深度學習演算法,模擬人類智能,如同電腦的大腦般,讓機器人以及自駕車能夠認知並理解這個世界。就像人類能夠將幻想與智慧作連結,電腦繪圖與人工智慧在我們的架構中合而為一。就像人類有左右腦兩個模式,GPU也有繪圖和運算兩個模式。這或許能解釋為何NVIDIA的GPU會被深度學習技術廣泛採用,而NVIDIA也迅速地被認為是”AI運算公司”。

端對端平台打造全新運算模型

作為一個全新的運算模型,GPU深度學習技術改寫軟體開發方式及運作模式。從前,軟體工程師精心刻畫程式,為演算法編碼。現在,演算法自己從真實世界大量的範例中學習,讓軟體自行編寫程式,程式就是一連串編碼的指令。深度學習打造並訓練神經網絡,將這個網絡部署在資料中心,在面對新的資料時,懂得進行推論、預測以及分類。這個網絡也可以被放置在具智能的裝置中,像是照相機、汽車、機器人等等,用以理解這個世界。有了新的經驗,新的資料被收集之後,再度進行訓練並且讓這個神經網絡變得更精良。成千上萬的裝置收集而學習得來的資訊,讓整個網絡的所有裝置都變得更聰明。神經網絡獲得的好處,除了GPU越來越快的處理速度,還有大型網絡的整體成效—也就是說,神經網絡會越來越聰明,進步的速度將比摩爾定律還要更快。

傳統的運算模型是大量的”指令處理”,新的運算模型需要的是大量的”資料處理”。為了要全面推展AI,我們打造了一個端對端的AI運算平台,這個平台架構跨越了訓練和推論。數以億計的裝置與設備將加入我們的行列。

先從模型訓練開始說起。我們最新的Pascal GPU投注了$20億的資金,數千名工程師超過3年的心血投入。這是第1個專為深度學習應用而優化的GPU。Alex Krizhevsky 論文中使用的是Kepler GPU, Pascal可以訓練比當初規模和速度都強65倍的神經網絡。1台具備8張Pascal GPU的電腦,連上NVIDIA NVLink之後,可以創造有史以來最高的互連吞吐量,訓練比250台傳統伺服器還要快的神經網絡。

很快的,每天在互聯網上出現的數百億條詢問會需要AI技術,這意味著每條詢問將需要數十億的數學運算。雲端服務的整體負載量必須很龐大,才能夠確保即時的回覆。為了讓資料中心擁有更快的推論效能,我們發布了Tesla P40及P4 GPU。P40可以加速資料中心的推論吐納量達到40倍,P4則僅需50瓦,是設計來為1U的OCP開放運算計畫(Open Compute Project)伺服器進行加速,符合典型的超大規模(hyperscale)資料中心規格。軟體是NVIDIA深度學習平台中很重要的一部分,為了訓練模型,我們使用了CUDA以及cuDNN,我們也發布了優化的推論引擎TensorRT。TensorRT融合了單層與跨層間的運作,刪減低貢獻度的部分,降低精度到FP16或INT8,藉由各種技巧改善了效能,同時不會犧牲準確度。

總有一天,成千上萬的智能裝置將運用深度學習的優勢,執行看似聰明的任務。無人機將在倉庫中自動導航,找到並撿取貨品。可攜式的醫療裝置將會運用AI人工智慧,當場診斷血液樣本。智能攝影機將學會只在我們介意的狀況發生時,才執行預警通知。我們打造了一個高效節能的AI超級電腦—Jetson TX1,供這樣的智能IoT物聯網裝置採用。Jetson TX1是個信用卡大小的模組,僅消耗10瓦電力,卻能達到1 TFLOP浮點運算、FP16精度的效能。這個模組採用的架構與我們最強的GPU是相同的,也能運行所有相同的軟體。

簡而言之,我們提供了完整配套的AI運算平台—從GPU到深度學習軟體及演算法,從訓練系統到車載AI電腦,從雲端到資料中心,到PC以及機器人,NVIDIA的AI運算平台隨處可見。

每個產業皆適用的AI運算

我們的端對端平台是確保每個產業都可以進入AI發展的第1階段,NVIDIA GPU深度學習的全球生態體系已經迅速地擴大。突破性的成果,引發各界競相採用AI進行消費者網路服務—搜尋、辨識、推薦、翻譯以及其他更多應用。雲端服務的供應商,如阿里巴巴、亞馬遜、IBM和微軟等,使NVIDIA GPU深度學習平台為大大小小的公司所用。世界上最大的企業級科技公司,皆已配置了採用NVIDIA GPU的伺服器。我們很榮幸,能夠在各個GTC巡迴站中針對重要產業發布策略,簡述如下:

AI 交通運輸:交通運輸是一個商機兆億的龐大產業,AI人工智慧有機會改變它。自動駕駛車輛能夠減少意外發生,改善貨運及客運的服務生產力,帶來新的移動服務。我們也發布了消息,包括百度TomTom都選擇了NVIDIA DRIVE PX2來開發自駕車。我們將個別與兩間公司建立開放式”雲端到車輛(cloud-to-car)”的平台,其中包括HD高寫真地圖、AI演算法以及AI超級電腦。

駕駛行為是我們學習而來的第二本能,但卻是一個無法利用編程方式要求電腦來執行的行為。自動化駕駛需要全面化的AI人工智慧—對周遭環境的認知,確認所處狀況而下的推理判斷,計畫最佳的路線,不間斷的學習,以改善對廣大而複雜世界的理解。公路上的自動化巡航,自動駕駛到達目的地,完全自動化的無人駕駛接駁車等等,如此複雜的自動化駕駛,需要開放式、可以擴充的架構。

NVIDIA DRIVE PX 2 是一個可擴充的架構,性能涵括整個自動駕駛技術所需要的AI人工智慧。在GTC技術大會上,我們發布了DRIVE PX 2 AutoCruise,此技術專為y高速公路自動駕駛而設計,能夠持續地進行定位及製圖的工作。我們也推出了DriveWorks Alpha 1,這是我們自製的OS作業系統,支援自駕車,全方位提供自動駕駛的各項功能,包括偵測、定位、規劃路線及動作反應等。

我們將以上所有的功能都整合於NVIDIA推出的自駕車—NVIDIA BB8中,示範影片請見:

NVIDIA專注於創新,在視覺處理技術,AI與高性能運算整合的的十字路口-智能化與自動化機器罕見的整合之際,我們仍堅守崗位。這是第一次,我們能夠用AI演算法實現自駕車與自動化機器人的想像。因為這些技術,需要即時的、符合成本的、同時有效的運算平台。

GTC技術大會上,我們也介紹了Xavier,這是我們有史以來推出過最雄心勃勃的電腦單晶片,也是世界上首款AI超級電腦晶片。Xavier 7由70億個電晶體所組成,比現在最先進的伺服器等級CPU還要複雜。不可思議的是,Xavier擁有等同於今年稍早在CES上發佈的DRIVE PX2的馬力—以僅只20瓦的電力,達到每秒20萬億次的深度學習操作。

Forbes 雜誌也寫到,NVIDIA推出Xavier,在自駕車領域上加碼開發

AI 企業應用:IBM看好認知運算技術2萬億的商機,推出全新POWER8搭配NVDIA Tesla P100伺服器,將AI人工智慧帶向企業應用。在軟體方面,SAP也發出聲明,已經取得兩台NVIDIA DGX-1超級電腦進行研發,正積極打造機器學習的企業方案,為SAP超過190個國家,約320,000家客戶服務。

AI 城市應用:在2020年時,全世界大約會有10億台監視攝影機。海康威視若無(Hikvision)是監控系統世界級的領導廠商,正在使用AI技術,試圖讓我們的城市更加安全。該公司採用DGX-1來訓練神經網絡,打造開創性的伺服器,命名為”Blade”。Blade使用16張Jetson TX1處理器,但相較於同級的21顆CPU伺服器系統,只需要大約1/20的空間,1/10的電力。

AI 工廠應用:全世界約有20億台工業用機器人,而日本是機器人研發創新的重鎮。GTC大會中, 我們也宣布日本的工業機器人巨頭FANUC,將從頭到尾採用NVIDIA AI平台,打造未來工廠。FANUC的深度神經網絡將使用NVIDIA GPU來進行訓練,內建GPU的FANUC Fog系統,可驅動一整群的機器人,讓他們相互學習,而每台機器人也內建了GPU,可執行即時AI的指令動作。麻省理工科技評論(MIT Tech Review)也報導了這個故事,請見” Japanese Robotics Giant Gives Its Arms Some Brains”。

未來行業的下一步: GPU深度學習引發了新一波的新創公司,全世界約有超過1,500間新公司竄出,專注於健康照護、金融科技、汽車行業、消費者網路應用等等領域。Drive.ai最近剛獲得執照,將在美國加州的公路上測試車輛。該公司應用深度學習技術,試圖解決自動駕駛所面臨的各種挑戰。日本的Preferred Networks,利用Chainer框架開發IoT物聯網的深度學習解決方案。Benevolent.ai位於倫敦,是首波獲得DGX-1進行開發的公司之一,採用深度學習技術進行藥品研究,試圖解決帕金森氏症、阿茲海默症以及罕見癌症等疾病。根據CB Insights調研,AI新創公司所募得的資金在今年第二季再創新高,已超過10億美元。

新創公司的爆炸性成長,也是AI人工智慧風靡各行各業的另一指標。Fortune財富雜誌最近報導,認為深度學習將”轉變美國公司”。

每個人都需要AI

AI可以解決幾年前我們完全無法處理的難題。利用真實世界的數據資料,電腦現在可以學會辨識以往認為太複雜、太龐大或是太細膩的影像,這些資料靠過去的人工軟體或肉眼也無法分析。有了GPU深度學習,電腦模型已經可以實際運用,並且能夠解決世界上最龐大的產業中的各種難題。譬如,自動駕駛車輛可能會改變擁有10萬億產值的交通運輸產業。健康照護產業中,醫生運用AI技術,初期便偵測出疾病,甚至用來研究人類基因組,試圖治療癌症,還能夠從海量的醫療數據中分析研究,提出最好的推薦療法。AI人工智慧科技,將引領第4波的工業革命。繼蒸汽機、大量生產、及自動化設備之後,智能機器人將會帶領新一波的生產力提升,使大量的消費客製化服務成為可能。AI科技將會影響所有人類,AI的時代已然來臨。