成功大學工程科學系團隊憑藉 NVIDIA 技術完備人才軟硬實力,屢奪國際 AI 競賽佳績

作者 Melody Tu

台灣國立成功大學工程科學系學生在教授黃吉川與研究助理李朝琴的帶領下,自 2016 年起屢屢在國際間的電腦叢集與 AI 競賽擊敗各國菁英奪下佳績,特別是在今年剛結束的亞太區 HPC-AI 競賽囊括了第一與第二名的獎項,為國爭光。而在此之前,成大團隊亦在 2018 年德國法蘭克福 ISC 競賽中有傑出的表現,成功大學工程科學系教授黃吉川不諱言的表示:「能夠取得好成績的關鍵在於近年 AI 技術仰賴 GPU 加速,而 NVIDIA 完整的軟硬體生態使他們能夠容易調整演算法,以較競爭對手更好的準確率與更低的錯誤率取得佳績。」

GPU 加速技術引領 AI 新時代

GPU 加速與 AI 兩項技術皆非全新的概念,近年因硬體與軟體雙雙突破下,以 GPU 結合新式軟體與演算法的技術將過往難以實現的機器學習與 AI 技術化為現實,也為 HPC 領域開啟結合 AI 的新世代,而 NVIDIA 在 GPU 加速技術已多年耕耘,無論是硬體架構或是軟體環境皆已漸漸成熟,能夠打破過往以 CPU 為主要驅動力的運算瓶頸 ,以更強大的效能為多元化的 AI 應用帶來更符合經濟效益的解決方案。
2018 年正值 AI 在 HPC 領域大幅興起之際,成功大學團隊參加第一屆亞太區 HPC-AI 競賽,在競賽中接觸到由大會所提供搭載NVIDIA GPU 加速的 HPC 主機,自始便開始專注投入研究 GPU 與 AI 相關技術,舉凡從硬體層面的消費級系列產品 RTX 與 GTX GPU 與企業級應用的 Tesla V100 GPU 與 DGX 系統,到軟體層面的 CUDA、CuDNN、NCCL與 NVLink 等技術,學生透過在各項競賽間的相關應用建立穩健的根基,貫穿理論與實務,進而締造出各項優異的成果,在國際賽事間聲名大噪。
成功大學工程科學系黃吉川教授表示:「NVIDIA GPU 加速能夠在 HPC 與 AI 應用得到突破的關鍵之一在於硬體的持續精進,而軟體與演算法的容易操作更是重要的關鍵點。由於軟體環境相對完整,使用者能夠輕易針對需求彈性調整內容,大幅降低使用門檻。」

穩健基礎知識根基,發揮硬體實力

競賽團隊的培訓方針相當著重基礎知識的建立,不僅要求學生需要熟悉軟體,更要求學生具備硬體知識與系統組裝的能力,而這樣的教育模式在德國 ISC 大賽發揮關鍵作用。
相較於其他以 NVIDIA Tesla V100 為運算主力的團隊,成功大學礙於經費考量下,僅能使用消費級的 GeForce RTX 2080 Ti 構成系統,面對模型訓練與運算規模受限的情況下,憑藉著穩固的基礎在自組系統的穩定與效能取得絕佳的平衡,拿下大氣氣流辨識亞軍並以軟體最佳化的成果奪下最崇敬獎,在硬體資源相對不足的情況仍能脫穎而出。

跨領域人才培育,軟硬體整合發揮綜效

台灣現行的教育環境針對 GPU 加速最大的門檻還是能夠實際使用的機會太少,因為多數的學校還未有搭載相對應等級的超算系統,學生多半僅能使用消費級 GPU 搭配 PC 主機進行練習與訓練,雖然台灣基於 GPU 運算的 HPC-AI 發展較晚,不過台灣在硬體的實力相當堅強,一但軟體教育漸上軌道,台灣即可迅速展開軟硬體技術接軌,同時利用軟體開發的經驗回饋給硬體設計,使其相互補強。
成功大學工程科學系助理研究員暨學生競賽指導教練李朝琴表示:「新增跨科系的軟硬體相關教育課程至關重要,若高效能運算資源能在校園普及便可降低研究的門檻,進而提升學生在國際上的競爭力,奠定未來國家發展的基礎。」
此外,新一代的 AI 人才培訓需要的是跨領域的通才,這也是成大工科系的優勢,而在 AI 與 HPC 結合之後,更需要兼具基礎硬體架構與軟體開發的能力,才能展現全方位的優勢,黃吉川教授也期許由他與教練培育的學生在畢業之後能夠發揮比賽所積累的經驗,希望能將這類型的比賽推廣成像台灣的棒球一樣,在世界的舞台上贏得國際的認可。