NVIDIA (輝達) 今天宣布推出兩項全新大型語言模型 (Large Language Model;LLM) 雲端人工智慧 (AI) 服務,分別為 NVIDIA NeMo LLM 服務與 NVIDIA BioNeMo LLM 服務,讓開發人員能夠輕鬆地調整 LLM,並部署用於內容生成、文字摘要、聊天機器人、程式碼開發,以及預測蛋白質結構和生物分子屬性等客製化的 AI 應用程式。
NeMo LLM 服務讓開發人員能夠在 NVIDIA 管理的基礎設施上,使用被稱為快速學習 (Prompt Learning) 的訓練方法,迅速自訂調整一些預先訓練好的基礎模型。NVIDIA BioNeMo 服務是一個雲端應用程式介面 (API),它將 LLM 的使用範圍擴大到語言之外的科學應用範疇中,以協助製藥和生技公司更快開發新藥物。
NVIDIA 創辦人暨執行長黃仁勳表示:「LLM 具有改變各行各業的潛力。調整基礎模型的能力將讓數百萬名開發人員能夠獲得 LLM 強大的力量,無需從頭開始建立龐大模型,就能開發語言服務並推動科學發現。」
NeMo LLM 服務透過快速學習提高準確率並加速部署作業
開發人員使用 NeMo LLM 服務,便能使用自己的訓練資料自行調整基礎模型,模型大小從 30 億個參數到 Megatron 530B (這是世界上最大的 LLM 之一)。跟過去從頭開始訓練一個模型所需的數週或數個月相比,使用 NeMo LLM 服務只需幾分鐘到幾小時即可完成。
開發人員使用快速學習來自行調整模型,而快速學習採用一種名為 p-tuning 的技術。開發人員只需使用幾百個範例,就能快速地自行調整基礎模型,而過去則要使用數十億個資料點來進行調整。在客製化的過程中會產生特定任務的提示權杖 (token),然後將權杖結合基礎模型,為特定使用範例提供更高的準確性與更相關的回應內容。
開發人員可以使用同一個模型對多個使用範例進行客製化調整,並產生出多個不同的提示權杖。Playground 功能提供了一個無需編寫程式的選項,可以輕鬆地對模型進行實驗及互動操作,進一步提高將 LLM 用於特定產業使用範例的有效性和可取得性。
準備好部署後,調整好的模型便能在雲端執行個體、企業內部系統或透過 API 運行。
BioNeMo LLM 服務讓研究人員能夠利用大型模型的優勢
BioNeMo LLM 服務包含兩個用於化學和生物學應用的全新 BioNeMo 語言模型,可用於支援處理蛋白質、DNA 和化學資料,幫助研究人員發現生物序列中的模式並取得寶貴洞察。
BioNeMo 讓研究人員能夠透過內含數十億個參數的模型來擴大其研究工作範圍。這些更大的模型可以儲存更多關於蛋白質結構、基因間進化關係的資訊,甚至可以生成用於治療的新型生物分子。
雲端 API 讓研究人員能夠使用 Megatron 530B 及其他現成模型
除了調整基礎模型外,LLM 服務還能讓研究人員透過雲端 API 來使用現成和客製化的模型。
如此一來開發人員便能接觸到眾多預先完成訓練的 LLM,包括 Megatron 530B,還能接觸到透過 NVIDIA NeMo Megatron 框架所建立的 T5 和 GPT-3 模型 (該框架現已進入公開測試階段),以支援廣泛的應用程式和多語言服務需求。
汽車、電腦運算、教育、醫療、電信等產業的領導業者正使用 NeMo Megatron,為客戶提供中文、英文、韓文、瑞典文及其他語言的服務。
供應時程
NeMo LLM、BioNeMo 服務及雲端 API 預計將於下個月開放搶先試用。開發人員現在可以申請加入,以瞭解更多細節。
NeMo Megatron 框架測試版可透過 NVIDIA NGC™ 取得 ,其經過最佳化調整可在 NVIDIA DGX™ Foundry 和 NVIDIA DGX SuperPOD™,以及 Amazon Web Services (AWS)、Microsoft Azure 與 Oracle Cloud Infrastructure 的加速雲端執行個體上運行。
開發人員可以在 NVIDIA LaunchPad 實驗室中,免費體驗 NeMo Megatron 框架。
敬請觀看創辦人暨執行長黃仁勳在 GTC 的主題演講,深入了解在 NVIDIA AI 技術支援下的大型語言模型。
掌握 NVIDIA 最新動態
請訂閱 NVIDIA 官方部落格或追蹤 Facebook、Twitter、LinkedIn 與 Instagram。瀏覽 NVIDIA 相關影片及圖片,請至 YouTube 或 Flickr。
關於 NVIDIA (輝達)
NVIDIA (輝達) 自 1999 年發明 GPU 起便成功促進 PC 電競市場的成長,並重新定義現代電腦繪圖、高效能運算與人工智慧。NVIDIA 在加速運算和人工智慧領域的開創性成就,正重塑多個市場規模高達數兆美元的產業,如交通運輸、健康醫療和製造業,亦同時促進許多其他產業的成長。欲瞭解更多資訊,請瀏覽 https://blogs.nvidia.com.tw。
新聞聯絡人
NVIDIA 資深公關經理 王懷璐 電話:(02)6605-5700 E-mail: Kate Wang |
世紀奧美公關顧問 蔡宜真/詹淑君 電話:(02) 7745-1688 分機 135/133 傳真:(02) 7743-9199 行動電話: 0970-504-933/0975-251-507 E-mail: Salin Tsai/Shirley Chan |
本新聞稿可能包含 NVIDIA 根據目前預期所做出的前瞻性聲明:我們的產品與技術的優點、影響、功能和供應時程,包括 NeMo LLM 服務與 BioNeMo LLM 服務;大型語言模型改變各行各業的潛力;調整基礎模型的能力所帶來的影響;更大的模型可以儲存更多關於蛋白質結構、基因間進化關係的資訊,以及生成用於治療的新型生物分子。多項重要因素可能導致實際結果與前瞻性聲明所示之結果出現重大差異,所及範圍有全球經濟情況;我們的產品借重第三方協力廠商之製造、組合、封裝和測試之部分;技術發展和市場競爭之影響;新產品或技術之發展或我們現有產品與技術之提升;市場接受我們的產品或合作夥伴產品的程度;設計、製造或軟體的缺失;消費者偏好或需求之改變;業界標準和介面之改變;整合到系統後無法預期的產品或效能降低之技術缺失;以及我們定期提交給美國證券交易委員會 (SEC) 以 Form 10-Q 報告附本為基礎的 Form 10-K 財務季度等其他詳細因素。NVIDIA 在公司官方網站上免費提供定期提交給 SEC 的報告之副本。這些前瞻性聲明不保證未來的效能,只陳述目前的狀態,除非法律規定,否則 NVIDIA 沒有意願或義務更新或修改任何前瞻性聲明。
©本文為 NVIDIA 公司 2022 版權所有,並保留所有權利。NVIDIA、NVIDIA 標誌、NVIDIA NGC、NVIDIA DGX 及 NVIDIA DGX SuperPOD 皆為 NVIDIA Corporation 在美國和其他國家/地區的商標和/或註冊商標。其他公司和產品名稱可能為與之相關的各自公司之商標。功能、價格、供貨情況和規格如有變更,恕不另行通知。