設計師利用生成式人工智慧作為晶片輔助

今天發布的一篇研究論文描述了生成式人工智慧如何幫助最複雜的工程工作之一：設計半導體。

這項工作展示了在高度專業化領域的公司如何利用內部資料訓練大型語言模型 (LLMs)，以建立提高生產力的助手。

半導體設計是一項極具挑戰性的工作。在顯微鏡下，像 NVIDIA H100 Tensor Core GPU（上圖）這樣最先進的晶片看起來就像一座精心規劃的大都市，由數百億個電晶體構建而成，連接在比人類頭髮細10,000 倍的街道上。

多個工程團隊花費長達兩年的時間進行協作，以建造其中一個這樣的數位化巨型城市。

有些小組定義晶片的整體架構，有些小組製作並放置各種超小型電路，有些小組測試他們的工作。每項工作都需要專門的方法、軟體程式和電腦語言。

對於大型語言模型的廣泛願景

NVIDIA 研究總監暨該論文主要作者 Mark Ren 表示：「我相信隨著時間的推移，大型語言模型將全面幫助所有流程。」

NVIDIA 首席科學家 Bill Dally 今天在國際電腦輔助設計會議（International Conference on Computer-Aided Design）上的主題演講中宣布了這篇論文。「這項努力代表著將大型語言模型應用於複雜的半導體設計工作中邁出了重要的第一步」，Dally 在舊金山舉行的活動中表示：「它展示了即使是高度專業化的領域，也可以利用其內部資料來訓練有用的生成人工智慧模型。」

ChipNeMo 浮出水面

這篇論文詳細介紹了 NVIDIA 工程師們如何為內部使用創建了一個名為 ChipNeMo 的客製化大型語言模型，該模型是使用公司內部資料進行訓練，以生成和優化軟體，並協助人類設計師。

長期以來，工程師們希望將生成式人工智慧應用於晶片設計的每個階段，這有可能顯著提高總體生產力，在EDA領域已經有超過20年經驗的Ren表示。

在對NVIDIA工程師進行可能的用例調查後，研究團隊選擇了三個項目：一個聊天機器人、一個程式碼生成器和一個分析工具。

初始用例

後者（分析工具），用於自動化耗時的任務，即維護已知錯誤的最新描述，目前為止受到了最多的好評。

一個回答有關 GPU 架構和設計問題的原型聊天機器人，可幫助許多工程師在早期測試中快速找到技術文件。

Animation of a generative AI code generator using an LLM — 程式碼產生器將幫助設計人員為晶片設計編寫軟體。

正在開發的程式碼產生器（如上方演示）已經透過晶片設計人員使用的兩種專用語言，創建大約 10-20 行軟體的片段。它將與現有工具整合，因此工程師們將有一個方便快捷的輔助工具用於進行中的設計。

使用 NVIDIA NeMo 自訂人工智慧模型

該論文主要專注於團隊收集設計資料並使用其創建專門的生成式人工智慧模型的工作，這是一個可複製到任何產業的流程。

作為起點，團隊選擇一個基礎模型並用 NVIDIA NeMo 來客製化這個模型，NVIDIA NeMo 是一個用於建置、自訂和部署生成式人工智慧模型的框架，它包含在 NVIDIA AI Enterprise 軟體平台中。所選的 NeMo 模型擁有 430 億個參數，這是衡量其理解模式能力的指標。它使用超過一兆個權杖（token）進行了訓練，這些權杖代表文本和軟體中的單詞和符號。