GROMACS—應用最廣泛的 HPC 應用程式之一,新版本 GROMACS 2020 的發布讓該應用程式得到了重大升級。在 NVIDIA 與 GROMACS核心開發者的長期合作之下,此全新版本在性能表現上上取得了極大進步。
作為一個生物分子系統的模擬分解, GROMACS 利用牛頓運動學方程式來演化粒子。力決定運動:例如,兩個帶正電的離子相互排斥。計算各種力是模擬中最消耗算力的部分,因為所有粒子對都可能相互作用,而且模擬所涉及的粒子數量眾多。
在以前的 GROMACS 發行版中,這些力級別已經支持 GPU 加速( PME 力計算中使用了 CUDA 快速傅立葉變換庫( Fast Fourier Transform=FFT )。 最新增加的是 2019 系列中的 GPU 粘合力,這是 NVIDIA 與核心 GROMACS 開發人員之前的合作開發的。
然而,這其中仍然存在一個問題。在現代 GPU 上,力的計算變化如此之快,以至於在計算力方面,模擬的其他部分也變得非常重要,特別是當你希望使用多個 GPU 進行單一模擬時。
本文介紹了在 2020 版本中為解決這個問題所增加的性能特性。如今,對於許多典型的模擬,整個時間步長都可以在 GPU 上運行,從而避免了 CPU 和 PCIe 之間的傳輸瓶頸。 GPU 之間的溝通操作現在可以直接在 GPU 記憶體之間操作。
使用四個 V100 GPU 進行模擬下, GROMACS 2019 與 GROMACS 2020 的性能表現對比。