中文English

科学计算
当前位置: 首页 > 解决方案 > 科学计算


GPU加速更快的AMBER模拟

在分子动力学中,AMBER是用来模拟生物催化和药物与受体蛋白相互作用的关键应用。AMBER的一个特色是有能力使用NVIDIA GPU来大规模地加速复杂的分子模拟。这大大提升了采样效率,提高了研究的准确性,使得更先进的科学变成可能,加速了研究的进程。

为AMBER定制的GPU系统

AMBER GPU发展背后的主要驱动力已经把超级计算机的强大性能转移到个人台式电脑上,并且价格实惠,而且提高了效率,为广大的研究人员受益而设计的。

这些机器为AMBER模拟提供了最佳的解决方案,预装最新的版本,准备随时运行并且提供可靠的性能。这为科学家购置最佳的工作站和集群来运行GPU AMBER(普通的CPU  AMBER模拟也可以)提供了一个解决方案。

AMBER 16 优化

 为AMBER定制的AMBER MD工作站和集群,除了使用定制的GPU验证套件来验证数值,还提供了一个优化的版本AMBER 16,是由AMBER主要开发者Ross Walker,NVIDIA合作开发的。这些优化和容天硬件以及NVIDIA Maxwell(GTX 1080, Titan X, M40 and M60)的结合为所有的AMBER PMEMD GPU模拟,显式溶剂和隐式溶剂提供了优越的性能,比其他厂商提供的按位相同的结果的系统实现要快15%到25%。

为AMBER定制的MD系统预览

1、为满足原子论的分子动力学模拟而设计

2、保证经过优化能够满足或者超过公布的性能数据

3、预装的AMBER GPU计算解决方案

4、包括样本工作提交脚本,基准测试,充分验证的测试套件和最新的软件补丁的快速实现

5、节省安装,优化,基准测试和验证的时间,以便做更多的科学研究

6、完全可定制,以满足您的预算

 

GPU加速更快的VASP模拟

在全球各地的超级计算机中占据15%的运算周期、在材料研究领域中最受欢迎的应用VASP,得益于NVIDIA GPU加速的支持,在进行标准密度泛函和杂化泛函计算性能测试时,达到创纪录的1.4-8 倍加速!

无论是量子信息处理、能源催化剂、新型药物、高分子聚合物,还是光敏器件或者是太阳能电池等一系列新材料的研究,都需要使用第一性原理来模拟材料特性。在材料研究领域中,VASP 是最受欢迎的量子化学软件,它在国内外具有广泛用户群,在全球各地的超级计算机中占据15%的运算周期。

材料科学最受欢迎!VASP:从原子级建模&模拟

VASP 全称“Vienna Ab Initio Simulation Program”,它能够对各种材料进行原子级建模,并模拟各项数据,帮助研究人员更好地掌握材料的基础结构及其特性,以开发出更坚固、更具适应性,或是专门用于特定方面的材料,如电子设备、催化剂和磁性材料,到玻璃、相较、金属、陶瓷灯等等。

一直以来,VASP只能运行于采用CPU的计算机系统,现在已遇到可扩展性瓶颈,绝对计算时间存在上限,无法利用更多的 CPU 加速。

GPU加速VASP的计算

基于赝势的密度泛函和杂化泛函是 VASP 最常用的方法,广泛用于多体薛定谔方程自洽计算和量子分子动力学。

在传统的纯CPU系统中,对于数百原子的系统,求解多体薛定谔方程,尤其采用杂化泛函计算时,总体计算时间往往达数周,即使采用多节点集群计算,由于网络带宽和延迟问题,总体计算时间也没有得到明显提升,制约了新材料研发进展。

通过与诸多大学和科研机构协作,NVIDIA 在今年年初顺利完成了 GPU 加速版VASP。通过对原有包含 FFT 和 BLAS 算法以 cuFFT 和 cuBLAS 替代,新算法能够完全适合 GPU 硬件架构,充分发挥 GPU 的计算潜力。同时,标准密度泛函和杂化泛函计算也均得到了 GPU 支持。

 

为VASP定制的系统,带来最高8倍性能提升

作为NVIDIA在中国最重要的战略合作伙伴之一,鑫昊翔科技通过分析 VASP 异构计算特点,进一步设计了可靠的集群解决方案,在 CPU 和 GPU 运行能力、内存数量、网络延时与带宽上达到最佳匹配。

该集群解决方案为每节点配置两块Tesla K40 GPU加速器,并通过EDR InfiniBand 网络缩短 GPU 间的通信延时,增加通信带宽,从硬件层面进一步压缩软件的通信时间。

最终,在进行标准密度泛函和杂化泛函计算性能测试时,达到创纪录的1.4-8 倍加速!

其中,对于 256 原子( 9K 点) GaAsBi 体系标准密度泛函计算,在最重要的绝对计算时间上,单节点两颗E5 2660 V3 CPU 共 16 核心计算耗时 7546 秒,使用 8 个 MPI 进程和两颗Tesla K40 GPU 计算耗时 1242 秒,达到6 倍加速!

可以预见,对于大型集群来说,多 GPU 系统会带来更加显著的提速。

杂化泛函计算采用 63 原子、 192 能带和 4K 点 MgO 体系, 16 个 CPU 核心自洽计算耗时 900 秒,使用 4 个 MPI 进程和两颗 Tesla K40 GPU 自洽计算耗时 640 秒。

为VASP定制的系统预览

1、为满足原子论的分子动力学模拟而设计

2、保证经过优化能够满足或者超过公布的性能数据

3、预装的VASP GPU计算解决方案

4、包括样本工作提交脚本,基准测试,充分验证的测试套件和最新的软件补丁的快速实现

5、节省安装,优化,基准测试和验证的时间,以便做更多的科学研究

6、完全可定制,以满足您的预算