利用GPU加速Abaqus求解结构问题

来源: | 作者:thinks | 发布时间 :2024-11-26 | 2536 次浏览: | 🔊 点击朗读正文 ❚❚ ▶ | 分享到:

SIMULIA 最新发布的 Abaqus 6.11 中加入了 GPU 加速 Abaqus/Standard 求解模块的功能，从而使用户在面临规模日益增长的计算模型时，Abaqus 能够在并行计算的基础上，发挥 GPU 浮点计算的特长，进一步提高问题的求解效率。本文在上海超级计算中心“魔方”平台上通过 Abaqus 6.11 求解典型结构力学问题，针对 Abaqus/Standard 求解模块的 GPU 加速性能进行了测试分析。

结果表明，在 CPU 并行规模小于 16 的情况下开启 GPU 加速后，多种类型结构问题的求解效率均有不同程度的提高，并且结构静力学与非滑移接触问题的加速效果最为明显，个别单元类型问题 GPU加速无法得以体现。随着 CPU与 GPU异构协同处理技术的不断发展，GPU 加速在 Abaqus软件中必将发挥越来越重要的作用。

一、Abaqus 与 GPU 通用计算简介

Abaqus是DS SIMULIA旗下一套功能强大的工程模拟有限元分析软件，可以分析复杂的固体力学结构力学系统，特别是能够驾驭非常庞大复杂的问题和模拟高度非线性问题，在大量的高科技产品研究中发挥着巨大的作用。Abaqus中包含Abaqus/Standard 和Abaqus/Explicit两个主求解器模块，Abaqus/Standard提供并行稀疏矩阵求解器，对各种大规模计算问题都能十分可靠地快速求解。在解决实际问题时，计算规模往往非常庞大，除了强大的并行功能外，Abaqus/Standard还包含许多新颖的求解技巧来提高求解速度。Dassault Systèmes于 2011 年 5 月发布了最新版本Abaqus 6.11，在最新版本中增加了GPU加速求解功能，能够利用英伟达。

目前，通用科学与工程计算正由CPU中央处理向CPU与GPU协同处理的方向发展。在Abaqus/Standard 6.11 中，CPU负责控制作业的启动和终止，GPU负责求解繁重的计算任务，并将结果通过PCIE×16 接口返回给CPU。根据官方数据的Quadro或Tesla系列GPU，实现由GPU加速的CAE计算。

二、测试工况

本文选取结构静力学、材料非线性以及状态非线性（接触）三类典型结构问题，其中静力学

问题采用两种不同单元类型，设计四个测试工况，工况设置如表 1 所示。

表 1 测试工况表

典型的计算模型示意图如图 1 所示。

图 1 测试模型（Case a）

在静力学问题求解过程中增量步与迭代步数目均为 1，非线性问题求解时的最大增量步长为0.2，在 20 个增量步之内完成。对每个模型首先在不同的并行规模下进行求解（CPU核心数分别为 2、4、8、16），记录下CPU求解所需时间TCPU，然后在Abaqus/Standard求解器中开启GPU加速选项，再针对同一问题进行求解，记录下带有GPU加速下的计算耗时TCPU+GPU，并进行统计处理。

三、软硬件测试环境

Abaqus/Standard求解器模块的GPU加速性能测试在上海超级计算中心“魔方”超级计算机上完成。“魔方”（曙光 5000A）共包含 1450 个刀片节点、82 个胖节点、32 个普通接入节点以及8 个图形接入节点，内存总容量 95TB，磁盘总容量 500TB，采用Infiniband互联方式。本次测试工作在GPU胖节点上进行。节点主要硬件配置如表 2 所示。

表 2 魔方 GPU 节点配置

四、测试结果分析

4.1、CPU 并行规模对 GPU 加速性能的影响

不同并行规模下Abaqus/Standard计算耗时典型测试结果如图 2 所示。通过对比可以发现，在Case a中，GPU加速功能的开启能够明显提高求解效率，并且CPU并行规模越小，GPU加速的效果越理想，如在双核计算时，GPU加速能够将求解速度提高到 2.5 倍以上，加速效果相当可观，而当CPU并行规模增加至 16 核后，GPU参与求解与否对计算耗时的作用几乎可以忽略。出现这一现象的原因可能在于，随着并行规模的提高，单个CPU核心被分配的计算量迅速减少，从而令TCPU处于较低的水平，此时开启GPU加速功能后， CPU与GPU的计算量的分配工作本身亦需要消耗一定的资源，因此GPU的加速性能并不能得到很好的体现。类似的变化规律同样符合Case c，并且在相同的并行规模下，GPU加速效果在Case c中的作用相对而言有限得多，即使在最小的双核并行规模下，开启GPU加速也仅仅将计算耗时降低了 24%。

图 2 典型工况计算耗时对比

Case a Case c

图 2 典型工况计算耗时对比

4.2、结构问题类型对 GPU 加速性能的影响

图 3 为在并行规模为双核、4 核、8 核以及 16 核时，四组工况的GPU加速性能对比，图中以CPU计算耗时TCPU为基准，对GPU加速后的计算耗时TCPU+GPU进行归一化处理，所占百分比在图中以数字标识。

图 3 不同结构问题的 GPU 加速效果

CPU×8 CPU×16

图 3 不同结构问题的 GPU 加速效果

从图 3 中可以看出，除Case b外，其余三组工况中，无论是结构静力学问题（Case a），还是材料非线性问题（Case c），或者是状态非线性问题（Case d），GPU对Abaqus/Standard求解器模块均有不同程度的加速作用，问题的求解时间均有不同程度的下降。其中，结构静力学问题与接触问题中的GPU加速性能体现得最为明显，如Case d在 8 核并行规模下开启GPU加速能够减少计算耗时 30%以上。GPU对材料非线性问题的加速性能一般，求解时间至少为TCPU值得注意的是，在Case b中，无论CPU并行规模大小，T的 75%以上。

CPU+GPU全部高于TCPU，这就意味着，在Abaqus/Standard求解器中开启GPU加速选项，结果却使得最终求解时间不减反增。需要指出的是，Case b与Case a同属于结构静力学问题，计算量也相当，两者的差别主要在于单元类型不同，Case a为实体单元，而Case b则为轴对称平面单元，其结果却是GPU加速性能相差很大，由此推测，GPU对采用个别单元类型的结构静力学问题的加速作用并不能很好地得以体现，甚至将引起计算时间变长，但需要进一步的测试工作来验证。

五、结论

本文介绍了 Abaqus 6.11 中新增的 GPU 加速功能，利用上海超级计算中心“魔方”超级计算机的 GPU 节点平台，通过典型结构问题的求解，分析结果表明：

（1）开启 Abaqus/Standard 6.11 中 GPU 加速功能，典型的一般静力学、材料非线性、接触类型问题的求解效率均有不同程度的提高，测试中最高能减少相同并行规模下的 CPU 求解时间的 68%，加速性能相当可观；

（2）随着 CPU 并行规模的增加，GPU 加速效应逐渐减弱；

（3）GPU 加速对结构静力学问题与接触问题效果最为明显，对材料非线性问题的加速性能一般，对个别单元类型问题 GPU 的加速性能有可能无法得以体现。

作为第一个支持 GPU 加速的版本，GPU 对 Abaqus/Standard 求解器模块的加速效果是有目共睹的。根据 SIMULIA 规划，在 Abaqus 未来版本中，更多模块的计算会迁移到 GPU 上运行，并进一步提供多 GPU 加速的支持，GPU 加速在 Abaqus 中将起到举足轻重的作用。

资料来源：达索官方

上一篇：基于ABAQUS重启动的柔性接头仿真分析

下一篇：基于ABAQUS的手持式电动工具跌落仿真

主营产品

了解更多>>