应将多少个集群节点用于模拟?
可通过所使用的集群节点数来缩放模拟大小,这十分重要。 最佳缩放根据计算时间与在集群节点之间交换数据所用时间之比确定。
如果模拟在太多集群节点之间分布,则执行必需数据交换所用的时间会占计算每个模拟迭代所用总时间的大部分。 因此,使用更多集群节点并不能获得任何益处。
在集群节点之间交换数据所用的时间取决于模拟的大小、使用的集群节点数以及网络硬件交换数据的速度。
CFD 计算需要连续通过每个核心抽出大量数据。 由于针对数据执行的典型计算相对简单,因此对整体性能的主要限制来自访问数据的能力。 多个核心必须共享内存带宽,这可能无法满足数据流要求。
因此,最佳计算进程数取决于所使用的节点和互连的规格。 建议在使用 100/10BaseT 以太网网卡时,每个进程的最小网格单元数是 100,000,而在更高性能的网络硬件上,可以减小此限值。