Mukesh Kumar und Christopher J. Duffy
Untersuchung der Rolle der Domänenpartitionierung für die Effizienz paralleler verteilter hydrologischer Modellsimulationen
Räumlich verteilte hydrologische Modelle von Wassereinzugsgebieten und Flussbecken sind aufgrund der kombinierten Natur von Hydrodynamik , komplexen Einflüssen und heterogenen Parameterfeldern daten- und rechenintensiv. Die Anwendung dieser Modelle mit feiner zeitlicher und räumlicher Auflösung und auf großen Problembereichen wird durch parallele Berechnungen auf Mehrprozessorclustern erleichtert. Insbesondere wird die Rechenleistung paralleler Simulationen entscheidend von der Effizienz bestimmt, mit der Daten in einer Mehrprozessorumgebung aufgeteilt und verteilt werden und wie die Informationen zwischen den Prozessoren geteilt werden. Obwohl es zahlreiche Algorithmen zur Datenpartitionierung gibt und diese in der Informatikliteratur ausführlich untersucht wurden, wurde die Rolle der Struktur hydrologischer Modelle bei der Datenpartitionierung noch nicht detailliert erläutert. Darüber hinaus ist die relative Rolle des Rechenlastausgleichs und der Kommunikation zwischen Prozessoren für die Effizienz paralleler Berechnungen eines hydrologischen Modells nicht bekannt. Am Beispiel des unstrukturierten Domänendiskretisierungsschemas, das im hydrologischen Modell PIHM verwendet wird, wird in diesem Artikel zunächst eine allgemeine Methodik zur Einbeziehung hydrologischer Faktoren in optimale Domänenpartitionierungsalgorithmen vorgestellt . Die Partitionen werden dann verwendet, um die isolierte Rolle des Rechenlastausgleichs und der Kommunikation zwischen Prozessoren auf die parallele Effizienz zu untersuchen. Die Ergebnisse bestätigen, dass parallele Simulationen auf Partitionen, die die Kommunikation zwischen Prozessoren minimieren und die Rechenlast gleichmäßig verteilen, am effizientesten sind. Noch wichtiger ist, dass der Lastausgleich zwischen Prozessoren ein empfindlicherer Regler für die parallele Effizienz ist als die Minimierung der Kommunikation zwischen Prozessoren. Weitere Analysen der Effizienz und Skalierbarkeit des parallelen Codes für verschiedene Partitionierungskonfigurationen zeigen eine direkte Übereinstimmung zwischen paralleler Effizienz und theoretischen Kennzahlen wie dem Verhältnis von Lastausgleich und dem Verhältnis von Kommunikation zu Rechenleistung. Die Ergebnisse zeigen, dass theoretische Kennzahlen zur Auswahl der besten Partitionen verwendet werden können, bevor rechenintensive parallele Simulationen durchgeführt werden. Die Studie dient als Proof-of-Concept-Bewertung der Auswirkungen von Rechenleistung und Kommunikation auf die Effizienz parallelisierter verteilter hydrologischer Modelle bei mehreren Auflösungen.