Changes between Initial Version and Version 1 of OpenMPI


Ignore:
Timestamp:
10/05/22 17:09:05 (2 years ago)
Author:
ypap
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • OpenMPI

    v1 v1  
     1= OpenMPI =
     2
     3By default, το OpenMPI που έχουμε εγκαταστήσει στα clones χρησιμοποιεί shared memory για την επικοινωνία εντός του κόμβου. Αυτό υλοποιείται με memory map ενός αρχείου που βρίσκεται στο `/tmp`. Επειδή όμως το `/tmp` στα clones είναι NFS mount η intra-node επικοινωνία by default είναι απελπίστικά αργή. Λύσεις: 
     4
     5- Τρέχουμε μέσω TCP/IP:
     6
     7Δεν είναι βελτιστοποιημένη επικοινωνία αλλά δουλεύει και είναι κατάλληλη για non-critical εφαρμογές. Π.χ. με αυτόν τον τρόπο τρέχουν οι φοιτητές στα παράλληλα.
     8
     9`/usr/local/open-mpi/bin/mpirun --bynode -np 16 -machinefile machines --mca btl self,tcp my_MPI_prog`
     10
     11- Χρησιμοποιούμε αρχείο από τον τοπικό δίσκο:
     12
     13`/usr/local/open-mpi/bin/mpirun --bynode -np 16 -machinefile machines --mca orte_tmpdir_base /local/tmp-MPI my_MPI_prog`
     14
     15Πρέπει προηγούμενα να έχουμε δημιουργήσει ένα αρχείο (στο παράδειγμα tmp-MPI) σε directory του τοπικού δίσκου (εδώ `/local`) σε όλους τους κόμβους που θα εκτελεστεί το πρόγραμμα.
     16
     17- Οι developers του OpenMPI προτείνουν και τη χρήση αρχείου στη μνήμη, που έχει σε πολλές περιπτώσεις καλύτερη επίδοση (αλλά έχει διάφορα implications που χρειάζονται προσοχή)
     18
     19`/usr/local/open-mpi/bin/mpirun --bynode -np 16 -machinefile machines --mca orte_tmpdir_base /dev/shm my_MPI_prog`
     20
     21''Σημ.'': Ο διακόπτης `--bynode` "γεμίζει" όλους τους διαθέσιμους κόμβους που βρίσκονται στο machinefile και στη συνέχεια αναθέτει κυκλικά επιπλέον διεργασίες σε κάθε κόμβο. Αντίστροφα ο διακόπτης `--byslot` γεμίζει όλα τα slots ενός κόμβου πριν προχωρήσει στον επόμενο κόμβο. Τυπική οργάνωση
     22{{{
     23machinefile:
     24clone1 slots=8
     25clone2 slots=8
     26clone3 slots=8
     27...
     28}}}
     29=== MPI over MX (Myrinet) ===
     30
     31θα πρέπει να δώσουμε κάποιες παραμέτρους περιβάλλοντος για να μπορούμε να εκτελέσουμε MPI over MX καθώς και το  `--mca btl mx,self` για να μη χρησιμοποιεί TCP/IP
     32
     33`MX_RCACHE=2 /usr/local/open-mpi/bin/mpirun -x MX_RCACHE=2 --mca btl mx,sm,self -bynode `
     34
     35**ΠΡΟΣΟΧΗ! : Τα παραπάνω είναι OpenMPI specific (π.χ. δεν ισχύουν για MPI-CH)