| 1 | = OpenMPI = |
| 2 | |
| 3 | By default, το OpenMPI που έχουμε εγκαταστήσει στα clones χρησιμοποιεί shared memory για την επικοινωνία εντός του κόμβου. Αυτό υλοποιείται με memory map ενός αρχείου που βρίσκεται στο `/tmp`. Επειδή όμως το `/tmp` στα clones είναι NFS mount η intra-node επικοινωνία by default είναι απελπίστικά αργή. Λύσεις: |
| 4 | |
| 5 | - Τρέχουμε μέσω TCP/IP: |
| 6 | |
| 7 | Δεν είναι βελτιστοποιημένη επικοινωνία αλλά δουλεύει και είναι κατάλληλη για non-critical εφαρμογές. Π.χ. με αυτόν τον τρόπο τρέχουν οι φοιτητές στα παράλληλα. |
| 8 | |
| 9 | `/usr/local/open-mpi/bin/mpirun --bynode -np 16 -machinefile machines --mca btl self,tcp my_MPI_prog` |
| 10 | |
| 11 | - Χρησιμοποιούμε αρχείο από τον τοπικό δίσκο: |
| 12 | |
| 13 | `/usr/local/open-mpi/bin/mpirun --bynode -np 16 -machinefile machines --mca orte_tmpdir_base /local/tmp-MPI my_MPI_prog` |
| 14 | |
| 15 | Πρέπει προηγούμενα να έχουμε δημιουργήσει ένα αρχείο (στο παράδειγμα tmp-MPI) σε directory του τοπικού δίσκου (εδώ `/local`) σε όλους τους κόμβους που θα εκτελεστεί το πρόγραμμα. |
| 16 | |
| 17 | - Οι developers του OpenMPI προτείνουν και τη χρήση αρχείου στη μνήμη, που έχει σε πολλές περιπτώσεις καλύτερη επίδοση (αλλά έχει διάφορα implications που χρειάζονται προσοχή) |
| 18 | |
| 19 | `/usr/local/open-mpi/bin/mpirun --bynode -np 16 -machinefile machines --mca orte_tmpdir_base /dev/shm my_MPI_prog` |
| 20 | |
| 21 | ''Σημ.'': Ο διακόπτης `--bynode` "γεμίζει" όλους τους διαθέσιμους κόμβους που βρίσκονται στο machinefile και στη συνέχεια αναθέτει κυκλικά επιπλέον διεργασίες σε κάθε κόμβο. Αντίστροφα ο διακόπτης `--byslot` γεμίζει όλα τα slots ενός κόμβου πριν προχωρήσει στον επόμενο κόμβο. Τυπική οργάνωση |
| 22 | {{{ |
| 23 | machinefile: |
| 24 | clone1 slots=8 |
| 25 | clone2 slots=8 |
| 26 | clone3 slots=8 |
| 27 | ... |
| 28 | }}} |
| 29 | === MPI over MX (Myrinet) === |
| 30 | |
| 31 | θα πρέπει να δώσουμε κάποιες παραμέτρους περιβάλλοντος για να μπορούμε να εκτελέσουμε MPI over MX καθώς και το `--mca btl mx,self` για να μη χρησιμοποιεί TCP/IP |
| 32 | |
| 33 | `MX_RCACHE=2 /usr/local/open-mpi/bin/mpirun -x MX_RCACHE=2 --mca btl mx,sm,self -bynode ` |
| 34 | |
| 35 | **ΠΡΟΣΟΧΗ! : Τα παραπάνω είναι OpenMPI specific (π.χ. δεν ισχύουν για MPI-CH) |