Version 1 (modified by 20 months ago) ( diff ) | ,
---|
Torque Setup
Για να προσθέσουμε το μηχάνημα σε μία ουρά του torque ακολουθούμε τα εξής βήματα:
- Στον scirouter προσθέτουμε νέο entry για το μηχάνημα:
vi /var/spool/pbs/server_priv/nodes
/etc/init.d/pbs restart
Τώρα πρέπει να βλέπουμε το μηχάνημα σε κατάσταση DOWN στις ουρές.
- Στο μηχάνημα: Επειδή στα τελευταία debian δεν υπάρχει ο torque στα repos, πρέπει να προσθέσουμε τα repos του squeeze (ευτυχώς ο torque δεν έχει dependencies με άλλα πακέτα και αυτό δεν δημιουργεί πρόβλημα).
Για Debian
Ανοίγουμε το /etc/apt/sources.list
και προσθέτουμε:
## Added to install torque-mom deb [arch=amd64,i386] http://ftp.ntua.gr/debian/ squeeze main contrib non-free deb-src [arch=amd64,i386] http://ftp.ntua.gr/debian/ squeeze main deb [arch=amd64,i386] http://security.debian.org/ squeeze/updates main contrib non-free deb-src [arch=amd64,i386] http://security.debian.org/ squeeze/updates main contrib
Για Ubuntu
cp /etc/apt/sources.list /etc/apt/sources.list.original ... replace the name of current version (e.g., bionic) with xenial ... mv /etc/apt/sources.list.original /etc/apt/sources.list # To restore after installing torque-mom
Μετά δίνουμε: apt-get update && apt-get install torque-mom
Πάμε στο αρχείο /etc/torque/server_name
και βάζουμε scirouter-cslab.cslab.ece.ntua.gr
. Επίσης, στο αρχείο /var/spool/torque/mom_priv/config
βάζουμε τα παρακάτω:
$usecp scirouter:/home /home $usecp scirouter:/various /various
Τέλος: /etc/init.d/torque-mom restart
How to remove a job from a DOWN node:
root@scirouter:~# rm -v $(find /var/spool/pbs -iname '*<JOB_ID>*')
root@scirouter:~# /etc/init.d/pbs restart