wiki:Torque

Version 2 (modified by ypap, 5 weeks ago) ( diff )

--

Torque Setup

Για να προσθέσουμε το μηχάνημα σε μία ουρά του torque ακολουθούμε τα εξής βήματα:

  1. Στον scirouter προσθέτουμε νέο entry για το μηχάνημα: vi /var/spool/pbs/server_priv/nodes

/etc/init.d/pbs restart Τώρα πρέπει να βλέπουμε το μηχάνημα σε κατάσταση DOWN στις ουρές.

  1. Στο μηχάνημα: Επειδή στα τελευταία debian δεν υπάρχει ο torque στα repos, πρέπει να προσθέσουμε τα repos του squeeze (ευτυχώς ο torque δεν έχει dependencies με άλλα πακέτα και αυτό δεν δημιουργεί πρόβλημα).

Για Debian Ανοίγουμε το /etc/apt/sources.list και προσθέτουμε:

## Added to install torque-mom
deb [trusted=yes] http://archive.debian.org/debian/ squeeze main contrib non-free

OUTDATED

deb [arch=amd64,i386] http://ftp.ntua.gr/debian/ squeeze main contrib non-free
deb-src  [arch=amd64,i386] http://ftp.ntua.gr/debian/ squeeze main
deb [arch=amd64,i386] http://security.debian.org/ squeeze/updates main contrib non-free
deb-src [arch=amd64,i386] http://security.debian.org/ squeeze/updates main contrib

Για Ubuntu

cp /etc/apt/sources.list /etc/apt/sources.list.original
... replace the name of current version (e.g., bionic) with xenial ...
mv /etc/apt/sources.list.original /etc/apt/sources.list # To restore after installing torque-mom

Μετά δίνουμε: apt-get update && apt-get install torque-mom

Πάμε στο αρχείο /etc/torque/server_name και βάζουμε scirouter-cslab.cslab.ece.ntua.gr. Επίσης, στο αρχείο /var/spool/torque/mom_priv/config βάζουμε τα παρακάτω:

$usecp scirouter:/home /home
$usecp scirouter:/various /various

Τέλος: /etc/init.d/torque-mom restart

How to remove a job from a DOWN node:

root@scirouter:~# rm -v $(find /var/spool/pbs -iname '*<JOB_ID>*')

root@scirouter:~# /etc/init.d/pbs restart

Note: See TracWiki for help on using the wiki.