[parml] Σχετικά με την πρώτη εργαστηριακή άσκηση και το αυριανό μάθημα

Nikela Papadopoulou nikela at cslab.ece.ntua.gr
Wed Mar 25 21:34:43 EET 2020


Καλησπέρα, 


Σχετικά με το αυριανό μάθημα:

Όπως είπαμε, το αυριανό μάθημα θα πραγματοποιηθεί με τηλεδιάσκεψη. 
Θα σχολιάσουμε ό,τι άπτεται της πρώτης εργαστηριακής άσκησης και θα προχωρήσουμε στη θεωρία. 
Η σύνδεση θα γινει με την πλατφόρμα GotoMeeting (https://www.gotomeeting.com <https://www.gotomeeting.com/>). Υπάρχει client για windows και εφαρμογή για κινητό, παίζει και με αρκετά configurations και σε linux. Παρακαλώ πολύ κάντε την προετοιμασία (εγκατάσταση κλπ) εγκαίρως. 

ParML 
Thu, Mar 26, 2020 2:30 PM - 5:00 PM (EET) 
Please join my meeting from your computer, tablet or smartphone. 
https://global.gotomeeting.com/join/599634085 <https://global.gotomeeting.com/join/599634085> 
Σχετικά με την πρώτη εργαστηριακή άσκηση: 

Φαίνεται να υπάρχει κάποιο πρόβλημα στην ουρά, και ως αποτέλεσμα, κάποιες φορές ίσως προσπαθείτε να εκτελέσετε κάποιο job αλλά σας επιστρέφονται κενά τα σχετικά output files. 

Για να το παρακάμψουμε προσωρινά, μπορείτε να χρησιμοποιήσετε το interactive mode του Torque, με το οποίο, χρησιμοποιώντας τον Torque, αποκτάτε απευθείας πρόσβαση στους πόρους που ζητάτε. 

Ένα παράδειγμα έχει ως εξής:

- Είμαι ο χρήστης nikela, έχω συνδεθεί στον scirouter, έχω αντιγράψει τα αρχεία της άσκησης στο φάκελο /home/users/nikela/mnist (ή αλλιώς ${ΗΟΜΕ}/mnist) και θέλω να τρέξω το script που περιγράφεται στο  2ο ερώτημα του 2.1, δηλαδή το run_all_parallel_torque.sh. 

- Αν το τρέξω με τον τρόπο που περιγράψαμε στο εργαστήριο, δηλαδή υποβάλοντάς το στην ουρά με batch mode, θα κάνω το εξής:
nikela at scirouter$ qsub -q parlab -l nodes=1:ppn=8:highmem run_all_parallel_torque.sh 
Με το όρισμα nodes=1:ppn=8 ζητάω από τον Torque να μου δεσμέυσει ένα node με 8 πυρήνες, να εκτελέσει το script run_all_parallel_torque.sh και να μου επιστρέψει το output και το error στα αρχεία mnist_run_all_parallel_torque.out και  mnist_run_all_parallel_torque.err.

- Εναλλακτικά, μπορώ να ζητήσω interactive πρόσβαση σε ένα node με 8 πυρήνες της ουράς parlab ως εξής:
nikela at scirouter$ qsub -q parlab -l nodes=1:ppn=8:highmem -I 

O Torque θα μου επιστρέψει κάτι σαν το παρακάτω:

qsub: waiting for job 428991.localhost to start
qsub: job 428991.localhost ready
nikela at clone1$ 

Πλέον έχω συνδεθεί σε κάποιο clone (στην προκείμενη περίπτωση, στο clone1) και μπορώ να εκτελέσω απευθείας τα scripts μου:

nikela at clone1$ cd ${HOME}/mnist
nikela at clone1$ ./run_all_parallel_torque.sh

Σημείωση: Όλες οι γραμμές του script που ξεκινούν με #PBS και απευθύνονται στον Torque, αγνοούνται. 

Προσοχή: Τα αποτελέσματα (output και error) εκτυπώνονται στο stdout/stderr, δηλαδή στην οθόνη και όχι σε κάποιο αρχείο. Αν θέλετε να τα αποθηκεύσετε στα αρχεία mnist_run_all_parallel_torque.out και mnist_run_all_parallel_torque.err όπως πριν, μπορείτε ως εξής:

nikela at clone1$ ./run_all_parallel_torque.sh >mnist_run_all_parallel_torque.out 2>mnist_run_all_parallel_torque.err

Όταν ολοκληρώσετε την εκτέλεσή σας, μπορείτε να απελευθερώσετε τον κόμβο με την εντολή exit:

nikela at clone1$ exit
logout

qsub: job 428991.localhost completed
nikela at scirouter:~$


Αν έχετε απορίες σχετικά με τα παραπάνω, τις συζητάμε στο slack στο channel #lab1.

Καλή συνέχεια, 
Νικέλα




-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.cslab.ece.ntua.gr/pipermail/parml/attachments/20200325/ddc9d134/attachment.htm>


More information about the parml mailing list