Clustersystem > Forum

qstat Syntax


Author Message
Written on: 09. 01. 2012 [12:28]
nhaeruth
Julian Rüth
Topic creator
registered since: 25.08.2011
Posts: 16
Hallo,

mit dem Update scheint sich etwas bei qstat verändert zu haben. Vorher konnte man per qstat -f JOBID detaillierte Infos zu einem Job anzeigen — jetzt funktioniert das scheinbar nicht mehr.

$ qstat -f 437334
qstat: Unknown Job Id 437334.tclog.rrzn.uni-hannover.de
$ qstat | grep 437334
437334.batch STDIN nhaeruth 00:00:02 R all
$ qstat -f 437334.batch
qstat: Unknown Job Id 437334.tclog.rrzn.uni-hannover.de

Kann es sein, dass früher alle Jobs dieses "tclog" hatten, wo jetzt ein "batch" steht? Gibt es eine Idee, was man hier machen kann?

Danke,
julian
Written on: 09. 01. 2012 [12:36]
gerdes
Andreas Gerdes
registered since: 14.09.2010
Posts: 50
Hallo Julian,

qstat -f <jobid> funktioniert immer noch, aber nur für alle Jobs, die nach der Wartung submittiert wurden, weil hier alle (neuen) Versionen von Torque und Maui zusammenspielen. Die Jobs, die noch von vor der Wartung stammen, lassen sich nicht mehr mit "-f" genauer anschauen: sie haben noch das tclog im Namen und der Batchserver sagt dann, er kenne diese Job-ID nicht.

Diese "alten" Jobs sollten aber bald abgearbeitet sein, und dann wird es nicht mehr zu diesem Fehler kommen. Leider gibt es keinen Workaround, um die alten Jobs genauer anzuschauen. Sie werden aber trotzdem abgearbeitet.

Viele Grüße
Andreas
Written on: 09. 01. 2012 [13:28]
cochrane
Paul Cochrane
registered since: 14.09.2010
Posts: 145
Als Ergänzung zu Andreas Antwort, man kann eigentlich auch die alten Jobs mit =qstat -f= anschauen, man muss aber ziemlich spezifisch sein:

qstat -f <jobid>.tclog.rrzn.uni-hannover.de@batch.rrzn.uni-hannover.de

Sobald alle die alten Jobs abbearbeitet sind, kann man wieder

qstat -f <jobid> aufrufen.

Viele Grüße,

Paul
Written on: 09. 01. 2012 [14:04]
nhaeruth
Julian Rüth
Topic creator
registered since: 25.08.2011
Posts: 16
"gerdes" schrieb:

qstat -f <jobid> funktioniert immer noch, aber nur für alle Jobs, die nach der Wartung submittiert wurden, weil hier alle (neuen) Versionen von Torque und Maui zusammenspielen. Die Jobs, die noch von vor der Wartung stammen, lassen sich nicht mehr mit "-f" genauer anschauen: sie haben noch das tclog im Namen und der Batchserver sagt dann, er kenne diese Job-ID nicht.


Danke für die Antwort. Tatsächlich handelt es sich aber um einen "neuen" Job. Konkret habe ich das in einem interaktiven Job getestet:

$ echo $PBS_JOBID
437348.batch.rrzn.uni-hannover.de
$ qstat -f $PBS_JOBID
qstat: Unknown Job Id 437348.tclog.rrzn.uni-hannover.de

Merkwürdig ist, dass hier dieses "tclog" von qstat angehängt wird.
Written on: 09. 01. 2012 [14:27]
cochrane
Paul Cochrane
registered since: 14.09.2010
Posts: 145
Hallo Julian,

das ist ja komisch! Auf welchem Knoten ist dies passiert?

Danke und viele Grüße,

Paul
Written on: 09. 01. 2012 [14:32]
nhaeruth
Julian Rüth
Topic creator
registered since: 25.08.2011
Posts: 16
"cochrane" schrieb:

das ist ja komisch! Auf welchem Knoten ist dies passiert?


Hier mal das komplette "log" von dem was ich mache:

% ssh nhaeruthavon.rrzn.uni-hannover[dot]de
nhaeruth@avon:~$ qsub -W x=PARTITION:tane -q all -l nodes=1:ppn=1 -l walltime=0:2:47:33 -l mem=2048mb -I
qsub: waiting for job 437356.batch.rrzn.uni-hannover.de to start
qsub: job 437356.batch.rrzn.uni-hannover.de ready
nhaeruth@tane-n086:~$ qstat $PBS_JOBID
qstat: Unknown Job Id 437356.tclog.rrzn.uni-hannover.de
Written on: 09. 01. 2012 [14:39]
cochrane
Paul Cochrane
registered since: 14.09.2010
Posts: 145
Hallo Julian,

danke für die Ausgabe. Komischerwiese, wenn man einfach "qstat -f" eingibt, taucht <jobid>.batch.rrzn.uni-hannover.de auf, aber sobald man *auf einem Loginknoten im Batchjob* (!!) "qstat -f <jobid>" aufruft, erwartet es =tclog= irgendwo. Alle Einstellungen scheinen komplett in Ordnung zu sein... Wir müssen das noch gründlicher untersuchen.

Viele Grüße,

Paul



User login

Enter your username and password here in order to log in on the website:

Registrierung

Falls Sie noch keinen Benutzer-Zugang zu dem Forum haben, können Sie sich jederzeit registrieren:

Last Change: 12.04.2011
 
Editorial Responsibility RRZN