Clustersystem > Forum

qstat Syntax


Autor Nachricht
Verfasst am: 09. 01. 2012 [12:28]
nhaeruth
Julian Rüth
Themenersteller
Dabei seit: 25.08.2011
Beiträge: 16
Hallo,

mit dem Update scheint sich etwas bei qstat verändert zu haben. Vorher konnte man per qstat -f JOBID detaillierte Infos zu einem Job anzeigen — jetzt funktioniert das scheinbar nicht mehr.

$ qstat -f 437334
qstat: Unknown Job Id 437334.tclog.rrzn.uni-hannover.de
$ qstat | grep 437334
437334.batch STDIN nhaeruth 00:00:02 R all
$ qstat -f 437334.batch
qstat: Unknown Job Id 437334.tclog.rrzn.uni-hannover.de

Kann es sein, dass früher alle Jobs dieses "tclog" hatten, wo jetzt ein "batch" steht? Gibt es eine Idee, was man hier machen kann?

Danke,
julian
Verfasst am: 09. 01. 2012 [12:36]
gerdes
Andreas Gerdes
Dabei seit: 14.09.2010
Beiträge: 50
Hallo Julian,

qstat -f <jobid> funktioniert immer noch, aber nur für alle Jobs, die nach der Wartung submittiert wurden, weil hier alle (neuen) Versionen von Torque und Maui zusammenspielen. Die Jobs, die noch von vor der Wartung stammen, lassen sich nicht mehr mit "-f" genauer anschauen: sie haben noch das tclog im Namen und der Batchserver sagt dann, er kenne diese Job-ID nicht.

Diese "alten" Jobs sollten aber bald abgearbeitet sein, und dann wird es nicht mehr zu diesem Fehler kommen. Leider gibt es keinen Workaround, um die alten Jobs genauer anzuschauen. Sie werden aber trotzdem abgearbeitet.

Viele Grüße
Andreas
Verfasst am: 09. 01. 2012 [13:28]
cochrane
Paul Cochrane
Dabei seit: 14.09.2010
Beiträge: 145
Als Ergänzung zu Andreas Antwort, man kann eigentlich auch die alten Jobs mit =qstat -f= anschauen, man muss aber ziemlich spezifisch sein:

qstat -f <jobid>.tclog.rrzn.uni-hannover.de@batch.rrzn.uni-hannover.de

Sobald alle die alten Jobs abbearbeitet sind, kann man wieder

qstat -f <jobid> aufrufen.

Viele Grüße,

Paul
Verfasst am: 09. 01. 2012 [14:04]
nhaeruth
Julian Rüth
Themenersteller
Dabei seit: 25.08.2011
Beiträge: 16
"gerdes" schrieb:

qstat -f <jobid> funktioniert immer noch, aber nur für alle Jobs, die nach der Wartung submittiert wurden, weil hier alle (neuen) Versionen von Torque und Maui zusammenspielen. Die Jobs, die noch von vor der Wartung stammen, lassen sich nicht mehr mit "-f" genauer anschauen: sie haben noch das tclog im Namen und der Batchserver sagt dann, er kenne diese Job-ID nicht.


Danke für die Antwort. Tatsächlich handelt es sich aber um einen "neuen" Job. Konkret habe ich das in einem interaktiven Job getestet:

$ echo $PBS_JOBID
437348.batch.rrzn.uni-hannover.de
$ qstat -f $PBS_JOBID
qstat: Unknown Job Id 437348.tclog.rrzn.uni-hannover.de

Merkwürdig ist, dass hier dieses "tclog" von qstat angehängt wird.
Verfasst am: 09. 01. 2012 [14:27]
cochrane
Paul Cochrane
Dabei seit: 14.09.2010
Beiträge: 145
Hallo Julian,

das ist ja komisch! Auf welchem Knoten ist dies passiert?

Danke und viele Grüße,

Paul
Verfasst am: 09. 01. 2012 [14:32]
nhaeruth
Julian Rüth
Themenersteller
Dabei seit: 25.08.2011
Beiträge: 16
"cochrane" schrieb:

das ist ja komisch! Auf welchem Knoten ist dies passiert?


Hier mal das komplette "log" von dem was ich mache:

% ssh nhaeruthavon.rrzn.uni-hannover[dot]de
nhaeruth@avon:~$ qsub -W x=PARTITION:tane -q all -l nodes=1:ppn=1 -l walltime=0:2:47:33 -l mem=2048mb -I
qsub: waiting for job 437356.batch.rrzn.uni-hannover.de to start
qsub: job 437356.batch.rrzn.uni-hannover.de ready
nhaeruth@tane-n086:~$ qstat $PBS_JOBID
qstat: Unknown Job Id 437356.tclog.rrzn.uni-hannover.de
Verfasst am: 09. 01. 2012 [14:39]
cochrane
Paul Cochrane
Dabei seit: 14.09.2010
Beiträge: 145
Hallo Julian,

danke für die Ausgabe. Komischerwiese, wenn man einfach "qstat -f" eingibt, taucht <jobid>.batch.rrzn.uni-hannover.de auf, aber sobald man *auf einem Loginknoten im Batchjob* (!!) "qstat -f <jobid>" aufruft, erwartet es =tclog= irgendwo. Alle Einstellungen scheinen komplett in Ordnung zu sein... Wir müssen das noch gründlicher untersuchen.

Viele Grüße,

Paul



Benutzeranmeldung

Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden:

Registrierung

Falls Sie noch keinen Benutzer-Zugang zu dem Forum haben, können Sie sich jederzeit registrieren:

Letzte Änderung: 12.04.2011
 
Verantwortlich RRZN