Clustersystem > Forum

Ausgabe von showbf


Author Message
Written on: 17. 02. 2012 [14:26]
nhaeruth
Julian Rüth
Topic creator
registered since: 25.08.2011
Posts: 16
Hallo,

da die queue momentan ziemlich voll ist, versuche ich die Freiraeume, die von showbf angezeigt werden, zu verwenden, um kleine Rechnungen anzustossen. Leider funktioniert das momentan nicht.

Wieso laufen meine Jobs nicht an?

$ showbf -S
HostName Procs Memory Disk Swap Time Available
[...]
tane-n041 4 37028 1 56489 1:19:52

D.h. es gibt einen slot auf tane-n041 fuer 1h 20 m. Ein entsprechender Job laeuft aber nicht an:

Job Id: 473801.batch.rrzn.uni-hannover.de
job_state = Q
queue = all
Resource_List.mem = 8192mb
Resource_List.nodes = 1:ppn=4
Resource_List.walltime = 01:15:44
Written on: 17. 02. 2012 [17:14]
gerdes
Andreas Gerdes
registered since: 14.09.2010
Posts: 50
Hallo Julian,

ich habe das auch gerade mal versucht. Aber egal, wie klein ich die Ressourcen-Anforderung wähle, ich komme nicht rein.

Ein Blick in die Queue gibt Antwort:

$ qstat -a | wc -l

zeigt ~8847 (minus Kopfzeilen des qstat Befehls)

Die Zahl an wartenden Jobs in der Queue ist zu groß für das Batchsystem. Für alle Jobs, die 8192 überschreiten funktioniert "backfill" nicht mehr, weil sie gar nicht mehr angeschaut werden.

Das ist ärgerlich, aber wir hatten diese Grenze schon von verdoppelt (vorher 4096).

Du wirst warten müssen, bis ein paar Jobs "weggerechnet" wurden. Dann wird es wieder gehen. Am Freitag ist es immer besonders voll, weil die Leute vor dem Wochenende nochmal ein "paar" Jobs loswerden wollen. Das gibt sich aber bis Sonntag.

Viele Grüße
Andreas
Written on: 17. 02. 2012 [17:21]
gerdes
Andreas Gerdes
registered since: 14.09.2010
Posts: 50
Korrektur:

man muss noch ein grep " Q" einbauen, damit die laufenden Jobs nicht mitgezählt werden. Aber danach sind es noch 8562 wartende Jobs icon_frown.gif
Written on: 20. 02. 2012 [07:28]
nhaeruth
Julian Rüth
Topic creator
registered since: 25.08.2011
Posts: 16
Danke. Das erklärt es natürlich.

Spricht eigentlich etwas dagegen dieses Limit noch weiter zu erhöhen?



User login

Enter your username and password here in order to log in on the website:

Registrierung

Falls Sie noch keinen Benutzer-Zugang zu dem Forum haben, können Sie sich jederzeit registrieren:

Last Change: 12.04.2011
 
Editorial Responsibility RRZN