Clustersystem > Forum

Ausgabe von showbf


Autor Nachricht
Verfasst am: 17. 02. 2012 [14:26]
nhaeruth
Julian Rüth
Themenersteller
Dabei seit: 25.08.2011
Beiträge: 16
Hallo,

da die queue momentan ziemlich voll ist, versuche ich die Freiraeume, die von showbf angezeigt werden, zu verwenden, um kleine Rechnungen anzustossen. Leider funktioniert das momentan nicht.

Wieso laufen meine Jobs nicht an?

$ showbf -S
HostName Procs Memory Disk Swap Time Available
[...]
tane-n041 4 37028 1 56489 1:19:52

D.h. es gibt einen slot auf tane-n041 fuer 1h 20 m. Ein entsprechender Job laeuft aber nicht an:

Job Id: 473801.batch.rrzn.uni-hannover.de
job_state = Q
queue = all
Resource_List.mem = 8192mb
Resource_List.nodes = 1:ppn=4
Resource_List.walltime = 01:15:44
Verfasst am: 17. 02. 2012 [17:14]
gerdes
Andreas Gerdes
Dabei seit: 14.09.2010
Beiträge: 50
Hallo Julian,

ich habe das auch gerade mal versucht. Aber egal, wie klein ich die Ressourcen-Anforderung wähle, ich komme nicht rein.

Ein Blick in die Queue gibt Antwort:

$ qstat -a | wc -l

zeigt ~8847 (minus Kopfzeilen des qstat Befehls)

Die Zahl an wartenden Jobs in der Queue ist zu groß für das Batchsystem. Für alle Jobs, die 8192 überschreiten funktioniert "backfill" nicht mehr, weil sie gar nicht mehr angeschaut werden.

Das ist ärgerlich, aber wir hatten diese Grenze schon von verdoppelt (vorher 4096).

Du wirst warten müssen, bis ein paar Jobs "weggerechnet" wurden. Dann wird es wieder gehen. Am Freitag ist es immer besonders voll, weil die Leute vor dem Wochenende nochmal ein "paar" Jobs loswerden wollen. Das gibt sich aber bis Sonntag.

Viele Grüße
Andreas
Verfasst am: 17. 02. 2012 [17:21]
gerdes
Andreas Gerdes
Dabei seit: 14.09.2010
Beiträge: 50
Korrektur:

man muss noch ein grep " Q" einbauen, damit die laufenden Jobs nicht mitgezählt werden. Aber danach sind es noch 8562 wartende Jobs icon_frown.gif
Verfasst am: 20. 02. 2012 [07:28]
nhaeruth
Julian Rüth
Themenersteller
Dabei seit: 25.08.2011
Beiträge: 16
Danke. Das erklärt es natürlich.

Spricht eigentlich etwas dagegen dieses Limit noch weiter zu erhöhen?



Benutzeranmeldung

Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden:

Registrierung

Falls Sie noch keinen Benutzer-Zugang zu dem Forum haben, können Sie sich jederzeit registrieren:

Letzte Änderung: 12.04.2011
 
Verantwortlich RRZN