|
Verfasst am: 07. 09. 2012 [16:46]
|
|
schumacher
Sven Schumacher
Themenersteller
Dabei seit: 07.09.2012
Beiträge: 1
|
Taurus nimmt momentan scheinbar keine Jobs an, zumindest laufen die Jobs von nhkcsfb3 momentan nicht an, obwohl lt. Clubster-Betriebsstatus-Seite sich Taurus langweilt.
Außerdem hat nhkcsfb3 auch das Problem, so wie nhkftofi, dass die Jobs auf tane tierisch langsam laufen.
Für Infos was wir ggf. ändern müssen, damit es besser läuft, wären wir dankbar 
Mit freundlichen Grüßen
Sven
|
|
Verfasst am: 11. 09. 2012 [17:49]
|
|
cochrane
Paul Cochrane
Dabei seit: 14.09.2010
Beiträge: 139
|
Hi Sven,
es gibt eine Wartung auf Taurus zur Zeit und deshalb langweilt er sich. Hoffentlich schaffen wir es morgen ihn wieder in Betrieb zu nehmen.
Die Nachrichten wegen langsamer Jobs sind angekommen und soweit ich wiess arbeitet Patrick dran das Problem zu lösen. Genau was das Problem da ist weiss ich leider nicht, da ich zur Zeit Überstunden abbaue 
Ich bin Morgen wieder am Platz und hoffentlich kann ich dir dann sagen was los ist.
Viele Grüße,
Paul
|
|
Verfasst am: 13. 09. 2012 [11:02]
|
|
cochrane
Paul Cochrane
Dabei seit: 14.09.2010
Beiträge: 139
|
Hi Sven,
hier ein Nachtrag zu meiner Antwort von Vorgestern:
Patrick hat das Problem mit der Geschwindigkeit untersucht und hat Zombie-Prozesse von anderen Nutzern gefunden, die auf den Knoten noch liefen. Diese Prozesse wurden nicht sauber vom Batchsystem gekillt am Ende des Jobs und so liefen weiter. Nachdem diese Prozesse entweder per Hand gekillt wurden oder von sich selbst aus zu Ende liefen, liefen die Knoten (soweit wir feststellen konnten) wieder mit der erwarteten Geschwindigkeit. Wir konnten auf dem Storagesystem (BIGWORK, seinem Plattensystem und seinen Servern) keine Lastprobleme in den letzten Tagen erkennen, die darauf deuten würden, dass dort das Problem lag. Patrick hat unsere Überwachung erweitert um uns zu informierien sobald Knoten mit Zombie-Prozessen auftauchen, also die Geschwindigkeitsprobleme sollten zukünftig nicht so stark vorkommen.
Die Wartung auf Taurus läuft langsam weiter. Leider hatten wir in den letzten Tagen wenige Leute vor Ort und von daher wenig Zeit die Wartung durchzuführen. Sie geht aber heute weiter voran und hoffentlich wird Taurus heute für den Betrieb wieder freigegeben.
Viele Grüße,
Paul
|