Ratlosigkeit ...
Mir gehen so langsam die Ideen aus.
Unser root-Server zeigt mittlerweile ein Mal am Tag Ausfallerscheinungen, Rekord war ein load average von 174 und ich habe gesehen, dass unglaublich viele Postfix- und auch reichlich viele Apache2-Prozesse liefen. Darüber kam der Server ins swappen und war kaum noch ansprechbar. Die Resultate sehe ich, aber ich finde die Ursache nicht.
Natürlich haben wir die Logs von Mailserver und Webserver analysiert und nach den "üblichen" Verdächtigen gesucht, wir sind aber leider nicht fündig geworden.
Ernst gemeinte Vorschläge und Hilfen sind herzlich Willkommen.
Unser root-Server zeigt mittlerweile ein Mal am Tag Ausfallerscheinungen, Rekord war ein load average von 174 und ich habe gesehen, dass unglaublich viele Postfix- und auch reichlich viele Apache2-Prozesse liefen. Darüber kam der Server ins swappen und war kaum noch ansprechbar. Die Resultate sehe ich, aber ich finde die Ursache nicht.
Natürlich haben wir die Logs von Mailserver und Webserver analysiert und nach den "üblichen" Verdächtigen gesucht, wir sind aber leider nicht fündig geworden.
Ernst gemeinte Vorschläge und Hilfen sind herzlich Willkommen.
Trackbacks
Dirks Logbuch am : Kein Hardwarefehler ...
Vorschau anzeigen
So, unser Hoster hat einen acht-Stündigen Hardwaretest auf die Maschine losgelassen. Leider ohne Erfolg. Allerdings hat nach dem Hochfahren das Software-RAID1 sich noch synchronisiert. Vielleicht haben sie ja prophylaktisch die Platten getauscht. Drück
Kommentare
Ansicht der Kommentare: Linear | Verschachtelt
Richard am :
Dirk Deimeke am :
Jimbo am :
visus am :
Die zweite Idee: RAM kaputt? Der Kernel kommt relativ gut mit defektem RAM klar und ignoriert die defekten Teile (manchmal aber nur bei der Nutzung und nicht in den Stats). Das koennte den Kernel swappen lassen. Probiert mal memtest.
Dirk Deimeke am :
Dirk Deimeke am :
Ute am :
Dirk Deimeke am :
Alphager am :
Dirk Deimeke am :
el*Loco am :
Dirk Deimeke am :
Die IOwaits können auch durchaus vom Swappen kommen.
el*Loco am :
Da ihr in den apache logs nichts gefunden habt, ist wahrscheinlich ein Amok-laufender Crawler auszuschliessen - Yahoo hat da in der letzten Zeit immer mal wieder Probleme.
Dirk Deimeke am :
Cronjobs schliesse ich aus, da die Zeiten nicht mit unseren Cronjobs übereinstimmen.
Dirk Deimeke am :
Wir haben ja einige Stellen, an denen externe Dienste zur Hilfe genommen werden, um Spam zu prüfen. Blacklist für NIXspam bei Manitu, Akismet für Blogkommentare.
Wenn jetzt eine Spamwelle rollt, könnte es hypothetisch sein, dass einzelne Threads sehr lange auf Antworten der entfernten Systeme warten.
Sie warten und verbrauchen Speicher. Die Nächste Mail die kommt (Kommentare im Blog schliesse ich aus, da ich gar nichts im Log finde), bekommt einen neuen Thread. Irgendwann ist das RAM aufgebraucht und die Maschine geht ins Swapping.
Die Frage ist, wie ich einen Hebel bekomme, um das zu bestätigen.
onli am :
Dirk Deimeke am :
onli am :
Ein gescheiterter Pingback ist natürlich an sich bedeutungslos, aber normalerweise sollte Serendipity dann einfach weitergehen anstatt die Generierung ganz abzubrechen, was auf einen "kritischen" Fehler hindeutet.
Da das auch was mit externen Diensten zu tun hat, wollte ich es erwähnt haben.
Gruß
Dirk Deimeke am :