Donnerstag, 10. Juli 2008, 11:06
Automatisierter Check der Rootserver-Hardware
Wir haben seit gestern Abend eine interne Erweiterung für unser Reboots-, Rettungs- und Neuinstallations-System.
Wir haben alle Tests aller Hardware-Hersteller zum evtl. Auffinden von Hardware-Problemen in einen automatisierten Prozess gepackt, so dass wir jeden Server automatisiert auf so ziemlich fast alles testen können. Unter anderem werden die CPU, der IO-Bus, der Controller, der RAM sowie die Festplatten geprüft. Die Testergebnisse sehen wir intern in einem Report. Bislang haben wir die meisten Tests manuell durchgeführt.
Es gibt hin und wieder Kunden, die beharren darauf, dass die Hardware einen Fehler haben müsse, wenn sich ihre Applikationen verabschieden (dabei war es nur der OOM-Killer ).
Wir haben alle Tests aller Hardware-Hersteller zum evtl. Auffinden von Hardware-Problemen in einen automatisierten Prozess gepackt, so dass wir jeden Server automatisiert auf so ziemlich fast alles testen können. Unter anderem werden die CPU, der IO-Bus, der Controller, der RAM sowie die Festplatten geprüft. Die Testergebnisse sehen wir intern in einem Report. Bislang haben wir die meisten Tests manuell durchgeführt.
Es gibt hin und wieder Kunden, die beharren darauf, dass die Hardware einen Fehler haben müsse, wenn sich ihre Applikationen verabschieden (dabei war es nur der OOM-Killer ).
Kommentare
Ansicht der Kommentare: Linear | Verschachtelt
Marcel
Jürgen Jaritsch
Manuel Schmitt (manitu)
me
Manuel Schmitt (manitu)
me
Manuel Schmitt (manitu)
Aber Du hast recht. Beim nächsten Mal erkläre ich kurz, warum zwei Kommentare gelöscht wurden. Danke für den Hinweis!
Jan Schejbal
Ich suche seit längerem ein Tool, welches CPU, RAM und Festplatte gleichzeitig systematisch prüft. Im Moment lasse ich memtest86, MHDD und irgendein CPU-Burn-in-Tool nacheinander laufen, doch es wäre natürlich deutlich angenehmer, wenn diese Tätigkeiten parallel laufen und somit nur ein Drittel der Zeit verbrauchen würden. Netzwerkfähigkeit ist nicht nötig, es geht darum wenn mich wieder mal ein Bekannter anruft mit der äußerst genauen Fehlerbeschreibung "mein PC geht nicht". Kennt hier jemand irgendein Tool, was sowas macht, oder noch besser irgendetwas, welches die Parallisierung von beliebigen derartigen Diagnosetools erlaubt? (MHDD hat vor allem den Vorteil, dass es die Festplatte meiner Meinung nach sehr gründlich, aber trotzdem recht schnell prüft, und auch Blöcke findet, die die Festplatte zwar lesen kann, aber lange dafür braucht, die also nur "halb kaputt" sind)
Manuel Schmitt (manitu)
zum zweiten Absatz: Ich denke, dass Du da bei Deiner Suche fast ebenso erfolglos sein wirst wie wir es waren