Skip to content

Automatisierter Check der Rootserver-Hardware

Wir haben seit gestern Abend eine interne Erweiterung für unser Reboots-, Rettungs- und Neuinstallations-System.

Wir haben alle Tests aller Hardware-Hersteller zum evtl. Auffinden von Hardware-Problemen in einen automatisierten Prozess gepackt, so dass wir jeden Server automatisiert auf so ziemlich fast alles testen können. Unter anderem werden die CPU, der IO-Bus, der Controller, der RAM sowie die Festplatten geprüft. Die Testergebnisse sehen wir intern in einem Report. Bislang haben wir die meisten Tests manuell durchgeführt.

Es gibt hin und wieder Kunden, die beharren darauf, dass die Hardware einen Fehler haben müsse, wenn sich ihre Applikationen verabschieden (dabei war es nur der OOM-Killer :razz: ).

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

Marcel

Wie ist das denn grob realisiert? Würde mich wirklich brennend interessieren :)

Jürgen Jaritsch

Und vor allem: auch welcher Ebene läuft das? Bootet Ihr dafür ein Rescue System?

Manuel Schmitt (manitu)

Korrekt :-D Und darin dann die Tools, die teilweise sogar angepasst wurden (ich liebe C/C++ :-) )

me

Hier standen zumindest 2 weitere Beiträge. Sind hier im Blog nur Lobgesänge erlaubt?

Manuel Schmitt (manitu)

Ganz im Gegenteil. Wer aber Kritik übt, muss fair sein und dem Gegenpart auch die Chance geben, sich zu verteidigen.

me

Eine entsprechende Antwort und Stehenlassen des (in diesem Fall sehr unfreundlichen) Kommentars hätte halt ein besseres Bild gemacht als diesen verschwinden zu lassen. Es ist Dein Blog, kannst sowieso machen was Du willst - aber mir sei die Bemerkung gestattet dass das ein bisschen komisch aussieht.

Manuel Schmitt (manitu)

Ich hatte dem Schreiber angeboten, dass er mir bitte erlauben soll, mich zu verteidigen. Das war nicht gewünscht, und da ich keinen Kunden in ein schlechtes Licht rücken wollte, hatte ich es in "Einvernehmen" vorgezogen, die Beiträge zu löschen.

Aber Du hast recht. Beim nächsten Mal erkläre ich kurz, warum zwei Kommentare gelöscht wurden. Danke für den Hinweis!

Jan Schejbal

Ich nehme mal stark an, dass du diese Tools nicht frei zur Verfügung stellen willst, weil die Entwicklung aufwändig war und du daraus schließlich (zu Recht) einen Vorteil gegenüber der Konkurrenz haben willst...

Ich suche seit längerem ein Tool, welches CPU, RAM und Festplatte gleichzeitig systematisch prüft. Im Moment lasse ich memtest86, MHDD und irgendein CPU-Burn-in-Tool nacheinander laufen, doch es wäre natürlich deutlich angenehmer, wenn diese Tätigkeiten parallel laufen und somit nur ein Drittel der Zeit verbrauchen würden. Netzwerkfähigkeit ist nicht nötig, es geht darum wenn mich wieder mal ein Bekannter anruft mit der äußerst genauen Fehlerbeschreibung "mein PC geht nicht". Kennt hier jemand irgendein Tool, was sowas macht, oder noch besser irgendetwas, welches die Parallisierung von beliebigen derartigen Diagnosetools erlaubt? (MHDD hat vor allem den Vorteil, dass es die Festplatte meiner Meinung nach sehr gründlich, aber trotzdem recht schnell prüft, und auch Blöcke findet, die die Festplatte zwar lesen kann, aber lange dafür braucht, die also nur "halb kaputt" sind)

Manuel Schmitt (manitu)

zum ersten Absatz: Leider ja

zum zweiten Absatz: Ich denke, dass Du da bei Deiner Suche fast ebenso erfolglos sein wirst wie wir es waren :-(

Kommentar schreiben

Umschließende Sterne heben ein Wort hervor (*wort*), per _wort_ kann ein Wort unterstrichen werden.
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.
Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.

Um maschinelle und automatische Übertragung von Spamkommentaren zu verhindern, bitte die Zeichenfolge im dargestellten Bild in der Eingabemaske eintragen. Nur wenn die Zeichenfolge richtig eingegeben wurde, kann der Kommentar angenommen werden. Bitte beachten Sie, dass Ihr Browser Cookies unterstützen muss, um dieses Verfahren anzuwenden.
CAPTCHA

BBCode-Formatierung erlaubt
Formular-Optionen