Array ( [0] => facebook [1] => twitter [2] => google_plus )

Problemlösung der letzten Downtime

Posted on:11. März 2015

Author:Markus Köhler

Category:IT

Share: / /

Seit heute Nacht um 1:09 bis jetzt, um 19:09, war dieser Blog nicht erreichbar – das heißt 18 Stunden Downtime. Dies war mehreren Ursachen verschuldet, unter anderem dass ich auf der Arbeit keine Möglichkeit hatte, mich auf den Server zu verbinden zur Analyse des Problems. Darum hier ein Beispiel, wie man die Nicht-Erreichbarkeit eines Servers oder einer Website analysieren kann.

Erreichbarkeit der Domain prüfen

Da ich ja in der Vergangenheit schon Probleme hatte, weil ich vergessen hatte die Domain rechtzeitig zu verlängern, kam mir das als Ursache als erstes wieder in den Sinn – aber ich konnte es auch genauso schnell als Fehlerursache ausschließen, da andere Subdomains problemlos erreichbar waren.

DNS-Eintrag der Domain prüfen

In seltenen Fällen kann es sein, dass ein Server unvermittelt eine neue IP-Adresse zugeteilt bekommt, und deshalb der DNS-Eintrag (z.B. A oder AAAA) einer Domain nicht mehr stimmt. Also einen PING auf die Domain absetzen bzw. die DNS-Einträge auf dem Nameserver überprüfen und mit der Angabe der IP im Webinterface des Anbieters vergleichen.

Wartungsarbeiten übersehen?

Im Webinterface des Anbieters entdeckte ich dann einen interessanten Hinweis, dass heute Nacht, just zu der Zeit, als mein Blog ausfiel, Wartungsarbeiten angesetzt waren. Darin hieß es aber auch, die vServer würden danach wieder hochgefahren – der Server lief auch wieder, also war das auch nicht der Grund. Aber trotzdem machte ich noch einen Neustart per Webinterface.

Netzwerkkonnektivität prüfen

Also über die Webkonsole, VNC oder was auch immer der Provider anbietet, eine direkte Verbindung auf den Server herstellen, um die Netzwerkkonnektivität zu überprüfen (z.B. per PING/PING6 an google.de). Und hier lag in meinem Fall der erste Hase begraben. Ich hatte bei der Konfiguration von IPv6 in der /etc/network/interfaces den Eintrag „auto eth0“ auskommentiert, und vergessen ihn anschließend wieder hinzuzufügen. Diese Zeile ist dafür verantwortlich, dass die Netzwerkschnittstelle beim Reboot automatisch wieder hochgefahren wird. Also ein „service networking restart“ und ich konnte wieder einen PING und PING6 auf google.de absetzen. Ich hatte mich schon gefreut, das war aber nicht mein einziges Problem.

Webserver-Dienst prüfen

Da der Blog noch nicht wieder laufen wollte, ein „service nginx status“, und siehe da, der Dienst lief nicht. Kann ja mal passieren, dass er sich beim Systemstart aufgehängt hat. Also nginx-Dienst gestartet, und schon waren alle Probleme wieder behoben. Der HHVM-Dienst lief wie erwartet problemlos.

Fazit

Wenn man einen gewissen Workflow und ein wenig logisches Gespür an den Tag legt, ist so ein Server/Website-Ausfall schnell analysiert und behoben. Aber das setzt natürlich Grundkenntnisse mit den verwendeten Systemen und Technologien voraus. Dann ist jede Problemlösung eine Leichtigkeit.

GD Star Rating
loading...
Problemlösung der letzten Downtime, 2.0 out of 10 based on 2 ratings

Kommentar verfassen

%d Bloggern gefällt das: