Host Tracker: Benachrichtigung bei Standortwechsel nur für Unternehmen

Veröffentlicht: Alex Shashenko 2014-03-09 alle Artikel | Glossar | FAQ


Natürlich ist eine der obersten Prioritäten für jeden Site-Manager, sicherzustellen, dass die Ressource reibungslos läuft. Allerdings, periodische «downs » Website-Abstürze sind unvermeidlich, und die Hauptsache hier — zu verfolgen und das Problem in der Zeit zu lösen.Natürlich ist niemand in der Lage, die Leistung der Website rund um die Uhr zu überwachen. Darüber hinaus kann die Ressource in einer anderen Region nicht verfügbar sein, und dieser Manager wird es nicht in irgendeiner Weise zu verfolgen.Und um diese Probleme zu lösen, wurde der Dienst HostTracker entwickelt, der die Verfügbarkeit der Website überwacht. Er erfasst den «Ausfall» der Website, analysiert das Problem und sendet einen Alarm an den Administrator oder die Ressourcenverwaltung.Es liegt auf der Hand, dass niemand einen Fehlalarm gebrauchen kann, und das Prinzip «besser sicher als traurig&— ist in diesem Fall nicht die beste Strategie. Deshalb ist es bei der Arbeit des Dienstes notwendig, bei der Beurteilung von Problemen äußerst genau und angemessen zu sein.

HostTrekker hat daher eine Reihe kritischer Aufgaben: die rechtzeitige Verfolgung und Benachrichtigung des Kunden, die Vermeidung von Fehlalarmen und die Berechnung der Uptime auf der Grundlage von Best-Case- und Worst-Case-Szenarien.

Wie protokolliert man eine direkte «Drop» Ressource?

Welches ist das beste und welches das schlechteste Szenario?
Sobald ein Kunde eine Website hinzufügt, sendet das System in einem festen Intervall zwischen einer Minute und einer Stunde eine Anfrage aus. Dabei wird die Überprüfung von unabhängigen Servern durchgeführt, die über die ganze Welt verstreut sind, um eine geografisch verteilte Überwachung durchzuführen. Zurzeit gibt es mehr als fünfzig solcher Server. Ein bestimmter Agent wird nach dem Zufallsprinzip ausgewählt.

instant check

 Wenn ein Validierungsfehler zurückgegeben wird, wird ein erneuter Test für fünf bis sieben weitere unabhängige Agenten durchgeführt. Wenn in den meisten Fällen das Problem bestätigt wird, gilt die Ressource als «gefallen». Wenn die anderen Agenten keine Probleme festgestellt haben, wird davon ausgegangen, dass das lokale Problem bei einem bestimmten Agenten aufgetreten ist. Wenn festgestellt werden muss, ob ein Standort in Betrieb ist, wird derselbe Algorithmus angewandt. Dadurch wird die Möglichkeit von Fehlalarmen praktisch ausgeschlossen, was den Seelenfrieden der Dienstkunden schützt. Die Unerreichbarkeit der Ressource wird erst nach mehreren Überprüfungen in einem bestimmten Intervall festgestellt.

Natürlich ist es unmöglich, hundertprozentig zu garantieren, in welchem Zustand sich die Seite zwischen den Überprüfungen befand. Allerdings liegt mit der höchsten Wahrscheinlichkeit in dem Intervall zwischen den Überprüfungen, die einen Fehler ergeben haben, ‖amp; down‖. Wenn jedoch nach einem Fehler die Wiederherstellung beginnt, kann die Ressource zwischen den Prüfungen noch funktionieren. Dieses Szenario ist eigentlich die Grundlage für die optimistische Berechnung der Betriebszeit. Die Variante des «liegenden» Standorts zwischen den Prüfungen wird zum Ausgangspunkt für die Berechnung eines pessimistischen Szenarios.
Das optimistische Szenario wird bei der statistischen Analyse berücksichtigt, aber bei der Benachrichtigung der Kunden werden die Daten für das pessimistische Szenario angegeben.
Auf diese Weise erhält der Kunde dank der Berechnung aller Varianten und einer sorgfältigen, umfassenden Überwachung nur im Falle wirklicher Probleme rechtzeitige Benachrichtigungen und kann sich ein vollständiges und zuverlässiges Bild des Geschehens machen.


Über den Autor

Oleksii Shashenko
Chief Communications and Technology Officer von HostTracker. Alex ist seit den Anfängen des Unternehmens Teil des Teams. Seine Arbeitsschwerpunkte sind Geschäftsberichte, Analysen von Datenbankstatistiken und Systemadministration. Alex kümmert sich auch u
Loading...