Ausgangslage:

Durch häufige Änderungen an seinem umfangreichen Kundenportal und die ausufernden Releasekosten hat ein Unternehmen das Bereitstellungsintervall für neue Versionen des Systems stark reduziert. Das lässt oft nur wenig Zeit für Pre-Release-Tests. In der Folge werden die Kunden mit Programmfehlern konfrontiert, die die oft erst spät vom Unternehmen anhand von Kundenbeschwerden als solche erkannt werden. Ziel ist es, die Kundenerfahrung zu verbessern und die Zeit bis zur Erkennung eines Fehlers sowie die Anzahl der erlebten und gemeldeten Fehler zu reduzieren.

Problem:

Die Vielzahl an fachlichen- und technischen Protokollen ist über die verschiedenen Komponenten in mehreren Datacentern verteilt. Auch wenn ein Teil der Protokolle nach bekannten Schlüsselworten überwacht wird, werden diese nur selten zur Fehlererkennung herangezogen. Die Meldungen sind über die Komponenten hinweg schwer zu korrelieren und die Fehlerdiagnose oft kompliziert und aufwendig.

Angebot:

  • Fehlererkennung-, -korrelation und -tracing durch Hadoop-gestütztes Log-Mining
  • Laufzeitanalyse des Systems nach Anomalien und Exceptions
  • Implementierung eines Monitorings zur Überwachung verschiedener Middleware-Plattformen
Error Monitoring