ICT & Technik

Alltag eines Netzwerks (Teil 2 von 3): Flatternde Links und Auto-Negotiation

Der Administrator sollte nicht auf Glück und Zufall vertrauen müssen

Nur ein umfassendes Performance- und Fehlermanagement in Verbindung mit einer präzisen Fehler-Ursachenforschung (Root Cause Analysis) garantiert eine nahtlose Kommunikation auf allen Kanälen von E-Mail über Telefon bis zum Instant Messaging. Anhand von Beispielen aus dem Praxisalltag eines Netzwerkers wird diese These in einer dreiteiligen Serie belegt.
PDF Kaufen

Ausgangslage flatternde Links: Unternehmen ABC arbeitet mit einem Netzwerk aus 5000 Switches im Backbone-, Etagen- und Edge-Bereich. Im Etagenverteiler-Bereich der Niederlassung München liegt im Switch KHM ein Hardware-Defekt vor: Link 3 flattert, das heisst, er fährt innerhalb von Sekunden herunter und wieder hoch. Dieses Flattern geschieht unregelmässig und immer nur dann, wenn Lastspitzen vorhanden sind und besonders grosse Pakete zu transportieren sind. Damit ist das Fehlverhalten zeitlich nicht vorherseh- und reproduzierbar. Wegen des flatternden Links im Switch müssen Pakete erneut versendet werden. Dadurch kommt es zu Verzögerungen in der Kommunikation.

Weil der Link im Etagenverteiler arbeitet, sind viele Mitarbeiter vom Problem betroffen. Sie beschweren sich via Service Desk beim Netzwerk-Administrator, dass das Netzwerk nicht mit der gewohnten Performance arbeitet.

Ohne Root Cause Analysis

Der Administrator recherchiert zunächst, welche Applikationen die Mitarbeiter verwenden, um entsprechende Fehler ausschliessen zu können. Dann schaltet er sich via Telnet ins Netz und pingt die Switches der entsprechenden Arbeitsgruppe an. Da der Link in dem Moment nicht flattert, kann der Administrator zunächst keinen Fehler feststellen. Bei näherem Hinsehen erkennt er jedoch, dass die Uptime von Link 3 nur bei fünf Stunden liegt und dass damit vor fünf Stunden ein Fehler aufgetreten sein muss. Er weiss jedoch nicht, dass der Fehler bereits seit drei Wochen vorliegt – und seitdem die Kommunikation beeinträchtigt –, den Anwendern aber erst jetzt der «Kragen geplatzt» ist. Der Administrator beschliesst, Link 3 im Auge zu behalten und dessen Uptime regelmässig zu kontrollieren.

Er weiss aber selbst dann immer noch nicht, wie oft und wie lange der Link flattert, weil er sich immer nur punktuell aufschalten kann. Schliesslich informiert der Administrator seinen Chef, dass mit dem Link 3 im Switch KHM wahrscheinlich «irgendetwas» nicht stimmt. Der Chef fragt, ob auch andere Ports im Switch betroffen sind. Die entsprechende Analyse kostet den Administrator einen weiteren Tag Arbeitszeit.

Er und sein Chef wissen jetzt, dass nur Link 3 betroffen ist. Der Administrator kann aber Dauer und Häufigkeit des Fehlers nicht schwarz auf weiss mithilfe eines Reports nachweisen und seine aufwendige Analyse letztlich nur so zusammenfassen: «Ich glaube, der Port hat täglich mehrere Aussetzer.» Aufgrund dieser vagen Aussage beschliesst der Chef, das Problem zunächst auszusitzen.

Mit Root Cause Analysis

Die Fehlermanagement-Lösung Spectrum von CA sammelt automatisch sämtliche Informationen aus der Telekommunikations-Infrastruktur und meldet dem Administrator in Echtzeit einen flatternden Link. Er behält den Link im Auge und druckt am nächsten Tag einen Report aus. Dieser belegt, dass im Link 3 auf dem Switch KHM täglich 65 Fehler aufgetreten sind. Der Administrator erkennt den Fehler, bevor er die Arbeit der User beeinträchtigt. Er weiss, dass Link 3 ein Problem hat – und die anderen Links nicht – und kann Fehlerhäufigkeit und -dauer in einem Report genau belegen. Mit diesem Nachweis kann der Chef entscheiden, ob der Link oder je nach Bauart der ganze Switch ausgetauscht werden soll. Die Fehlermanagement-Lösung bietet darüber hinaus auch die Möglichkeit, Netzkomponenten nach ihrer Bedeutung für das Business zu priorisieren, was dem Chef dann die Entscheidung wesentlich erleichtert. Läuft beispielsweise der E-Mail-Verkehr auch über Switch KHM, ist eine sofortige Reparatur angebracht.