Transparenz und Vorbeugung vor bösen Überraschungen: Betriebspakete für Atlassian-Anwendungen mit Monitoring

Pamela Winter erwacht aus einem traumlosen Schlaf. Ein schneller Blick auf die Uhr. Reichlich Zeit bis zum Meeting um halb zehn.

Am Küchentisch bei einer Tasse Kaffee nimmt sie ihr Handy und öffnet ihre erste schnelle News-Quelle des Tages: Twitter. In ihre Mails schaut sie rein, wenn sie im Büro ist. Die sind in ihrem Unternehmen eh nicht mehr so wichtig, seit sie mit Atlassian-Software arbeiten.

Während sie am Kaffee nippt, scrollt sie auf dem Smartphone durch die neuesten Tweets, vergibt ein, zwei Likes – und mittendrin in der Timeline ist da die übliche Twitter-Funktion "Wem folgen?", also vom Algorithmus generierte Follow-Empfehlungen.

Nanu, Theo Schroeder? Den kenne ich tatsächlich, glaube ich. Ist das wirklich der Kollege aus der Firma? Pamela klickt sich auf das Profil des Nutzers: Ja, das ist er, letzte Woche hat sie beim Mittag mit Theo zusammengesessen. Was twittert der denn so? Lohnt es sich, dem zu folgen?

Pamelas Blick geht vom Smartphone ruckartig nach oben. Nur mit Mühe schafft sie es, den letzten Schluck Kaffee nicht rauszuprusten. Dann schaut sie nochmal zum Handy. Ganz klar, dieser Tweet ist von heute früh. Das darf doch wohl nicht wahr sein!

Hektisch schaut sie auf die Uhr: gleich halb neun. Was, zum Geier, ist da los? Sind die Teams jetzt etwa seit fast 90 Minuten ohne eines ihrer wichtigsten Systeme – und Pamela als eine der IT-Verantwortlichen weiß davon nichts? Ob inzwischen ein Kollege aus ihrem Team an der Sache dran ist?

Was jetzt? Erstmal losfahren zum Büro! Schnelle Maßnahmen schießen ihr durch den Kopf: Die Kollegen anrufen und zusammentrommeln! Was geht bei dem Hosting-Dienstleister vor – hat da schon jemand Kontakt und macht Druck?

Verdammt, ob Stefan Stromberg, dieser Arsch, schon drüben bei der Geschäftsleitung auf der Matte steht und denen in diesem Moment die Produktivitätskosten in Minuten auf Heller und Pfennig vorrechnet? Oh Mann...

Pamelas Morgen ist gelaufen. Jetzt muss sie mit ihrem Team rasch alle Hebel in Bewegung setzen, damit Jira wieder läuft, das die Leute in der Firma brauchen. Ein schönes Schlamassel!


Pamela Winter erwacht aus einem unruhigen Traum. Ein schneller Blick auf die Uhr. Reichlich Zeit bis zum Meeting um halb zehn.

Wahrscheinlich macht sie sich zu viele Gedanken. Schön ist es jedenfalls nicht, dass sie die Arbeit manchmal bis in den Schlaf verfolgt. Vielleicht sollte sie mal eine Woche wegfahren, um dann frisch und mit durchlüftetem Kopf wieder ans Werk zu gehen.

Was hat sie da eben für einen Quatsch geträumt? Der Traum verblasst schon, aber grau erinnert sie sich noch: Jira down, Stillstand – und keiner wusste Bescheid; nur durch Zufall hat Pamela von dem Problem erfahren. Na, das wäre was! Bestimmt auch ein gefundenes Fressen für Stefan Stromberg, diesen Arsch.

Schmunzelnd sitzt sie am Küchentisch und nimmt versonnen einen Schluck Kaffee. Gut, dass so ein Malheur bei uns nicht passieren wird. Klar kann Jira mal down sein. IT-Systeme sind komplex. Problemquellen lassen sich zwar minimieren, aber nicht vollständig eliminieren. Man kann alle erdenklichen Sicherheitsvorkehrungen treffen – und am Ende führt ein Tippfehler zu einer Kettenreaktion, die gefühlt die halbe Cloud außer Gefecht setzt.

Wenn bei Pamela im Unternehmen ein Atlassian-System technische Probleme hat, gibt es Tools und Leute, die darüber im Bilde sind. Für Jira gibt es ein umfangreiches Betriebspaket des Hosting-Dienstleisters, das eine kontinuierliche Überwachung beinhaltet: Ein zentrales Monitoring-System beobachtet die Anwendung rund um die Uhr. Dabei bestimmen Service Level Agreements den Leistungsumfang und die Servicezeiten gemäß der spezifischen Anforderungen.

Die Komponenten und Metriken, die vom Monitoring erfasst werden, sind diese:

  • Web-Server - Verfügbarkeit der Anwendung, gleichzeitige Verbindungen, Ablauftermin des SSL-Zertifikats
  • Atlassian - Java-Heap-Speicher, Threads und offene Dateien
  • Datensicherung - Lokale ZFS-Snapshots, Spiegelung auf Backup-Server
  • System - CPU-Auslastung, Festplattenspeicher, Internetzugriff, Zeitdienste, Mail-Versand

Metriken werden teils alle zehn Sekunden abgefragt, damit der zeitlichen Verlauf und die Entwicklung der entsprechenden Werte bei der Problemlösung verfügbar sind. So sieht eine exemplarische Ansicht der zusammenlaufenden Daten aus:

Seit es dieses Plus an Transparenz und Sicherheit gibt, ist auch eine kurze Reaktionszeit bei Störungen gewährleistet. Wird ein Problem festgestellt, werden die Systemadministratoren des Dienstleisters (innerhalb der Servicezeit gemäß SLA) über kritische Vorfälle informiert und beginnen selbständig mit ihrer Behebung.

Außerdem geht eine entsprechende Information natürlich auch an den Kunden, also Pamelas Team, heraus, sodass Pamela nicht erst dann etwas vom Problem erfährt, wenn sie um halb zehn im Büro ankommt oder durch Zufall auf die Information stößt. Sie oder ein Ansprechpartner aus ihrem Team ist im Bilde und steht in Kontakt mit dem Admin-Team.

Pamela schüttelt den Gedankengang ab und öffnet die Twitter-App. Mal schnell noch sehen, was es Neues gibt. Beim Scrollen empfiehlt Twitter ihr zwischendurch Leute, denen sie vielleicht folgen möchte. Aha, Theo Schroeder - der Name sagt ihr was und das Profilgesicht kommt ihr auch bekannt vor. Sie hat doch letzte Woche erst mit dem beim Mittagessen zusammengesessen.

Aber da ist noch etwas. Kurz verspürt Pamela dieses merkwürdig irritierende Déjà-vu-Gefühl. Ihr ist, als hätte sie gerade erst mit Theo zu tun gehabt.

Naja, wie auch immer. Kurzerhand klickt sie auf Theos Profil und liest den letzten Tweet:

Oje, die Armen, denkt Pamela. Irgendwas ist ja immer. Aber sie ist sicher, dass schon jemand aus dem internen Orgateam an dem Kaffeeproblem dran ist. Und besser die Kaffeemaschine als Jira, jedenfalls für Pamela, ihr Team und die Firma.

Ihr Partner für den Betrieb Ihrer Atlassian-Software

Für den sicheren und zuverlässigen Betrieb Ihrer Atlassian-Anwendungen bietet //SEIBERT/MEDIA attraktive Betriebspakete nach Ihren Anforderungen an - mit SLAs, lückenlosem Monitoring, systematischem Backup-Konzept. Wir sind Atlassian Platinum Solution Partner: Unsere erfahrenen technischen Teams kennen die Besonderheiten von Atlassian-Systemen genau und haben die Betriebs- und Hosting-Pakete auf diese spezifischen Anforderungen hin zugeschnitten. Möchten Sie mehr erfahren? Unsere Infothek bietet ausführliche Infos zu unseren systemadministrativen Atlassian-Leistungen. Haben Sie Fragen? Dann melden Sie sich bei uns: Wir beraten Sie gerne!


Mehr über die Creative-Commons-Lizenz erfahren