Zehn Gründe für Atlassian Opsgenie im Incident-Management

Seit Atlassian die Incident-Management-Software Opsgenie akquiriert hat, ist das System noch einmal um diverse Features und Möglichkeiten gewachsen. Für zahlreiche Organisationen ist Opsgenie die beste am Markt verfügbare Lösung - und zwar sowohl für Unternehmen, die gerade erst im Bereich der Always-on-Websoftware angekommen sind, als auch für erfahrene Teams, die mit ihren alternativen Tools nicht zufrieden waren. Zehn besonders gewichtige Gründe sprechen für Opsgenie.

1. Flexibilität für individuelle Workflows

Wenn es um die Reaktionen auf Störfälle geht, arbeiten keine zwei Teams auf dieselbe Weise. Die individuellen Prozesse hängen von vielen Faktoren und Einflüssen ab - Erfahrung, Quelle eines Vorfalls, Nutzdaten, Tageszeit des Vorfalls usw. Opsgenie bietet flexible Regelmechanismen, die es Teams erlauben, so zu arbeiten, wie es am besten zu ihnen und ihren Produkten passt. Wenn zum Beispiel ein Vorfall nach Geschäftsschluss auftritt, kann Opsgenie im dringenden Fall alle Teammitglieder alarmieren oder die Alarmierung bis zum Dienstbeginn verzögern, falls die Priorität gering ist. Diese Flexibilität stellt sicher, dass jeder Alarm genau das Maß an Aufmerksamkeit erhält, das er verdient.

2. Nahtlose Integration mit anderen Atlassian-Produkten

Opsgenie lässt sich zweigleisig mit anderen Atlassian-Produkten verbinden, sodass Teams eine durchgehende Incident-Management-Lösung etablieren können:

  • Es ist möglich, aus Opsgenie heraus Vorgänge in Jira Software oder Jira Service Desk zu erstellen, damit wichtige Aufgaben dokumentiert und nachverfolgbar sind.
  • Neue Vorgänge in Jira oder Jira Service Desk können Alarme und Eskalationen in Opsgenie anstoßen und so die Reaktionszeiten verkürzen.
  • Die Statusinformationen von Drittsystemen, die mit Statuspage überwacht werden, lassen sich in Opsgenie einbinden, sodass eine zentrale Übersicht über den Zustand aller wichtigen Tools entsteht. Wenn in einem dieser Dienste eine Störung auftritt, kann Opsgenie direkt die entsprechende Bereitschaftsperson benachrichtigen.
  • Während eines Vorfalls kann Opsgenie automatisch Änderungen an Statuspage posten und Kunden dadurch schneller und transparenter über den aktuellen Status quo in Kenntnis setzen.

3. Sinnvollere Alarme für schnellere Reaktionen

Dank der tiefen Integrationsmöglichkeiten von Opsgenie können Nutzer Alarmnachrichten unabhängig von ihrer Quelle nach eigenen Wünschen umformatieren und verständlicher gestalten. Ein gutes Beispiel ist ein exemplarischer AWS-Cloudwatch-Alarm:

Maximum ApproximateNumberOfMessagesVisibleGreaterThanOrEqualtoThreshold 4.0 for QueueName Production

Diese Meldung lässt sich umformatieren und leichter lesbar machen:

The Production Message Queue has more than three messages in it.

Diese angepasste Nachricht kann für alle Benachrichtigungen genutzt werden (Sprache, SMS, E-Mail, mobile Push-Benachrichtigungen). Zusätzlich kann das Team seinen Alarmen Tags und optionale Felder hinzufügen sowie Charts, Logs, Automatisierungshandbücher usw. anhängen, um mehr Kontext herzustellen.

4. Rollenbasierter Zugriff für eine leichtere Skalierung

Opsgenie versetzt Teams in die Lage, ihre eigenen Planungen, Regeln und Richtlinien zu erstellen. Sie müssen dabei nicht auf spezifische Account-Manager warten oder mit provisorischen Workarounds experimentieren, sondern können individuelle Rollen mit granularen Berechtigungen anlegen. Diese Möglichkeiten stellen die Weichen für eine reibungsarme, zeitsparende Skalierung im Unternehmen.

Opsgenie Rollen

5. Durchgehendes Monitoring mit Heartbeats

In einer Entwicklungs-/IT-Umgebung passieren Fehler. Wie können Teams mit Bestimmtheit sicher sein, dass ihre Überwachungssysteme ihre Arbeit korrekt tun? Opsgenie Heartbeats gewährleistet, dass Monitoring-Tools aktiv und miteinander verbunden sind und dass individuelle Aufgaben wie geplant fertiggestellt werden. Wird das Ausbleiben eines Signals in einem bestimmten Zeitfenster festgestellt, kennzeichnet Opsgenie das Problem sofort.

6. Sichere Verbindung mit On-premise-Applikationen

Es ist nicht ungewöhnlich, dass Teams einen Mix aus selbst gehosteten und Cloud-basierten Monitoring- und ITSM-Tools verwenden. Die Verknüpfung dieser Systeme geht dann oft damit einher, Firewall-Verbindungen zu öffnen und den Host-Server dem öffentlichen Internet auszusetzen. Das birgt Risiken, die die meisten Unternehmen lieber vermeiden möchten. Als Folge bleiben die On-premise-Tools Silos und Nutzer sehen sich gezwungen, manuelle Aktualisierungen zwischen Systemen vorzunehmen und Daten hin und her zu kopieren.

Opsgenie löst diese Herausforderung mit dem Opsgenie Edge Connector (OEC), der sichere und nahtlose Verbindungen über On-premise-Systeme erlaubt, inklusive Jira, Nagios, Solarwinds und weiteren. Alle Verbindungen sind ausgehend, sodass keine risikoreichen Eingangs-Ports und Protokolle dem Internet ausgesetzt werden müssen. Außerdem können individuelle Skripte via OEC angetriggert werden, was Alarm-Responder in die Lage versetzt, schnell Executables auszuführen, die bei der Problemlösung und bei automatisierten Wiederherstellungs-Maßnahmen unterstützen.

7. Systematische Berichte für kontinuierliches Lernen

Wenn Störfälle auftreten, kann es chaotisch und stressig zugehen. Doch gleichzeitig entsteht aus jedem Vorfall die Chance zu lernen. Opsgenie bildet Alarme und Störungen in ihrem gesamten Lebenszyklus ab und aggregiert sie zu hilfreichen Berichten. Diese Reports helfen dem Team nicht nur, die Quelle des Alarms zu identifizieren, sie unterstützen auch bei der Einschätzung der Team-Performance und der Verteilung der Bereitschafts-Arbeitslast - und zwar ohne dass Nutzer die Anwendung verlassen müssen. Unter anderem bietet Opsgenie diese Analysefunktionen:

  • operative Effizienz
  • monatlicher Überblick
  • Nutzer- und Teamproduktivität
  • Verteilung der Bereitschaftsarbeit
  • Zustand von Diensten und Infrastruktur
  • Analysen zur Nachbereitung
  • Konferenzteilnahmen und Effizienzmetriken

Dank der genutzten Looker-Technologie lassen sich die Opsgenie-Berichte filtern, um den Fokus auf bestimmte Teilaspekte zu richten. Nutzer können mit einem Klick in die zugrundeliegenden Daten einsteigen.

8. Opsgenie Actions für eine beschleunigte Wiederherstellung

Opsgenie ActionsTeams, die Always-on-Dienste betreiben, müssen schnell auf Herausforderungen reagieren, um zu vermeiden, dass kleine Probleme zu großen Ausfällen anwachsen, die die Kunden beeinträchtigen. Oft umfasst die Wiederherstellung ein bekanntes Arsenal an systemrelevanten oder infrastrukturellen Aktionen, doch in der Regel sind hierfür manuelle, repetitive Interventionen erforderlich. Die Features von Opsgenie Actions bieten einen einfachen Weg, um diese manuellen Aufgaben direkt aus der Opsgenie-Konsole oder der mobilen App heraus zu automatisieren.

Beispielsweise kann Opsgenie Actions Automatisierungsdokumente des AWS-Systemmanagers ausführen, um AWS-Ressourcen anzupassen und beispielsweise eine EC2-Instanz zu starten. Wenn Parameter erforderlich sind, kann Opsgenie Actions den Nutzer via Liste, Checkbox-Auswahl oder Freitextfeld zur Eingabe auffordern. Falls das Team andere Automaisierungs-Tools verwendet, ist das auch kein Problem: Opsgenie Actions integriert via REST mit einer großen Bandbreite an Drittanbieter-Software.

9. Datensicherheit durch Edge-Verschlüsselung

Vor- und Ausfälle sind anstrengend genug. Dann ist es gut, wenn man sich nicht zusätzlich noch um die Datensicherheit sorgen muss - der Opsgenie-Edge-Verschlüsselung sei Dank. Sie schützt die Kommunikation der Alarm- und Vorfallsinformationen, während sie auf dem Weg zum und vom Opsgenie-Cloud-Dienst ist. Dabei bleibt die Kontrolle über die Schlüssel für die Chiffrierung und Dechiffrierung sensibler Informationen stets beim Team.

10. Kostenfaktor

Opsgenie ist preisgünstig. Organisationen, die sich für Opsgenie entscheiden, zahlen drei- bis fünfmal weniger als für alternative Produkte - und mit der Skalierung des Unternehmens summiert sich auch die Kostenersparnis auf (siehe die Grafik unten). Besonders cool an Opsgenie ist die unbegrenzte Verfügbarkeit kostenfreier Stakeholder-Lizenzen im Enterprise-Plan. Damit ist es möglich, wirklich alle relevanten Personen im Unternehmen (und darüber hinaus) zu integrieren und ein wirklich transparentes, für alle sichtbares Incident-Management zu etablieren.

Opsgenie Kosten

Wir sind Ihr Partner für Atlassian Opsgenie

Möchten Sie mehr über Atlassian Opsgenie erfahren? Würden Sie gerne direkt über den Aufbau eines strukturierten Alerting-Prozesses für konkrete Anwendungen in Ihrem Unternehmen sprechen? Dann melden Sie sich bei uns: Wir sind Atlassian Platinum Solution Partner und unterstützen Sie gerne bei allen Aspekten eines systematischen Incident-Managements in Ihrer Organisation.

Weiterführende Infos

Atlassian Opsgenie: Einführung zu Nutzenversprechen, Anwendungsfällen und Funktionen
Anforderungen an modernes Incident-Management
Atlassian Opsgenie: neue Oberfläche, Incident-Timeline, Postmortem-Berichte, Statuspage-Integration
Atlassian-Lizenzen bei //SEIBERT/MEDIA kaufen – alle Vorteile