SKOOR-Objekte strukturieren
Die /root-Ansicht enthält nach der Erstinstallation von SKOOR Engine und Dashboards die folgenden Objekte:
Objekt | Funktion |
---|---|
| Vordefinierte Struktur für Kundenkonfigurationen. Dies ist normalerweise der Ort, an dem man arbeiten kann. |
| Eine Gruppe, die alle Dashboard-Objekte enthält (einschließlich ihrer Kacheln und Widgets) |
| Die Standardgruppe, in der SKOOR Engine Geräte, Jobs und Konfigurationselemente ablegt, um sich selbst und seine externen Kollektoren zu überwachen. |
| Ein besonderes Objekt, das alle SKOOR Engine Kollektoren enthält. Diese sammeln alle von den Jobs durchgeführten Messungen und leiten sie an den SKOOR Engine Server weiter. Der Standard- Kollektor heißt Kollektor -local und läuft auf dem SKOOR- Server . Externe Kollektoren werden verwendet, um Hosts in verschiedenen Netzwerken zu erreichen. Da Kollektoren nur Standardbenutzer mit gesetztem Kollektor Flag sind, werden sie in der Gruppe „Benutzer“ erstellt. Kollektoren haben einen Status: OK (grün) bedeutet, dass sie verbunden sind und derzeit Messdaten an den Server liefern, Major (rot) bedeutet, dass sie nicht verbunden sind. |
| Ein spezielles Objekt, das alle Alarmgeräte und Alarmgruppen enthält. |
| Ein spezielles Objekt, das alle Konfigurationsobjekte enthält. Standardmäßig enthält es Untergruppen für die folgenden Objekttypen:
Die folgenden Konfigurationselemente sind veraltet, können aber weiterhin auf dem System verfügbar sein:
Wenn beispielsweise irgendwo anders in der SKOOR Engine Baumstruktur ein Objekt vom Typ Zeitplan erstellt wird, wird es automatisch auch mit der Gruppe /root/Configurations/Schedule verknüpft. |
| Ein spezielles Objekt, das alle Vorlagenobjekte enthält. |
| Ein spezielles Objekt, das alle Benutzer- und Benutzergruppenobjekte enthält. |
| Ein spezielles Objekt, das alle Objekte enthält, die aus irgendeinem Grund ihre übergeordnete Verknüpfung verloren haben. Hier sollten sich keine Objekte darunter befinden. |
Empfohlene Objektstruktur
Neu erstellte Objekte können auf verschiedene Arten gruppiert werden. Sie können nach Standort (Stadt, Gebäude, Stockwerk, Unternehmenszweig) oder nach allem, was am besten zum Unternehmen oder zur Projektorganisation passt, gruppiert werden. Durch die offene Struktur der SKOOR Engine ist es sehr einfach, verschiedene Ansichten, beispielsweise nach Gerätetyp oder Zuständigkeit, zu erstellen. Die Objektstruktur variiert je nach den Erwartungen des Kunden an die Überwachung. SKOOR Engine kann ausschließlich für das technische Monitoring oder hauptsächlich als Overlay für Business- und IT-Service-Monitoring eingesetzt werden. Die meisten Setups stellen eine Kombination aus Infrastruktur- und Serviceüberwachung dar. SKOOR empfiehlt, solche Überwachungsprojekte mit einer Objektstruktur ähnlich der folgenden einzurichten:
/root
<Customer or project name>
Configurations
Graphs
Import / export
OPM
Schedule
...
Devices
Databases
EEM (End to end monitoring robot devices)
Network
Firewalls
Load balancers
Routers
Switches
Wireless
...
Other
Printers
Servers
Servers by location
London
lx203
lx204
Zürich
Servers by OS
Linux servers
Dev
Prod
lx203
ICMP
Disk space
CPU / Memory
Service slapd
lx204
ICMP
Disk space
CPU / Memory
Service slapd
Windows servers
...
Storage
Virtualization hosts
Reports
Business service 1 service report
Business service 1 service report monthly scheduler
Business service 1 service report weekly scheduler
Services
SLCs
SLA Business service 1 monthly
Business service 1
SLA Business service 1 yearly
Business service 1
SLOs
Business service 1
Function DB
DB Server 1
DB Server 2
Function LDAP (correlation rule: 1 of 2)
LDAP Server 1
ICMP on lx203
Disk space on lx203
CPU / Memory on lx203
Service slapd on lx203
LDAP Server 2
ICMP on lx204
Disk space on lx204
CPU / Memory on lx204
Service slapd on lx204
Function Network
DHCP
DHCP 1
DHCP 2
DNS
NTP
Function Webserver
...
IT service 1
Das obige Beispiel zeigt, wie man eine Grundstruktur für die Serviceüberwachung erstellen kann.
Geräteinventur
Der erste Schritt besteht normalerweise darin, die Geräteobjekte irgendwo unterhalb der Gerätegruppe zu erstellen. Hier wurde die Gerätegruppe zunächst nach Gerätefunktion (Server, Speicher ...) und dann entweder nach Unterfunktion oder anderen Kriterien strukturiert. Beispielsweise befinden sich die Linux-Server lx203 und lx204 beide in der Gruppe „Server nach Betriebssystem/Linux-Server/Produkt“ . Wenn man sie nach Standorten strukturieren möchte, ist das auch möglich. Zu diesem Zweck wurden die beiden Geräte gerade mit der Gruppe „Server nach Standort/London“ verknüpft. Die beiden Linux- Server unterhalb dieser beiden Gruppen sind identisch, haben dieselben Objekt-IDs und enthalten dieselben Messaufträge. Beispielsweise würde die Umbenennung von lx203 unter beiden übergeordneten Gruppen angezeigt. Das Löschen von lx203 würde es in beiden Gruppen löschen. Allerdings kann man die Verknüpfung auch einfach aufheben, anstatt sie zu löschen. Dann bleibt sie unter der anderen übergeordneten Gruppe.
Es gibt keine Korrelationsregeln für Geräte- oder Gruppenobjekte, daher ist es normal, dass jeder Job, der einen Nicht- OK Status hat, seinen Status an die Spitze des Gruppenbaums verschiebt. Nur der Dienstebaum (siehe unten) verwendet Korrelationsregeln, um zu steuern, wie Zustände nach oben verschoben werden.
Servicemodell
Die Untergruppe „Dienste/SLOs“ enthält die wichtigsten Dienstobjekte. Diese stellen den Status der modellierten Dienste dar. Darunter wird ein Modellbaum mithilfe von Service Level Objects (SLOs) erstellt, der die Festlegung von Korrelationsregeln für untergeordnete SLOs ermöglicht.
Nach dem Erstellen oder Importieren der Geräte und dem Erstellen der darunter liegenden Messaufträge können diese Aufträge unterhalb der Gruppe „Dienste“ verknüpft werden. Normalerweise sind nur einzelne Jobs mit SLOs verknüpft, es können jedoch auch ganze Geräte oder Gruppen mit SLOs verknüpft werden.
Unterhalb des obersten SLO Business Service 1 werden die Funktionen des Services modelliert. Das Modell sollte den Abhängigkeitsbaum von Business Service 1 darstellen. Beispielsweise ist die Funktion LDAP , von der dieser Dienst abhängt, so eingerichtet, dass nur einer der beiden LDAP-Server ausgeführt werden muss. In diesem Beispiel ist einer der LDAP-Server nicht funktionsfähig, da sein slapd- Dienst nicht ausgeführt wird. Der Service steht dem Kunden jedoch weiterhin zur Verfügung. Normalerweise wird diese Art der Einrichtung in SKOOR durch ein SLO mit einer Korrelationsregel (1 von 2) widergespiegelt. Die LDAP-Funktion hat den Status „Minor“ ( orange ), wenn ein LDAP- Server ausgefallen ist, und den Status „Major“ ( rot ), wenn beide ausgefallen sind. Der SLO Business-Dienst 1 ist so konfiguriert, dass nur die Hauptzustände der folgenden Funktionen berücksichtigt werden, sodass er in einem solchen Szenario im Zustand OK ( grün ) bleibt.
Der Modellbaum definiert, wie die Zustände von der Jobebene zur Servicefunktion und zum obersten Serviceobjekt übertragen werden.
Service Level Controller (SLCs)
Die Untergruppe „Dienste/SLCs“ enthält die Service Level Controller-Objekte. SLCs sind in der Regel mit dem obersten SLO eines Dienstes verknüpft (z. B. Business-Dienst 1) und messen die Erfüllung eines Service Level Agreements (SLA) basierend auf einem bestimmten Zeitraum und einem Verfügbarkeitsziel (z. B. 99,9 %). Das SLA, ein Vertrag zwischen einem Anbieter einer Dienstleistung und einem Verbraucher einer Dienstleistung, legt messbar vereinbarte Leistungs- und/oder Verfügbarkeitsziele fest.
Alarmierend
SKOOR Engine verwendet Alarmgeräteobjekte, um Änderungen im Zustand von Objekten unterhalb des Geräte- oder Dienstbaums zu erkennen und auf diese Änderungen zu reagieren (z. B. Senden einer E-Mail an die Person, die für das Gerät oder den Dienst verantwortlich ist). Diese Alarmgeräte können zu Alarmgruppen zusammengefasst werden. Im obigen Szenario gibt es normalerweise zwei alarmierende Pfade:
Technische Alarmierung
Messjobs unterhalb eines der Objekte in der Gerätebaumstruktur bemerken Fehler und ändern ihren Status abhängig von den für jeden Job konfigurierten Alarmgrenzen. Jede einzelne dieser Zustandsänderungen löst einen Alarm für den Job und das Gerät selbst aus. Diese technischen Alarme führen möglicherweise nicht zu Serviceausfällen, sind aber dennoch für das technische Personal relevant und müssen langfristig behoben werden. Um diese Alarme an die Verantwortlichen (per E-Mail) weiterzuleiten, werden Alarmgeräte oder Alarmgruppen an die einzelnen Geräte oder das /root/ angehängt./Gerätegruppe. Service alarmierend
Servicemanager haben in der Regel kein Interesse an technischen Störungen, die keinen Einfluss auf ihren Service haben. Wenn jedoch Messungen unterhalb des Servicebaums an ihr oberstes Serviceobjekt weitergegeben werden, möchten sie sofort benachrichtigt werden. Zu diesem Zweck werden den einzelnen Diensten unterhalb von /root/ separate Alarmgeräte bzw. Alarmgruppen zugeordnet./Dienste/SLOs. Wenn zum Beispiel die Der slapd- Dienst auf beiden LDAP-Servern wird nicht mehr ausgeführt, die Funktion LDAP wird rot und anschließend wird auch der Business-Dienst 1 rot. Das angehängte Alarmobjekt sendet eine E-Mail an den Servicemanager.
Berichte
Berichte definieren benutzerdefinierte Berichtsbeschreibungen, die manuell oder vom Berichtsplaner generiert werden können. Normalerweise wird für jeden Dienst ein einzelner PDF-Bericht konfiguriert. Es kann Statusverläufe oder SLC-Erfüllungsinformationen in Bezug auf den für den Bericht ausgewählten Zeitraum enthalten. Der Bericht selbst enthält die Konfiguration der Inhalte. Für jeden Bericht können ein oder mehrere Berichtsplaner angehängt werden, die regelmäßig eine Ausgabedatei basierend auf der Berichtskonfiguration generieren. Die Berichtsplaner können den generierten Bericht auch automatisch an eine oder mehrere E-Mail-Adressen senden.
Neben PDF können auch andere Berichte konfiguriert werden, z. B. CSV- oder XML-Berichte.