Antes de comenzar

Conceptos

Antes de comenzar a utilizar esta herramienta y para facilitar la comprensión de este Manual de Usuario, se incluye a continuación una explicación sencilla de algunos conceptos clave en el entorno de WOCU-Monitoring.

Activos (Assets) en WOCU

Todos los elementos monitorizados en WOCU-Monitoring pueden ser llamados genéricamente Activos (Assets). Este término incluye la totalidad de elementos sin hacer distinción en sus diferentes tipos (Dispositivos, Servicios, Contactos, Grupos de Dispositivos, Procesos de Negocio, etc.).

Tipos de Activos en WOCU-Monitoring

Término

Icono

Descripción

Dispositivo (Host)

../../_images/2_030c_aggregator_realm_assets_hosts-logo_0-36.png

Un Dispositivo es cualquier elemento conectado a la red (PC, servidor, firewall, electrónica de red, etc) y que es monitorizado por WOCU-Monitoring para supervisar su disponibilidad, calcular su estado y registrar sus eventos.

Grupo de Dispositivos (Host Group)

Un Grupo de Dispositivos es una agrupación lógica de unos determinados Dispositivos que se realiza, para extraer en WOCU-Monitoring, estadísticas y datos de disponibilidad del conjunto más fácilmente.

Servicios (Services)

../../_images/2_030e_aggregator_realm_assets_services-logo_0-36.png

Un Servicio es cada una de las comprobaciones que WOCU-Monitoring realiza en un Dispositivo, a las que asociará un estado tras el examen de cada una de ellas. Gracias a estas comprobaciones se puede hacer un análisis más profundo en términos de disponibilidad.

Dispositivos de Procesos de Negocio (BP Hosts)

../../_images/2_030d_aggregator_realm_assets_bphost-logo_0-36.png

Un Dispositivo de Procesos de Negocio es una definición lógica que crea el usuario en WOCU-Monitoring, que agrupa uno o más Dispositivos lógicos y/o físicos, es decir otros Dispositivos de Procesos de Negocio y/o Dispositivos físicos.

Una vez definido, esta definición tendrá la misma entidad que el resto de Dispositivos monitorizados en WOCU-Monitoring apareciendo en sus inventarios de Activos. Así mismo, el sistema monitorizará este activo lógico, para determinar su estado, a través de unas reglas que aplicará al mismo (Reglas de Negocio (Business Rule)).

Servicios de Procesos de Negocio (BP Services)

../../_images/2_030f_aggregator_realm_assets_bpservices-logo_0-36.png

Un Servicio de Procesos de Negocio es una definición lógica que crea el usuario en WOCU-Monitoring, que agrupa uno o más Servicios definidos en Servicios lógicos y/o físicos.

Reinos (Realms) en WOCU

Los Reinos son sistemas de monitorización completamente independientes gestionados en WOCU-Monitoring. La tipología de Reinos viene dada por la manera en que cada Reino se haya constituido.

Cada Reino dispondrá de sus propios activos monitorizados, sobre los cuales la herramienta mantendrá de manera aislada inventarios, alarmas, registro de eventos, etc.

Tipos de Reinos en WOCU-Monitoring

Tipología

Icono

Descripción

Reino estándar

../../_images/realm-standard-icon.jpg

Este tipo de Reinos se constituyen por Activos configurados de manera manual por el Administrador de WOCU. Los elementos se seleccionan manualmente y entran a formar parte de uno de estos sistemas de monitorización. La ausencia de un icono específico de tipo, informa al usuario que está ante un Reino estándar.

Hostgroups

../../_images/realm-HG-icon.jpg

Una manera rápida y sencilla de crear un Reino y dotarlo de Activos es asociarlo a uno o varios Grupos de Dispositivos. En esta ocasión el Administrador de WOCU incluirá en el Reino creado los elementos que constituyen ya uno o varios Grupos de Dispositivos (Hostgroups), que son conjuntos lógicos de elementos que agrupan en su seno distintos Activos.

Multirealm

../../_images/multirealm-icon.jpg

Reino resultado de incluir en su seno otros Reinos ya existentes, es decir, se crea una agregación de Reinos. En esta ocasión, el Administrador de WOCU en lugar de Activos individuales o grupos de Activos puede directamente incluir sistemas de monitorización completos agregando sus integrantes para crear un Reino mayor.

Estados de los Activos en WOCU

Cada uno de los activos monitorizados en WOCU-Monitoring tiene siempre asociado un estado que define su situación, desde el punto de vista de la disponibilidad, a lo largo del tiempo. Es decir, el estado de un activo es algo dinámico. WOCU-Monitoring se encarga, a través de sus diversas comprobaciones, de evaluar la situación presente de cada activo para realizar un cálculo del estado del mismo y actualizarlo si hubiera un cambio.

Es importante comprender bien este concepto pues los estados están presentes de manera recurrente en listados, inventarios, gráficas e informes de WOCU-Monitoring.

En WOCU-Monitoring existen cuatro estados básicos:

Tipos de Estados en WOCU-Monitoring

Tipología

Icono

Descripción

Down/Critical

../../_images/2_001_aggregator_status-down_0-60.png

El Estado Down/Critical es el que indica una pérdida total de la disponibilidad del activo, por tanto su gravedad es máxima. El término Down se utiliza para describir el estado de los Dispositivos que han perdido completamente la disponibilidad, mientras que Critical es el término equivalente que se utiliza para los Servicios cuando uno de éstos se vuelve indisponible o bien cuando algún parámetro del Servicio monitorizado supera un cierto umbral (el valor de este umbral es establecido en la configuración del dispositivo cuando este es dado de alta).

En WOCU-Monitoring, el color rojo y/o el icono de la flecha que apunta abajo se asocian al Estado Down/Critical.

Warning

../../_images/2_002_aggregator_status-warning_0-60.png

El estado Warning se aplica sólo a los Servicios. Indica algún tipo de funcionamiento anómalo, si bien el activo aún presta servicio, por lo que su gravedad es menor que estado Critical.

En WOCU-Monitoring, el color amarillo y/o el icono de la exclamación se asocian al estado Warning.

Unreacheable/Unknown

../../_images/2_003_aggregator_status-unknown_0-60.png

El estado Unreacheable/Unknown informa de una pérdida de contacto con el activo. No se conoce si el activo aún presta servicio o no, por lo que este estado indica cierta incertidumbre sobre la situación real que merece tenerse en consideración. En ese sentido la gravedad es, a priori, más baja que las anteriores. El término Unreacheable se utiliza para describir el estado de los Dispositivos con los que WOCU-Monitoring ha perdido completamente la conectividad, si bien no se ha podido verificar una pérdida total de servicio por parte de éste. Unknow es el término equivalente que se utiliza para los Servicios.

En WOCU-Monitoring, el color azul y/o el icono de la interrogación se asocian al estado Unreacheable/Unknown.

Up/OK

../../_images/2_004_aggregator_status-ok_0-60.png

El estado Up/OK es el estado operativo normal de un activo cuando está prestando su servicio. Por tanto, es el estado deseable para todos los elementos monitorizados y cualquier cambio de este Estado a otro se considera una anomalía que tendrá que ser atendida. El término Up se utiliza con Dispositivos para describir su estado normal de funcionamiento, mientras que OK es el término que se emplea para los Servicios a la hora de describir este funcionamiento normal.

En WOCU-Monitoring, el color verde y/o el icono del tick se asocian al estado Up/OK.

Alarmas y Eventos en WOCU

Otros dos conceptos muy ligados a las tareas de monitorización y operación de redes y sistemas son los conceptos de alarmas y eventos. Es importante comprender bien su significado y diferencia a la hora de utilizar WOCU-Monitoring en sus tareas diarias.

Término

Descripción

Alarmas (Problems)

Las Alarmas son mensajes de alerta generados por WOCU-MOnitoring indicando un estado anormal para un Dispositivo o Servicio. La herramienta realiza distintas tareas de monitorización para cada uno de los elementos monitorizados destinadas a determinar en todo momento el estado para cada uno de ellos. Un cambio desde el estado Up/OK a cualquier otro estado desencadenará el lanzamiento de una Alarma en WOCU-Monitoring. Complementariamente WOCU-Monitoring ofrecerá información adicional al Estado para indicar la naturaleza de la anomalía detectada.

Eventos (Events)

Los Eventos son mensajes sobre el funcionamiento y operación de los distintos Dispositivos monitorizados que son recolectados y analizados por WOCU-Monitoring. Los Eventos son utilizados por WOCU-Monitoring como un elemento más en el cálculo del estado de los activos y además ofrecen la oportunidad de analizar las causas o circunstancias de una incidencia, puesto que un buen análisis técnico debe estar siempre respaldado por los mensajes de log de los Dispositivos implicados.

Reglas de Negocio (Business Rule)

La monitorización de procesos de negocio proporciona una visión detallada del estado de un servicio, fundamentada en la representación de las interrelaciones y el estado de los distintos componentes necesarios para su correcto funcionamiento. La creación de reglas es altamente flexible y puede ser tan compleja como abarcar desde la capa de hardware, sistema operativo, red y aplicaciones, hasta las experiencias de usuario. También puede ser simplificada, basándose simplemente en los estados de un dispositivo.

El sistema es capaz de monitorizar Procesos de Negocio de Dispositivos y Servicios a través de Business Rules (en adelante BR). Se trata de una función lógica que se aplica al estado de un conjunto de activos dando como resultado un estado de alarma. Estas reglas son una parte integral dentro de la gestión y monitorización de estos procesos.

../../_images/2_041b_aggregator_realm_assets_modal-host-BP-trace-ok_0-43.png

Los Procesos de Negocio que estén definidos por reglas integradas únicamente por Dispositivos, tendrán el status de Proceso de Negocio de Dispositivos (BP Hosts) y aparecerán identificados con el siguiente icono:

../../_images/2_030d_aggregator_realm_assets_bphost-logo_0-36.png

Y por ende, podrán generar alarmas de tipo:

Tipología

Icono

Descripción

Down

../../_images/2_001_aggregator_status-down_0-60.png

Indica una pérdida total de la disponibilidad del Dispositivo, por tanto su gravedad es máxima.

Unreacheable

../../_images/2_003_aggregator_status-unknown_0-60.png

Informa de una pérdida de contacto con el Dispositivo. No se conoce si el activo aún presta servicio o no, por lo que este estado indica cierta incertidumbre sobre la situación real que merece tenerse en consideración. En ese sentido la gravedad es, a priori, más baja que las anteriores.

UP

../../_images/2_004_aggregator_status-ok_0-60.png

El estado UP es el estado operativo normal de un activo cuando está prestando su servicio sin incidencias. Por tanto, es el estado deseable para todos los elementos monitorizados y cualquier cambio de este Estado a otro se considera una anomalía que tendrá que ser atendida.

De igual manera, los Procesos de Negocio que estén definidos por reglas integradas únicamente por Servicios tendrán el status de Proceso de Negocio de Servicios (BP Services) y aparecerán identificados con el siguiente icono:

../../_images/2_030f_aggregator_realm_assets_bpservices-logo_0-36.png

Y por ende, podrán generar alarmas de tipo:

Tipología

Icono

Descripción

Critical

../../_images/2_001_aggregator_status-down_0-60.png

Indica una pérdida total de la disponibilidad del Servicio, por tanto su gravedad es máxima. Se utiliza cuando uno de éstos se vuelve indisponible o bien cuando algún parámetro del Servicio monitorizado supera un cierto umbral (el valor de este umbral es establecido en la configuración del dispositivo cuando este es dado de alta).

Unknown

../../_images/2_003_aggregator_status-unknown_0-60.png

Informa de una pérdida de contacto con el activo. No se conoce si Servicio está operativo o no, por lo que este estado indica cierta incertidumbre sobre la situación real que merece tenerse en consideración. En ese sentido la gravedad es, a priori, más baja que las anteriores.

OK

../../_images/2_004_aggregator_status-ok_0-60.png

El estado OK es el estado operativo normal de un activo cuando está prestando su servicio. Por tanto, es el estado deseable para todos los elementos monitorizados y cualquier cambio de este Estado a otro se considera una anomalía que tendrá que ser atendida.

Warning

../../_images/2_002_aggregator_status-warning_0-60.png

El estado Warning se aplica sólo a los Servicios. Indica algún tipo de funcionamiento anómalo, si bien el activo aún presta servicio, por lo que su gravedad es menor que estado Critical.

Antes de crear una BR, debemos tener desplegados los Packs de Monitorización pertinentes para monitorizar los Dispositivos o Servicios que componen el entorno. Con estos datos y aplicando los operadores lógicos anteriormente comentados, se construyen las BR.

A continuación, se evaluará el estado de cada elemento integrante de la BR. Después, tomando en consideración estos estados individuales y los operadores lógicos que vinculan y relacionan los elementos del Proceso de Negocio, el sistema determinará su estado de disponibilidad propio.

Atención

El sistema sólo considera estados de tipo HARD para determinar el estado general del activo o nodo. Por lo tanto, cualquier cambio interno de tipo SOFT será rechazado y no afectará el cálculo de estados de monitorización.

Recuerde:

SOFT: es asignado cuando el estado del servicio obtenido no es definitivo, ya que puede o no ser revertido en el siguiente intento de chequeo. En el caso de superar el número de intentos predefinidos obteniendo estados negativos, el nivel de gravedad de error se elevará a tipo HARD. El objetivo es evitar falsas alarmas por problemas transitorios.

HARD: es asignado cuando el estado del servicio obtenido es erróneo continuamente, sin llegar a ser corregido. Es decir, cuando el servicio devuelve un estado negativo en el primer intento y también en los chequeos posteriores superando el número de intentos predefinidos. Esta nueva situación ya sí es notificada al usuario contacto.

Construcción y ejemplos de Business Rules

La definición de una BR comenzará siempre con el comando:

bp_rule!
BR simple

Si se desea crear un Proceso de Negocio integrado por un sólo elemento, por ejemplo, el Dispositivo con nombre HostOne, la BR será la siguiente:

bp_rule!(HostOne)
../../_images/2_098_aggregator_BP_rule_example_0-59.png
BR con Servicios

Para incluir en la regla un Servicio, hay que introducir el nombre del Dispositivo y el nombre del Servicio separado por una coma (,).

Siguiendo con el ejemplo anterior, en esta ocasión es preciso crear un Proceso de Negocio que estará compuesto por un sólo elemento, el Dispositivo con nombre HostOne. Sobre él se examinará el estado del Servicio “CPU”. La Regla de Negocio será la siguiente:

bp_rule!(HostOne,cpu|HostOne, partition)
../../_images/2_098a_aggregator_BP_rule_example_0-59.png
BR con operadores lógicos

Mediante el uso de expresiones lógicas (AND, OR, NOT) se establece también una relación entre los distintos elementos integrantes, lo que facilita a WOCU-Monitoring el cálculo del estado del activo a través del análisis y evaluación de los estados operacionales de sus elementos integrantes (activos físicos y/o lógicos).

Seguidamente se introducirán los nombres o identificadores de los activos cuyo estado el sistema examinará al ejecutar la regla. Por lo tanto, la sintaxis que se debe respetar es la siguiente:

bp_rule!(Host_1 op Host_2 op Host_3)

Donde “op” es el operador binario que puede tomar los siguientes valores:

Operador

Valor

&

AND

|

OR

!

NOT

A continuación se detallan otros ejemplos más complejo que emplean operadores lógicos:

Operador OR


En los entornos profesionales es habitual encontrar escenarios donde se redundan elementos para asegurar la disponibilidad de los servicios que prestan los mismos. Imaginemos una página web alojada en dos servidores web redundados, uno como servidor activo y el otro como el servidor de respaldo (backup). Un Proceso de Negocio destinado a velar por la disponibilidad de la página web, compuesto de dos servidores web, WebServerActive y WebServerBackup, que examine si al menos uno de los servidores web presta servicio, tendrá una regla como la que sigue:

bp_rule!(WebServerActive|WebServerBackup)

En este caso, como puede observarse, se ha empleado el operador lógico OR (o) representado con el carácter «|» y que da un valor positivo si al menos uno de los elementos de la relación lógica es positivo.

../../_images/2_098b_BP_rule_example_OR_0-60.png

Operador AND


Se puede añadir más complejidad aún a las BR con el uso de otros operadores lógicos y expresiones. Supongamos que, en la web del ejemplo anterior, interviene una BBDD alojada en dos servidores de BBDD, DBServerActive y DBServerBackup, por lo que deseamos que la Regla de Negocio determine la disponibilidad de la web atendiendo a la disponibilidad de al menos uno de los servidores web y al menos uno de los servidores de BBDD. La regla sería entonces:

bp_rule!(WebServerActive|WebServerBackup) & (DBServerActive|DBServerBackup)

Tal y como se ve, en este caso se ha utilizado el operador lógico AND (y) representado por el carácter “&” y que da un valor positivo si ambos elementos de la relación lógica son positivos.

../../_images/2_098c_BP_rule_example_AND_0-60.png

Operador NOT


Veamos ahora el uso de otro operador lógico. Pensemos en un escenario en el que hay un router, Router, que da conexión a Internet a una sede a través de dos líneas dedicadas independientes (ADSL y RDSI) a través de dos interfaces. Se quiere monitorizar la disponibilidad de la conexión a través de la línea principal con una Regla de Negocio. Teniendo en cuenta que la interfaz conectada a la línea de respaldo RDSI (if_ISDN) sólo estará activa cuando haya una caída en la línea principal ADSL (if_ADSL), la Regla a crear sería:

bp_rule!(Router,ifADSL & !Rourter,ifISDN)
../../_images/2_098d_BP_rule_example_NOT_0-60.png

Operador OF


A continuación pensemos en el siguiente escenario: para dar el servicio de una web existen tres servidores web (WebServer1, WebServer2 y WebServer3) y tres servidores de BBDD (DBServer1, DBServer2, DBServer3). Se precisa crear una regla que determine un correcto funcionamiento del servicio de la web cuando al menos dos de los tres servidores web funcionen correctamente y dos de los tres servidores de BBDD funcionen correctamente. La regla sería así:

bp_rule!(2 of: WebServer1 | WebServer2 | WebServer3 ) & (2 of: DBServer1|DBServer2|DBServer3)

Utilizando el operador of: precedido de un número o un porcentaje, se establece un mínimo de elementos que deben cumplir la condición.

../../_images/2_098e_BP_rule_example_OF_0-60.png