Novedades WOCU 0.41
A continuación se presentan las novedades de la versión 0.41 de WOCU Monitoring.
Continuamos trabajando en una línea de monitorización unificada y homogénea. WOCU es una herramienta todo en uno, donde en una única consola se integra toda la información referente al estado, rendimiento y capacidad de la infraestructura monitorizada. Así pues, en esta versión se suma la nueva vista Performance, donde se recogen todas las métricas de monitorización junto con sus valores de rendimiento, registrados por cada servicio, resultado de las continuas comprobaciones en términos de operatividad hacia los elementos de red.
En relación al módulo de Inventario de datos y atributos de activos, WOCU ya es capaz de detectar links en los valores de inventario y convertirlos en clickables. Otra funcionalidad con la que se continúa optimizando uno de los módulos más potentes de la herramienta.
También se ha modificado el método de ordenación de dos de las columnas más relevantes de las tablas de Alarmas (Problems): Impact y Duration. Estos campos están estrechamente relacionados y permitirá al operario una resolución más ágil de alertas en función del impacto asignado.
A pesar de que en la anterior versión se incorporó la acción Differences para Dispositivos ubicados en la lista de pendientes, ha sido mejorada incorporando una nueva tabla donde se desglosan las Macros de configuración que han sido recientemente actualizadas.
Continuamos enriqueciendo nuestro Manual de Usuario con un nuevo caso de uso sobre cómo sacar el máximo partido a la Monitorización Pasiva en WOCU, mediante la aplicación de un pack específico.
En cuanto a seguridad, en esta ocasión se ha trabajado en la capacidad de monitorización de los intentos de acceso a la herramienta. Siendo conscientes de la exposición de WOCU en internet, era necesario trabajar en la trazabilidad de accesos, para la detección de autenticaciones fallidas y actuación en consecuencia mediante el bloqueo de cuentas.
Además, se han añadido nuevas mejoras en la API de configuración y seguimos agregando valor a nuestro catálogo Packs de Monitorización, tanto añadiendo nuevos packs y servicios de monitorización, como dando soporte a nuevas tecnologías y fabricantes.
Esta versión viene cargada de nuevas integraciones y mejoras, sigue leyendo y conoce el listado completo de novedades y amplía información con el Manual de Usuario si es necesario.
Interfaz
Nueva Vista de datos de Rendimiento (Performance) de métricas de monitorización
La operativa de WOCU es a grandes rasgos la siguiente: un pack monitoriza Dispositivos mediante servicios. Como resultado de las verificaciones de operatividad que el servicio lanza a un Dispositivo, se generan métricas que registran valores de rendimiento, permitiendo un análisis más profundo del servicio, y por consiguiente, del Dispositivo en términos de disponibilidad.
En esta nueva versión, WOCU añade una nueva pestaña llamada Performance, donde se recopilan las métricas de monitorización generadas en cada servicio. El conjunto de valores es presentado a través de un formato tabular, donde se incluye una entrada por cada métrica, lo que facilita su estudio individualizado. Esta tabla es meramente informativa, no permite efectuar ningún cambio sobre el Dispositivo.
La tabla Service Performance recoge los siguientes datos:
1. Datos de la métrica de monitorización:
Name: nombre de la métrica de monitorización.
Value: último valor de rendimiento registrado en dicha métrica.
2. Umbrales de medición:
Minimum: umbral mínimo definido que puede alcanzar la métrica. Se identifica con una línea vertical en color verde posicionada (normalmente) en el inicio de la barra.
Warning: umbral definido a partir del cual la métrica alcanzará un estado de advertencia o alarma. Se identifica con una línea vertical en color naranja.
Critical: umbral definido a partir del cual la métrica alcanzará un estado crítico. Se identifica con una línea vertical en color rojo.
Maximum: umbral máximo definido que puede alcanzar la métrica. Se identifica con una línea vertical en color negro posicionada (normalmente) al final de la barra.
3. Graficado de la métrica:
Graph: se representa gráficamente el valor actual de la métrica (columna Value) mediante una barra rectangular de longitud proporcional al valor registrado.
Los umbrales actúan como indicadores y se representan con líneas verticales ubicadas a lo largo de la barra. Cada umbral tiene asociado un color identificativo.
La distinción de colores es la siguiente:
Color gris claro: indica la ausencia de datos métricos (valor = 0).
Color gris oscuro: indica que el valor es menor al mínimo establecido.
Color azul: indica la existencia de un valor registrado pero ausencia de umbrales de alerta. Esta situación genera cierta incertidumbre sobre la situación real de la métrica.
Color verde: indica que el valor está por encima del valor mínimo y por debajo de los umbrales de alerta.
Color naranja: indica que el valor está por encima del umbral WARNING pero sin exceder los umbrales superiores.
Color rojo: indica que el valor está por encima del umbral CRITICAL o superior.
Por último, esta tabla también se ha incluído en la sección Dispositivo (Host) de la Vista de Detalle de Activos y BP, en concreto en el apartado HOST STATUS, donde se ofrece información precisa sobre la configuración, propiedades y estado del Dispositivo en cuestión.
Gracias a la versatilidad de WOCU para gestionar infinidad de Packs de Monitorización, servicios y métricas de diferente índole, es posible generar tablas de rendimiento que nos permitan realizar un estudio pormenorizado y conocer la situación real de nuestra red o infraestructura, así como ayudar a identificar problemas y errores de rendimiento y capacidad.
Continuamos trabajando para integrar y proveer en una consola única, toda la información referente al estado, rendimiento, limitaciones y capacidad de los activos que administra y supervisa WOCU, sin tener que recurrir a otras herramientas externas.
Nota
Más información en: Performance.
Agregación de links como valores de inventario de Dispositivos
WOCU cuenta con un potente módulo de inventariado propio, donde se almacenan y proveen datos de carácter técnico y funcional para cada activo monitorizado. Estos inventarios son enriquecidos con valores nuevos o actualizados, descubiertos tras el lanzamiento de alguna de las múltiples tareas de importación de inventariado disponibles.
A partir de esta nueva versión, el sistema detectará los links en el texto de los valores de inventario de un Dispositivo y los convertirá en clickables. Centralizando así toda la información servida en el inventario de WOCU, pudiendo incluso enlazar con otras bases de datos, documentación y herramientas de tu organización desde un mismo punto.
Desde la pestaña Inventario (Inventory) de la Vista de Detalle de Activos y BP.
La comodidad, agilidad y navegabilidad en el uso de nuestra herramienta es primordial, por ello WOCU facilita la agregación en una única vista de toda la información de interés de un Dispositivo (ya sea texto o link), a diferencia de otras soluciones que deben recurrir a aplicativos de terceros para la gestión de inventarios.
Ordenación múltiple de las columnas Impacto y Duración en el listado de Hosts Problems
Uno de los conceptos cruciales en las tareas de monitorización y operación de redes y sistemas, es el diagnóstico y gestión de Alarmas (Problems). El flujo de trabajo habitual en el entorno de WOCU supone que toda alarma debe ser examinada y tratada por el operario o Administrador. Por ello, es siempre una buena práctica realizar un reconocimiento (Acknowledged) de las incidencias tratadas, alternativamente deshabilitar los chequeos activos (en determinadas circunstancias), o bien aplicar el tiempo de caída programado (en el caso de un mantenimiento o intervención programada). De esta forma, se mantendrá lo más limpia y despejada posible la vista de alarmas.
A esta nueva versión se suma la ordenación múltiple de las columnas Impact (grado de criticidad o trascendencia del activo en el proceso de negocio) y Duration (tiempo transcurrido entre el comienzo y fin de una alarma). Esto quiere decir que previa ordenación (ascendente o descendente) de la columna Impacto, automáticamente el sistema mostrará los valores registrados de la columna Duración en orden ascendente (por cada escala de valores), con la finalidad de ubicar en las primeras posiciones de la tabla las incidencias más recientes (duración más breve), ya que probablemente su resolución urja más que el resto, puesto que en ocasiones el operario obvia voluntariamente algunas de ellas.
Orden ascendiente de la columna Impact:
Orden decreciente de la columna Impact:
En definitiva, además de las buenas prácticas en el uso de la herramienta, como por ejemplo la aplicación conjunta de filtros y acciones que permitan una gestión más organizada de alarmas en entornos complejos, continuamos trabajando en simplificar el tratamiento de las mismas, primando la resolución de incidencias de mayor a menor impacto en el listado de alarmas de Dispositivos.
Nota
Más información en: Listado de Alarmas de sobre activos monitorizados.
Mejoras en la configuración
Incorporación de Macros modificadas en la vista de la acción Differences de un Dispositivo
En la anterior versión 0.40 se añadió una nueva acción para cada Dispositivo de la tabla de Activos Pendientes (Pending Assets) llamada Differences, donde a través de un formato tabular se presentan las principales diferencias de configuración que ha sufrido un Dispositivo que ha sido nuevamente descubierto, y que en consecuencia, vuelve a estar alojado en la BBDD de activos pendientes.
Pero esta vista no llegaba a mostrar las Macros que habían sido modificadas en nuevos descubrimientos. Por consiguiente, esta acción es mejorada incorporando una nueva tabla donde se desglosan las Macros que han sufrido alguna modificación, acogiendo en una única vista todos los atributos y variables de configuración de un Dispositivo, sin necesidad de acceder al backend de administración para observar posibles variaciones.
Esta nueva vista, quedará distribuida en dos tablas:
General Information: incluye atributos y propiedades de inventario que han sido modificadas.
Differences in Macros: incluye variables y parámetros de configuración interna del Dispositivo que han sido modificados.
Nota
Más información en: Acciones del listado de Dispositivos Pendientes.
Trazabilidad y bloqueo de accesos
Cada vez más y más usuarios utilizan WOCU para administrar sus infraestructuras. Y en muchas ocasiones, WOCU se encuentra expuesto a internet para dar servicio a más clientes. Así pues, era necesario añadir capacidades de trazabilidad de accesos, detectar autenticaciones fallidas y actuar sobre ellas.
En esta nueva versión, se ha añadido una nueva funcionalidad de seguridad adicional, la capacidad para monitorizar los intentos de acceso al interfaz y de prevenir ataques de fuerza bruta, cuando se excede un límite de intentos permitidos previamente configurado. Esta información persistirá en la base de datos lo que posibilitará realizar auditorías o reenviar los eventos registrados a otros sistemas.
Se monitorizan los intentos de acceso por dirección IP, por nombre de usuario, por user agent, o por una combinación de ambos, y cuando se supera el límite permitido el usuario recibirá el siguiente mensaje prohibiendo el ingreso en la aplicación:
Atención
Account locked: too many login attempts. Please try again later
También se pueden configurar periodos de inactividad para limpiar los intentos fallidos acumulados y de ese modo volver a permitir accesos desde la dirección IP o el usuario previamente bloqueado.
Nota
Más información en: Acceso a WOCU.
API
Mejoras en la API de configuración
A partir de esta nueva versión, ya es posible agregar un nuevo miembro a un determinado Hostgroup, mediante una petición al API de configuración, sin necesidad de conocer previamente los miembros que lo componen y sin sobrescribir la configuración establecida.
Además, la petición de agregación de nuevos miembros se realiza a través del
Host_name
y no por ID
como se venía implementando.
Esta mejora resulta muy útil cuando el número de miembros en Hostgroups y Business Processes es elevado, haciendo que la tarea de agregación de nuevos elementos sea lo más ágil y menos tediosa posible.
PATCH /api/hostgroup/hostgroup1
Member (host_member/bp_members/hostgroups_members): new-member
Filtro por dominio o URL en la configuración de Dashboards Externos
En versiones anteriores de WOCU se introdujo la capacidad de integrar y visualizar Dashboards de otras herramientas como por ejemplo Grafana.
En muchas ocasiones, los dashboards configurados no son accesibles desde el navegador por limitaciones de acceso a redes internas. Se ha añadido una variable de configuración que permite filtrar mediante una expresión regular, dashboards de un determinado domino o nombre de URL. De este modo, los usuarios no sentirán la confusión de desplegar dashboards a los que de antemano no tienen acceso.
Nuevos endpoints para el cálculo de Indicadores Clave de Rendimiento (KPI’s)
Se han implementado nuevos endpoints para el cálculo de Indicadores Clave de Rendimiento o KPI’s por su siglas en inglés, que nos permitirá obtener información referente a la eficiencia durante la resolución y escalado de incidencias originadas en la planta monitorizada.
Endpoints para la obtención de KPI’s sobre las incidencias de Dispositivos y Servicios en un Reino:
GET /api/events/realms/{realm_name}/monitoring/kpi/hosts/
GET /api/events/realms/{realm_name}/monitoring/kpi/services/
Endpoints para la obtención de KPI’s sobre las incidencias de Dispositivos y Servicios en un Multireino:
GET /api/events/multirealms/{realm_name}/monitoring/kpi/hosts/
GET /api/events/multirealms/{realm_name}/monitoring/kpi/services/
Estos KPI’s generan un listado con las fechas de todas las caídas de
Dispositivos o de Servicios (en Reinos o Multireinos) producidas dentro
del periodo de tiempo indicado, junto con la fecha y usuario de creación del
ACK
asociado (si existiera) y la fecha de vuelta al funcionamiento del
activo si esta se hubiera producido ya.
De esta manera se puede cuantificar y medir niveles de eficacia en términos de tiempo, a la hora de responder y solventar las incidencias que van surgiendo en la infraestructura monitorizada. Los datos devueltos serán útiles como medida de optimización del proceso de resolución de incidencias interno, con el fin de garantizar la mejor operación de servicio.
Nota
Accede a la documentación íntegra de la API de WOCU en: Documentación API pública.
Otras mejoras y arreglos
Durante el desarrollo de esta versión 0.41, se han ido mejorando otros aspectos de la versión estable que pasamos a listar:
Se han añadido nuevas opciones para el filtrado por duración en la página de Alarmas (Problems), a fin de ajustar y limitar todavía más las búsquedas.
Solucionado un problema que impedía cerrar el modal de Dispositivos cuando el sistema de
ACLs
estaba activado.Se han refactorizado los endpoints de disponibilidad eliminando etiquetas HTML.
Se ha eliminado la visualización de determinadas macros con información sensible en la página de Activos (Assets).
Ahora es posible que un informe sea público, aunque no tenga contactos/destinatarios asignados en la programación del mismo.
Se han realizado cambios estéticos en la tabla de acciones masivas y en la tabla de tareas programadas.
El indicador final obtenido en Informes de Disponibilidad (Availability) ahora es truncado para evitar decimales innecesarios.
Corregido un fallo en el listado de contactos/usuarios de informes programados, en el que podían visualizarse usuarios de otros reinos.
Se ha mejorado la visualización de los indicadores de disponibilidad cuando no se encontraban datos en el rango temporal solicitado.
Mejoras generales en el modal de diferencias en cuanto a configuración entre Dispositivos descubiertos y Dispositivos ya monitorizados.
Se ha solucionado un problema con los campos de tipo porcentaje en la configuración de Packs de Monitorización.
Los Informes de Dispositivos más relevantes (Top Hosts) ahora incluyen más unidades de conversión en sus opciones.
La gráfica de disponibilidad de Dispositivos por Ping (Panel RTA (últimas 24 horas)) ahora soporta intervalos de monitorización distintos al de por defecto.
El botón que permite lanzar nuevas tareas de importación y descubrimiento de activos, ahora aparecerá deshabilitado cuando la tarea en cuestión esté ocupada.
La pestaña Cuadros de Mando (Dashboards) ahora solo estará habilitada cuando existan cuadros de mando configurados en el Reino. A excepción de para Administradores cuya visualización es permanente.
Documentación
Nuevo caso de uso sobre la Monitorización Pasiva en WOCU
Se ha añadido un nuevo caso de uso al Manual de Usuario.
WOCU unifica y gestiona dos metodologías referentes a la monitorización de redes: la Monitorización Pasiva* y la Monitorización Activa. Gracias al uso combinado, las limitaciones que presentan ambas tipologías se reducen y se incrementa el nivel de garantía de calidad de nuestra herramienta, puesto que los problemas son detectados antes de que ocurran, o casi en tiempo real, permitiendo una comprensión profunda de la causa raíz que los ha motivado.
Así pues, este caso de uso muestra cómo WOCU gestiona los logs indexados en el backend de eventos procedentes del mundo de la monitorización pasiva, y cómo crear alertas a medida basadas en estos eventos externos mediante la configuración y aplicación del pack de monitorización Log Ocurrences.
Nota
Más información en: Monitorización pasiva en mediante el pack Log occurrences.
Packs de monitorización
Consulta nuestro catálogo de Packs de Monitorización de WOCU en el siguiente enlace.
Nuevo pack bgp
Este pack descubre los peers BGP configurados en un router y
monitoriza su estado. Además, genera alarmas si el estado del peer no es
established
.
Su funcionamiento ha sido probado con equipos Cisco, Juniper, Huawei, OneAccess y Teldat.
Nuevo pack purestorage
Pack destinado para los equipos de almacenamiento PureStorage FlashArray. Incluye funciones de descubrimiento para elegir los volúmenes y componentes de hardware que se quieren monitorizar.
Los diferentes servicios que incluye el pack son:
Info: muestra el modelo de hardware y la versión de software instalado en las controladoras.
Open Alerts: alertas en estado open.
Status: estado de los componentes hardware seleccionados.
Occupancy: porcentaje de ocupación global y por volúmenes.
Performance: métricas de rendimiento de lectura/escritura (latencia, ancho de banda, IOPS)
Nuevo pack networkdevice-traffic-all
Hemos creado un pack que unifica los packs networkdevice-traffic y
networkdevice-traffic-health. La principal ventaja es que tan solo es
necesario descubrir los interfaces una sola vez para crear los servicios
traffic
, interface_discards
e interfaces_errors
.
En equipos con muchos interfaces de red, esto puedo significar un ahorro importante de tiempo de configuración. Por supuesto, los packs networkdevice-traffic y networkdevice-traffic-health siguen estando disponibles por separado.
Se añade la macro _TIME_RANGE al pack log-occurrences
Gracias a esta macro, ahora es posible configurar la ventana de tiempo en la consulta que se realiza en ElasticSearch. Esta macro hace referencia a los últimos x minutos. El valor máximo es de 1.440 minutos, equivalente a 24 horas.
Se añade el servicio VPN Active Tunnels al pack palo-alto
Se ha añadido un servicio para chequear el número de túneles VPN activos. Este servicio permite configurar umbrales para un número mínimo y máximo de túneles.
Se añade el servicio node state al pack stonegate-fw
Se ha añadido un servicio para monitorizar el estado operativo de los nodos de
un cluster. El servicio permite elegir el estado configurado en los nodos, y
devolverá CRITICAL
cuando el estado obtenido en la consulta sea
diferente al elegido en el pack.
Este servicio también incluye una funcionalidad de persistencia de
estado no-OK. Lo que permite mantener el estado CRITICAL
provocado
por un cambio de estado temporal. Una macro define el tiempo de
permanencia de estado.
Software actualizado
Django 2.2
Continuamos en el proceso de actualización de componentes core de WOCU.
En este caso, nuestro framework más utilizado en backend,
Django, ha sido
actualizado de la versión 1.11
a la 2.2
. Trae consigo
la corrección de algunos errores de seguridad, junto con otras funcionalidades
beneficiosas para el resto de aplicaciones. La anterior versión 1.11
dejó
de tener soporte ante fallos y problemas de seguridad el mes anterior.
Esta nueva versión, denominada LTS (Long Time Support) tiene soporte
asegurado hasta Abril de 2022 y cabe destacar que únicamente es compatible
con Python3 (la migración completa de Python2 a Python3 en el código base de
WOCU ya se realizó en
anteriores versiones).
Otros componentes
Se han incorporado y actualizado numerosas piezas de software integradas en WOCU:
Software |
Versión anterior |
Versión actual |
Observaciones |
---|---|---|---|
Python3 |
3.7.5 |
3.7.7 |
Última versión estable de la serie 3.7 |
LMD |
1.8.2 |
1.8.3 |
Mejoras en el rendimiento de algunas peticiones y en la gestión de timeouts en conexiones |
Utilidades para reparación de gráficas RRD
Hemos incluido varios scripts para reparar las gráficas RRD que se corrompen al añadir nuevas métricas a un servicio, o para recuperar los datos históricos cuando hay cambios en el identificador de un servicio (service_description), ya que esos identificadores se usan para nombrar los ficheros RRD.