Supervisión de clústeres de Kubernetes mediante servicios de Azure y herramientas nativas en la nube
En este artículo, se describe cómo supervisar el estado y el rendimiento de los clústeres de Kubernetes y las cargas de trabajo que se ejecutan en ellos mediante Azure Monitor y los servicios nativos relacionados de Azure y la nube. Esto incluye clústeres que se ejecutan en Azure Kubernetes Service (AKS) u otras nubes, como AWS y GCP. Se proporcionan diferentes conjuntos de instrucciones para los distintos roles que, por lo general, administran componentes únicos que componen un entorno de Kubernetes.
Importante
En este artículo, se proporcionan instrucciones completas sobre la supervisión de las distintas capas del entorno de Kubernetes en función de Azure Kubernetes Service (AKS) o clústeres de Kubernetes en otras nubes. Si acaba de empezar a trabajar con AKS o Azure Monitor, consulte Supervisión de AKS para obtener información básica para empezar a supervisar un clúster de AKS.
Capas y roles del entorno de Kubernetes
A continuación, se muestra una ilustración de un modelo común de un entorno típico de Kubernetes, empezando desde el nivel de infraestructura hasta las aplicaciones. Cada capa tiene distintos requisitos de supervisión que se abordan en distintos servicios y que, por lo general, administran distintos roles de la organización.
La responsabilidad de las distintas capas de un entorno de Kubernetes y las aplicaciones que dependen de ella suelen abordarse mediante varios roles. En función del tamaño de la organización, estos roles pueden realizarse por personas diferentes o incluso equipos diferentes. En la tabla siguiente, se describen los distintos roles. Además, en las secciones siguientes, se proporcionan los escenarios de supervisión que cada uno de estos podrá encontrar.
Roles | Descripción |
---|---|
Desarrollador | Desarrollar y mantener la aplicación que se ejecuta en el clúster. Responsable del tráfico específico de la aplicación, incluido el rendimiento y los errores de la aplicación. Mantiene la confiabilidad de la aplicación según los Acuerdos de Nivel de Servicio. |
Ingeniero de plataformas | Responsable del clúster de Kubernetes. Aprovisiona y mantiene la plataforma utilizada por el desarrollador. |
Ingeniero de redes | Responsable del tráfico entre cargas de trabajo, y las entradas y salidas con el clúster. Analiza el tráfico de red y realiza el análisis de amenazas. |
Selección de herramientas de supervisión
Azure proporciona un conjunto completo de servicios basados en Azure Monitor para supervisar el estado y el rendimiento de diferentes capas de la infraestructura de Kubernetes y las aplicaciones que dependen de ella. Estos servicios funcionan conjuntamente entre sí para proporcionar una solución de supervisión completa y se recomiendan tanto para AKS como para los clústeres de Kubernetes que se ejecutan en otras nubes. Quizá ya haya realizado una inversión en tecnologías nativas en la nube aprobadas por Cloud Native Computing Foundation. En este caso, puede optar por integrar las herramientas de Azure en su entorno existente.
La elección de las herramientas que se van a implementar y su configuración dependerá de los requisitos de su entorno en particular. Por ejemplo, puede usar las ofertas administradas en Azure para Prometheus y Grafana, o bien puede usar la instalación existente de estas herramientas con los clústeres de Kubernetes en Azure. Su organización también puede usar herramientas alternativas a Container Insights para recopilar y analizar registros de Kubernetes, como Splunk o Datadog.
Importante
La supervisión de un entorno complejo, como Kubernetes, implica recopilar una cantidad significativa de telemetría, gran parte de las cuales conlleva un costo. Debe recopilar solo suficientes datos para satisfacer sus requisitos. Esto incluye la cantidad de datos recopilados, la frecuencia de recopilación y el período de retención. Si los costos son un factor crucial, puede optar por implementar un subconjunto de la funcionalidad completa para reducir el gasto de supervisión.
Ingeniero de redes
El ingeniero de redes es responsable del tráfico entre cargas de trabajo, y las entradas y salidas con el clúster. Este analiza el tráfico de red y realiza análisis de amenazas.
Servicios de Azure para el administrador de red
En la tabla siguiente, se enumeran los servicios que suele usar el ingeniero de red para supervisar el estado y el rendimiento de la red compatible con el clúster de Kubernetes.
Servicio | Descripción |
---|---|
Network Watcher | Conjunto de herramientas de Azure para supervisar las redes virtuales que usan los clústeres de Kubernetes y diagnosticar problemas detectados. |
Análisis de tráfico | Característica de Network Watcher que analiza los registros de flujo para proporcionar información sobre el flujo de tráfico. |
Network Insights | Característica de Azure Monitor que incluye una representación visual del rendimiento y el estado de los distintos componentes de red y proporciona acceso a las herramientas de supervisión de red que forman parte de Network Watcher. |
Network Insights está habilitado de forma predeterminada y no requiere ninguna configuración. Por lo general, Network Watcher también se habilita de forma predeterminada en cada región de Azure.
Supervisión de nivel 1: red
A continuación, se muestran escenarios comunes para supervisar la red.
- Cree registros de flujo para registrar información sobre el tráfico IP que fluye a través de grupos de seguridad de red usados por el clúster. Después, use Traffic Analytics para analizar y proporcionar información sobre estos datos. Es muy probable que, para Traffic Analytics, use la misma área de trabajo de Log Analytics que usa para Container Insights y los registros del plano de control.
- Con el análisis de tráfico, puede determinar si algún tráfico fluye hacia o desde cualquier puerto inesperado usado por el clúster y también si algún tráfico fluye a través de direcciones IP públicas que no deben exponerse. Use esta información para determinar si las reglas de red necesitan modificaciones.
- En el caso de los clústeres de AKS, use el complemento Observabilidad de red para AKS (versión preliminar) para supervisar y observar el acceso entre los servicios del clúster (tráfico este-oeste).
Ingeniero de plataformas
El ingeniero de plataformas, también conocido como el administrador del clúster, es responsable del propio clúster de Kubernetes. Este aprovisiona y mantiene la plataforma que usan los desarrolladores. Debe comprender el estado del clúster y sus componentes, y poder solucionar los problemas detectados. También debe comprender el costo de operar el clúster y, potencialmente, poder asignar costos a diferentes equipos.
Las grandes organizaciones también pueden tener un arquitecto de flotas, que es similar al ingeniero de plataformas, pero es responsable de varios clústeres. El arquitecto de flotas necesita visibilidad en todo el entorno y debe realizar tareas administrativas a gran escala. En la siguiente guía, se incluyen recomendaciones a gran escala. Consulte ¿Qué es Azure Kubernetes Fleet Manager? para obtener detalles sobre cómo crear un recurso Fleet para escenarios de varios clústeres y a gran escala.
Servicios de Azure para el ingeniero de plataformas
En la tabla siguiente, se muestran los servicios de Azure que permiten que el ingeniero de plataformas pueda supervisar el estado y el rendimiento del clúster de Kubernetes y sus componentes.
Servicio | Descripción |
---|---|
Información sobre Container | Servicio de Azure para clústeres de Kubernetes habilitados para AKS y Azure Arc que usan una versión en contenedor del agente de Azure Monitor para recopilar registros stdout/stderr, métricas de rendimiento y eventos de Kubernetes de cada nodo del clúster. Puede ver los datos en Azure Portal o consultarlos mediante Log Analytics. Configure la experiencia de Prometheus para usar vistas de Container Insights con datos de Prometheus. |
Servicio administrado Azure Monitor para Prometheus | Prometheus es una solución de métricas nativas de la nube de Cloud Native Compute Foundation y es la herramienta más común que se usa para recopilar y analizar datos de métricas de clústeres de Kubernetes. El servicio administrado Azure Monitor para Prometheus es una solución totalmente administrada que es compatible con el lenguaje de consulta Prometheus (PromQL) y las alertas de Prometheus, y se integra con Azure Managed Grafana para fines de visualización. Este servicio admite su inversión en herramientas de código abierto sin la complejidad de tener que administrar su propio entorno de Prometheus. |
Kubernetes habilitado para Azure Arc | Le permite asociarse a clústeres de Kubernetes que se ejecutan en otras nubes para que pueda administrarlos y configurarlos en Azure. Con el agente de Arc instalado, puede supervisar AKS y clústeres híbridos de forma conjunta con los mismos métodos y herramientas, incluidos Container Insights y Prometheus. |
Azure Managed Grafana | La implementación totalmente administrada de Grafana es una plataforma de visualización de datos de código abierto que se usa habitualmente para presentar Prometheus y otros datos. Hay varios paneles predefinidos de Grafana disponibles para supervisar Kubernetes y una solución de problemas de pila completa. |
Configuración de la supervisión para el ingeniero de plataformas
En las secciones siguientes, se identifican los pasos para completar la supervisión del entorno de Kubernetes con el uso de los servicios de Azure de la tabla anterior. Se proporcionan opciones de funcionalidad e integración para cada servicio para ayudarle a determinar dónde puede necesitar modificar esta configuración para satisfacer sus requisitos concretos.
La incorporación de Container Insights y Managed Prometheus puede formar parte de la misma experiencia que se describe en Habilitación de la supervisión de clústeres de Kubernetes. En las secciones siguientes se describe cada una por separado para que pueda tener en cuenta todas las opciones de incorporación y configuración de cada una.
Habilitación de la extracción de métricas de Prometheus
Importante
Para usar el servicio administrado Azure Monitor para Prometheus, debe tener un área de trabajo de Azure Monitor. Para obtener información sobre las consideraciones de diseño de una configuración del área de trabajo, consulte Arquitectura del área de trabajo de Azure Monitor.
Use uno de los métodos siguientes para habilitar la extracción de métricas de Prometheus por el servicio administrado Azure Monitor para Prometheus desde el clúster:
- Seleccione la opción Habilitar métricas de Prometheus al crear un clúster de AKS.
- Seleccione la opción Habilitar métricas de Prometheus al habilitar Container Insights en un clúster de AKS existente o en un clúster de Kubernetes habilitado para Azure Arc.
- Habilite la extracción para un clúster de AKS existente o un clúster de Kubernetes habilitado para Arc.
Si ya tiene un entorno de Prometheus que desea usar para los clústeres de AKS, habilite el servicio administrado de Azure Monitor para Prometheus y, después, use remote-write para enviar datos al entorno de Prometheus existente. También puede usar remote-write para enviar datos desde el entorno de Prometheus autoadministrado existente al servicio administrado de Azure Monitor para Prometheus.
Consulte Configuración predeterminada de métricas de Prometheus en Azure Monitor para obtener más información sobre las métricas recopiladas de forma predeterminada y su frecuencia de recopilación. Si quiere personalizar la configuración, consulte Personalización de la extracción de métricas de Prometheus en el servicio administrado de Azure Monitor para Prometheus.
Habilitación de Grafana para el análisis de datos de Prometheus
Nota:
Use Grafana para supervisar el entorno de Kubernetes si tiene una inversión existente en Grafana o si prefiere usar paneles de Grafana en lugar de Container Insights para analizar los datos de Prometheus. Si no desea usar Grafana, habilite la experiencia de Prometheus en Container Insights para poder usar las vistas de Container Insights con los datos de Prometheus.
Cree una instancia de Managed Grafana y vincúlela al área de trabajo de Azure Monitor para que pueda usar los datos de Prometheus como origen de datos. También puede realizar manualmente esta configuración mediante la incorporación de un servicio administrado de Azure Monitor para Prometheus como origen de datos. Hay una variedad de paneles precompilados disponibles para supervisar clústeres de Kubernetes, incluidos varios paneles que presentan información similar a las vistas de Container Insights.
Si tiene un entorno de Grafana existente, puede seguir utilizándolo y agregar el servicio administrado de Azur Monitor para Prometheus como origen de datos. También puede agregar el origen de datos de Azure Monitor a Grafana para usar los datos recopilados por Container Insights en paneles de Grafana personalizados. Realice esta configuración si desea centrarse en los paneles de Grafana en lugar de usar las vistas e informes de Container Insights.
Habilitación de Container Insights para la recopilación de registros
Al habilitar Container Insights para el clúster de Kubernetes, este implementa una versión en contenedor del agente de Azure Monitor que envía datos a un área de trabajo de Log Analytics en Azure Monitor. Container Insights recopila stdout/stderr del contenedor, registros de infraestructura y datos de rendimiento. Todos los datos de registro se almacenan en un área de trabajo de Log Analytics donde se pueden analizar mediante Lenguaje de consulta de Kusto (KQL).
Consulte Habilitación de Container Insights para conocer los requisitos previos y las opciones de configuración para incorporar los clústeres de Kubernetes. Realice la incorporación mediante Azure Policy para asegurarse de que todos los clústeres conserven una configuración coherente.
Una vez habilitado Container Insights para un clúster, realice las siguientes acciones para optimizar la instalación.
- Habilite la experiencia de Prometheus en Container Insights para poder usar vistas de Container Insights con los datos de Prometheus.
- Para mejorar la experiencia de consulta con los datos recopilados por Container Insights y reducir los costos de recopilación, habilite el esquema ContainerLogV2 para cada clúster. Si solo usa registros para solucionar problemas ocasionales, considere la posibilidad de configurar esta tabla como registros básicos.
- Use los valores preestablecidos de costo descritos en Habilitación de la configuración de optimización de costos en Container Insights para reducir el costo de la ingesta de datos de Container Insights al reducir la cantidad de datos recopilados. Deshabilite la recopilación de métricas mediante la configuración de Container Insights para recopilar solo registros y eventos, ya que muchos de los mismos valores de métricas que Prometheus.
Si tiene una solución existente para la recopilación de registros, siga las instrucciones de esa herramienta o habilite Container Insights y use la característica de exportación de datos del área de trabajo de Log Analytics para enviar datos a Azure Event Hubs para que se reenvíen al sistema alternativo.
Recopilación de registros del plano de control para clústeres de AKS
Los registros de componentes del plano de control de AKS se implementan en Azure como registros de recursos. Container Insights no usa actualmente estos registros, por lo que debe crear sus propias consultas de registro para verlos y analizarlos. Para más información sobre la estructura de los registros y las consultas, consulte Consulta de registros desde Container Insights.
Cree una configuración de diagnóstico para cada clúster de AKS para enviar los registros de recursos a un área de trabajo de Log Analytics. Use Azure Policy para garantizar una configuración coherente a través de diferentes clústeres.
El envío de registros de recursos a un área de trabajo tiene un costo; recopile solo las categorías de registro que tenga intención de usar. Para una descripción de las categorías disponibles para AKS, consulte Registros de recurso. Empiece recopilando un número mínimo de categorías y, después, modifique la configuración de diagnóstico para recopilar más categorías a medida que aumenten sus necesidades y conozca los costes asociados. Puede enviar registros a una cuenta de almacenamiento de Azure para reducir los costos si necesita conservar la información con fines de cumplimiento. Para más información sobre el costo de ingerir y conservar los datos de registro, consulte Detalles de precios de los registros de Azure Monitor.
Si no conoce con seguridad qué registros de recursos habilitar inicialmente, use las recomendaciones siguientes, que están basadas en los requisitos más comunes de los clientes. Puede habilitar otras categorías más adelante si es necesario.
Categoría | ¿Habilitar? | Destination |
---|---|---|
kube-apiserver | Habilitar | Área de trabajo de Log Analytics |
kube-audit | Habilitar | Azure Storage. Reduce al mínimo los costes, pero conserva los registros de auditoría si lo requiere un auditor. |
kube-audit-admin | Habilitar | Área de trabajo de Log Analytics |
kube-controller-manager | Habilitar | Área de trabajo de Log Analytics |
kube-scheduler | Deshabilitar | |
cluster-autoscaler | Habilitar si el escalado automático está habilitado. | Área de trabajo de Log Analytics |
guard | Habilitar si Microsoft Entra ID está habilitado | Área de trabajo de Log Analytics |
AllMetrics | Deshabilitar, ya que las métricas se recopilan en Prometheus administrado | Área de trabajo de Log Analytics |
Si tiene una solución existente para la recopilación de registros, siga las instrucciones de esa herramienta o habilite Container Insights y use la característica de exportación de datos del área de trabajo de Log Analytics para enviar datos a Azure Event Hubs para que se reenvíen al sistema alternativo.
Recopilación del registro de actividad para clústeres de AKS
Los cambios de configuración en los clústeres de AKS se almacenan en el Registro de actividades. Cree una configuración de diagnóstico para enviar estos datos al área de trabajo de Log Analytics para analizarlos con otros datos de supervisión. No hay ningún costo para esta recopilación de datos y puede analizar o alertar sobre los datos mediante Log Analytics.
Supervisión de nivel 2: componentes de nivel de clúster
El nivel de clúster incluye los siguientes componentes:
Componente | Requisitos de supervisión |
---|---|
Nodo | Conozca el estado de preparación y el rendimiento de la CPU, la memoria, el disco y la utilización de IP para cada nodo y supervise de forma proactiva sus tendencias de uso antes de implementar cargas de trabajo. |
A continuación, se muestran escenarios comunes para la supervisión de componentes de nivel de clúster.
Container Insights
- En la vista Clúster se observa el rendimiento de los nodos del clúster, incluido el uso de CPU y memoria.
- Use la vista Nodos para consultar el estado de cada nodo, además del estado y rendimiento de los pods que se ejecutan en cada uno de ellos. Consulte Supervisión del rendimiento del clúster de Kubernetes con Container Insights para más información sobre cómo usar esta vista y analizar el estado y el rendimiento de los nodos.
- En Informes, use los libros Supervisión de nodos para analizar la capacidad del disco, la E/S de disco y el uso de GPU. Para más información sobre estos libros, consulte Libros de supervisión de nodos.
- En Supervisión, seleccione Libros y Uso de IP de subred para ver la asignación de IP en cada nodo para un intervalo de tiempo seleccionado.
Paneles de Grafana
- Use el panel precompilado en Managed Grafana para Kubelet para ver el estado y el rendimiento de cada uno.
- Use paneles de Grafana con valores de métricas de Prometheus relacionados con el disco, como
node_disk_io_time_seconds_total
ywindows_logical_disk_free_bytes
para supervisar el almacenamiento conectado. - Hay varios paneles de Kubernetes disponibles que visualizan el rendimiento y el estado de los nodos en función de los datos almacenados en Prometheus.
Log Analytics
- Seleccione la categoría Contenedores en el cuadro de diálogo de consultas del área de trabajo de Log Analytics para acceder a las consultas de registro precompiladas del clúster, incluida la consulta de registro de Inventario de imágenes, que recupera datos de la tabla ContainerImageInventory rellenada por Container Insights.
Solución de problemas
- En escenarios de solución de problemas, es posible que deba acceder a los nodos directamente por efectos de mantenimiento o recopilación inmediata de registros. Aunque, por motivos de seguridad, los nodos de AKS no están expuestos a Internet, puede usar el comando
kubectl debug
para conectarse a ellos mediante SSH. Para más información sobre este proceso, consulte Conexión con SSH a los nodos de clúster de Azure Kubernetes Service (AKS) para mantenimiento o solución de problemas.
Análisis de costos
- Configure OpenCost, que es un proyecto de espacio aislado CNCF independiente del proveedor y de código abierto para comprender los costos de Kubernetes, con la finalidad de mejorar su análisis de costos del clúster. Exporta datos detallados de costos a Azure Storage.
- Use datos de OpenCost para desglosar el uso relativo del clúster por diferentes equipos de su organización para poder asignar el costo entre cada uno.
- Use datos de OpenCost para asegurarse de que el clúster usa la capacidad completa de sus nodos mediante cargas de trabajo de empaquetado denso, con menos nodos grandes en lugar de muchos nodos más pequeños.
Supervisión de nivel 3: componentes de Kubernetes administrados
El nivel de Kubernetes administrado incluye los siguientes componentes:
Componente | Supervisión |
---|---|
Servidor de API | Supervise el estado del servidor de API e identifique cualquier aumento de la carga de solicitudes y cuellos de botella si el servicio está fuera de servicio. |
Kubelet | La supervisión de Kubelet contribuye a solucionar problemas relacionados con la administración de pods, pods que no se inician, nodos que no están listos o pods que se van a eliminar. |
A continuación, se muestran escenarios comunes de supervisión de componentes de Kubernetes administrados.
Container Insights
- En Supervisión, seleccione Métricas para ver el contador Solicitudes en proceso.
- En Informes, use el libro Kubelet para consultar el estado y el rendimiento de cada kubelet. Para más información sobre estos libros, consulte Libros de supervisión de recursos.
Grafana
- Use el panel precompilado en Managed Grafana para Kubelet para ver el estado y el rendimiento de cada kubelet.
- Use un panel como apiserver de Kubernetes para obtener una vista completa del rendimiento del servidor de API. (incluidos valores como la latencia de solicitudes y el tiempo de procesamiento de la cola de trabajo).
Log Analytics
Use consultas de registro con registros de recursos para analizar registros del plano de control generados por componentes de AKS.
Todas las actividades de configuración de AKS se registran en el Registro de actividades. Al enviar el Registro de actividades a un área de trabajo de Log Analytics, puede analizarlo con Log Analytics. Por ejemplo, la siguiente consulta de ejemplo se puede usar para devolver registros que identifican una actualización correcta en todos los clústeres de AKS.
AzureActivity | where CategoryValue == "Administrative" | where OperationNameValue == "MICROSOFT.CONTAINERSERVICE/MANAGEDCLUSTERS/WRITE" | extend properties=parse_json(Properties_d) | where properties.message == "Upgrade Succeeded" | order by TimeGenerated desc
Solución de problemas
- En escenarios de solución de problemas, puede acceder a los registros de kubelets usando el proceso que se describe en Obtención de registros de kubelet desde nodos de clúster de Azure Kubernetes Service (AKS).
Supervisión de nivel 4: objetos y cargas de trabajo de Kubernetes
El nivel de los objetos y las cargas de trabajo de Kubernetes incluye los siguientes componentes:
Componente | Requisitos de supervisión |
---|---|
Implementaciones | Compare el estado real de la implementación con el deseado y supervise el estado y el uso de recursos de los pods que se ejecutan en ellos. |
Pods | Supervise el estado y el uso de recursos, incluidas la CPU y la memoria, de los pods que se ejecutan en el clúster de AKS. |
Contenedores | Supervise el uso de los recursos, incluidas la CPU y la memoria, de los contenedores que se ejecutan en el clúster de AKS. |
A continuación, se muestran escenarios comunes para supervisar los objetos y cargas de trabajo de Kubernetes.
Container Insights
- Use las vistas Nodos y Controladoras para consultar el estado y el rendimiento de los pods que se ejecutan en ellos y explorar en profundidad los de sus contenedores.
- Use la vista Contenedores para ver el estado y el rendimiento de los contenedores. Consulte Supervisión del rendimiento del clúster de Kubernetes con Container Insights para más información sobre cómo usar esta vista y analizar el estado y el rendimiento de los contenedores.
- En Informes, use el libro Implementaciones para ver las métricas de implementación. Para obtener más información, consulte Implementación y métricas de HPA con Container Insights.
Paneles de Grafana
- Use los paneles precompilados en Managed Grafana para Nodos y Pods para ver su estado y rendimiento.
- Hay varios paneles de Kubernetes disponibles que visualizan el rendimiento y el estado de los nodos en función de los datos almacenados en Prometheus.
Datos en directo
- En escenarios de solución de problemas, Container Insights proporciona acceso a los registros de contenedores de AKS (stdout/stderror), eventos y métricas de pod en directo. Para más información sobre esta característica, consulte Visualización de registros de Kubernetes, eventos y métricas de pod en tiempo real.
Alertas para el ingeniero de plataformas
Las alertas de Azure Monitor notifican al usuario proactivamente sobre datos y patrones interesantes en los datos de supervisión. Permiten identificar y solucionar las incidencias en el sistema antes de que los clientes puedan verlos. Si tiene una solución ITSM existente para el servicio de alertas, puede integrarla con Azure Monitor. También puede exportar los datos del área de trabajo para enviar datos desde el área de trabajo de Log Analytics a otra ubicación que admita la solución de alertas actual.
Tipos de alerta
En la tabla siguiente, se describen los distintos tipos de reglas de alerta personalizadas que puede crear en función de los datos recopilados por los servicios descritos anteriormente.
Tipo de alerta | Descripción |
---|---|
Alertas de Prometheus | Las alertas de Prometheus se escriben en el lenguaje de consulta Prometheus (Prom QL) y se aplican en las métricas de Prometheus almacenadas en los servicios administrados de Azure Monitor para Prometheus. Las alertas recomendadas ya incluyen las alertas de Prometheus más comunes, y puede crear más reglas de alertas según sea necesario. |
Reglas de alertas de métricas | Las reglas de alertas de métricas usan los mismos valores de métrica que el explorador de Métricas. De hecho, puede crear una regla de alertas directamente desde el explorador de Métricas con los datos que esté analizando. Las reglas de alertas de métricas pueden ser útiles para alertar sobre el rendimiento de AKS mediante cualquiera de los valores de las métricas de referencia de datos de AKS. |
Reglas de alerta de búsqueda de registros | Use reglas de alertas de búsqueda de registros para generar una alerta a partir de los resultados de una consulta de registro. Para obtener más información,vea Creación de alertas de búsqueda de registros desde Container Insights y Consulta de registros desde Container Insights. |
Alertas recomendadas
Comience con un conjunto de alertas de Prometheus recomendadas de las reglas de alertas de métricas en Container Insights (versión preliminar),, que incluyen las condiciones de alertas más comunes para un clúster de Kubernetes. Puede agregar más reglas de alertas en el futuro a medida que identifique más condiciones de alertas.
Developer
Además de desarrollar la aplicación, el desarrollador mantiene la aplicación que se ejecuta en el clúster. Es responsable del tráfico específico de la aplicación, incluidos el rendimiento y los errores de la aplicación. Además, mantiene la confiabilidad de la aplicación según los Acuerdos de Nivel de Servicio definidos por la empresa.
Servicios de Azure para desarrolladores
En la tabla siguiente, se muestran los servicios que suele usar el desarrollador para supervisar el estado y el rendimiento de la aplicación que se ejecuta en el clúster.
Servicio | Descripción |
---|---|
Application Insights | Característica de Azure Monitor que proporciona supervisión de rendimiento de aplicaciones (APM, por sus siglas en inglés) para supervisar las aplicaciones que se ejecutan en el clúster de Kubernetes desde el desarrollo, hasta las pruebas y, finalmente, la producción. Identifique y mitigue rápidamente los problemas de latencia y confiabilidad mediante seguimientos distribuidos. Admite OpenTelemetry para la instrumentación neutral del proveedor. |
Consulte Conceptos básicos de recopilación de datos de Application Insights de Azure Monitor para obtener opciones sobre cómo configurar la recopilación de datos desde la aplicación que se ejecuta en el clúster y los criterios de decisión sobre el mejor método para sus requisitos concretos.
Supervisión de nivel 5: aplicación
A continuación, se muestran escenarios comunes para supervisar la aplicación.
Rendimiento de la aplicación
- Use la vista Rendimiento de Application Insights para ver el rendimiento de las distintas operaciones de la aplicación.
- Use el .NET Profiler para capturar y ver los seguimientos de rendimiento de su aplicación.
- Use el Mapa de aplicaciones para ver las dependencias entre los componentes de la aplicación e identificar los cuellos de botella.
- Habilite el seguimiento distribuido, que proporciona un generador de perfiles de rendimiento que funciona como pilas de llamadas para arquitecturas de microservicios y en la nube, para obtener una mejor observabilidad en la interacción entre los servicios.
Errores de aplicación
- Use la pestaña Errores de Application Insights para ver el número de solicitudes con errores y las excepciones más comunes.
- Asegúrese de que las alertas de anomalías de error identificadas con la detección inteligente estén configuradas correctamente.
Supervisión del estado
- Cree una prueba de disponibilidad en Application Insights para crear una prueba periódica para supervisar la disponibilidad y la capacidad de respuesta de la aplicación.
- Use el informe del Acuerdo de Nivel de Servicio para calcular y notificar acerca del Acuerdo de Nivel de Servicio para las pruebas web.
- Use anotaciones para identificar cuándo se implementa una nueva compilación para poder inspeccionar visualmente cualquier cambio en el rendimiento después de la actualización.
Registros de aplicaciones
- Container Insights envía registros stdout/stderr a un área de trabajo de Log Analytics. Consulte Registros de recursos para obtener una descripción de los distintos registros y Kubernetes Services para obtener una lista de las tablas a las que se envía cada uno.
Malla de servicio
- En el caso de los clústeres de AKS, implemente el complemento de malla de servicio basado en Istio, que proporciona observabilidad a la arquitectura de los microservicios. Istio es una malla de servicio de código abierto, que se superpone de forma transparente sobre las aplicaciones distribuidas existentes. El complemento ayuda en la implementación y administración de Istio para AKS.
Consulte también
- Consulte Supervisión de AKS para obtener instrucciones sobre la supervisión específica de Azure Kubernetes Service (AKS).