Aracılığıyla paylaş


Azure İzleyici'de varsayılan Prometheus ölçümleri yapılandırması

Bu makalede, herhangi bir AKS kümesi için Azure Kubernetes Service (AKS) kümesinden kazınacak Prometheus ölçümlerini yapılandırdığınızda varsayılan hedefler, panolar ve kayıt kuralları listelenir.

Minimum veri alımı profili

Minimal ingestion profile , yalnızca varsayılan panolar tarafından kullanılan ölçümler, varsayılan kayıt kuralları ve varsayılan uyarılar toplandığından, ölçümlerin alım hacmini azaltmaya yardımcı olan bir ayardır. Addon tabanlı koleksiyon için ayar Minimal ingestion profile varsayılan olarak etkindir. Aşağıda belirtildiği gibi daha fazla ölçüm toplamayı etkinleştirmek için koleksiyonu değiştirebilirsiniz.

Kazıma sıklığı

Tüm varsayılan hedefler ve kazımalar için varsayılan kazıma sıklığı 30 saniyedir.

Varsayılan olarak kazınmış hedefler

Aşağıdaki hedefler varsayılan olarak etkinleştirilir/AÇILIR ; yani ölçüm eklentisi bu hedefleri varsayılan olarak otomatik olarak kazıyacağı için bu hedefleri kazımak için herhangi bir kazıma işi yapılandırması sağlamanız gerekmez.

  • cadvisor (job=cadvisor)
  • nodeexporter (job=node)
  • kubelet (job=kubelet)
  • kube-state-metrics (job=kube-state-metrics)
  • networkobservabilityRetina (job=networkobservabilityRetina)

Denetim düzlemi ölçümleri (önizleme) özelliğini etkinleştirdiğinizde aşağıdaki hedefler etkinleştirilir/ON olur. Genel gözlemlenebilirliği en üst düzeye çıkarmak ve AKS kümeniz için operasyonel mükemmelliği korumak için denetim düzlemi ölçümlerini kullanabilirsiniz. Daha fazla bilgi için bkz . Denetim düzlemi ölçümleri (önizleme).

  • controlplane-apiserver (job=controlplane-apiserver)
  • controlplane-etcd (job=controlplane-etcd)

Aşağıdaki hedefler , Gelişmiş Kapsayıcı Ağ Hizmetleri paketinin bir özelliği olan ve Hem Cilium hem de Cilium tabanlı olmayan veri düzlemi için Hubble ile sorunsuz bir şekilde tümleştirilen tüm Linux iş yükleriyle uyumlu olan Kapsayıcı Ağı Gözlemlenebilirliğini etkinleştirdiğinizde etkinleştirilir/ON olur. Bu, kapsayıcı ağ gereksinimleriniz için esneklik sağlar. Daha fazla bilgi için bkz . Gelişmiş Kapsayıcı Ağ Hizmetleri.

  • networkobservabilityHubble (job=networkobservabilityHubble)
  • networkobservabilityCilium (job=networkobservabilityCilium)

Kapsayıcılar için yerel olarak oluşturulmuş ve AKS ile yerel olarak tümleşen bulut tabanlı bir birim yönetimi, dağıtım ve düzenleme hizmeti olan Azure Container Storage'ı etkinleştirdiğinizde aşağıdaki hedefler etkinleştirilir/AÇILIR . Daha fazla bilgi için bkz . Azure Container Storage.

  • acstor-capacity-provisioner (job=acstor-capacity-provisioner)
  • acstor-metrics-exporter (job=acstor-metrics-exporter)

Varsayılan hedeflerden toplanan ölçümler

Aşağıdaki ölçümler varsayılan olarak her varsayılan hedeften toplanır. Diğer tüm ölçümler yeniden etiketleme kuralları aracılığıyla bırakılır.

cadvisor (job=cadvisor)

  • container_spec_cpu_period
  • container_spec_cpu_quota
  • container_cpu_usage_seconds_total
  • container_memory_rss
  • container_network_receive_bytes_total
  • container_network_transmit_bytes_total
  • container_network_receive_packets_total
  • container_network_transmit_packets_total
  • container_network_receive_packets_dropped_total
  • container_network_transmit_packets_dropped_total
  • container_fs_reads_total
  • container_fs_writes_total
  • container_fs_reads_bytes_total
  • container_fs_writes_bytes_total
  • container_memory_working_set_bytes
  • container_memory_cache
  • container_memory_swap
  • container_cpu_cfs_throttled_periods_total
  • container_cpu_cfs_periods_total
  • container_memory_usage_bytes
  • kubernetes_build_info"

kubelet (job=kubelet)

  • kubelet_volume_stats_used_bytes
  • kubelet_node_name
  • kubelet_running_pods
  • kubelet_running_pod_count
  • kubelet_running_containers
  • kubelet_running_container_count
  • volume_manager_total_volumes
  • kubelet_node_config_error
  • kubelet_runtime_operations_total
  • kubelet_runtime_operations_errors_total
  • kubelet_runtime_operations_duration_seconds kubelet_runtime_operations_duration_seconds_bucket kubelet_runtime_operations_duration_seconds_sum kubelet_runtime_operations_duration_seconds_count
  • kubelet_pod_start_duration_seconds kubelet_pod_start_duration_seconds_bucket kubelet_pod_start_duration_seconds_sum kubelet_pod_start_duration_seconds_count
  • kubelet_pod_worker_duration_seconds kubelet_pod_worker_duration_seconds_bucket kubelet_pod_worker_duration_seconds_sum kubelet_pod_worker_duration_seconds_count
  • storage_operation_duration_seconds storage_operation_duration_seconds_bucket storage_operation_duration_seconds_sum storage_operation_duration_seconds_count
  • storage_operation_errors_total
  • kubelet_cgroup_manager_duration_seconds kubelet_cgroup_manager_duration_seconds_bucket kubelet_cgroup_manager_duration_seconds_sum kubelet_cgroup_manager_duration_seconds_count
  • kubelet_pleg_relist_duration_seconds kubelet_pleg_relist_duration_seconds_bucket kubelet_pleg_relist_duration_sum kubelet_pleg_relist_duration_seconds_count
  • kubelet_pleg_relist_interval_seconds kubelet_pleg_relist_interval_seconds_bucket kubelet_pleg_relist_interval_seconds_sum kubelet_pleg_relist_interval_seconds_count
  • rest_client_requests_total
  • rest_client_request_duration_seconds rest_client_request_duration_seconds_bucket rest_client_request_duration_seconds_sum rest_client_request_duration_seconds_count
  • process_resident_memory_bytes
  • process_cpu_seconds_total
  • go_goroutines
  • kubelet_volume_stats_capacity_bytes
  • kubelet_volume_stats_available_bytes
  • kubelet_volume_stats_inodes_used
  • kubelet_volume_stats_inodes
  • kubernetes_build_info"

nodexporter (job=node)

  • node_cpu_seconds_total
  • node_memory_MemAvailable_bytes
  • node_memory_Buffers_bytes
  • node_memory_Cached_bytes
  • node_memory_MemFree_bytes
  • node_memory_Slab_bytes
  • node_memory_MemTotal_bytes
  • node_netstat_Tcp_RetransSegs
  • node_netstat_Tcp_OutSegs
  • node_netstat_TcpExt_TCPSynRetrans
  • node_load1``node_load5
  • node_load15
  • node_disk_read_bytes_total
  • node_disk_written_bytes_total
  • node_disk_io_time_seconds_total
  • node_filesystem_size_bytes
  • node_filesystem_avail_bytes
  • node_filesystem_readonly
  • node_network_receive_bytes_total
  • node_network_transmit_bytes_total
  • node_vmstat_pgmajfault
  • node_network_receive_drop_total
  • node_network_transmit_drop_total
  • node_disk_io_time_weighted_seconds_total
  • node_exporter_build_info
  • node_time_seconds
  • node_uname_info"

kube-state-metrics (job=kube-state-metrics)

  • kube_job_status_succeeded
  • kube_job_spec_completions
  • kube_daemonset_status_desired_number_scheduled
  • kube_daemonset_status_number_ready
  • kube_deployment_status_replicas_ready
  • kube_pod_container_status_last_terminated_reason
  • kube_pod_container_status_waiting_reason
  • kube_pod_container_status_restarts_total
  • kube_node_status_allocatable
  • kube_pod_owner
  • kube_pod_container_resource_requests
  • kube_pod_status_phase
  • kube_pod_container_resource_limits
  • kube_replicaset_owner
  • kube_resourcequota
  • kube_namespace_status_phase
  • kube_node_status_capacity
  • kube_node_info
  • kube_pod_info
  • kube_deployment_spec_replicas
  • kube_deployment_status_replicas_available
  • kube_deployment_status_replicas_updated
  • kube_statefulset_status_replicas_ready
  • kube_statefulset_status_replicas
  • kube_statefulset_status_replicas_updated
  • kube_job_status_start_time
  • kube_job_status_active
  • kube_job_failed
  • kube_horizontalpodautoscaler_status_desired_replicas
  • kube_horizontalpodautoscaler_status_current_replicas
  • kube_horizontalpodautoscaler_spec_min_replicas
  • kube_horizontalpodautoscaler_spec_max_replicas
  • kubernetes_build_info
  • kube_node_status_condition
  • kube_node_spec_taint
  • kube_pod_container_info
  • kube_resource_labels (ör. kube_pod_labels, kube_deployment_labels)
  • kube_resource_annotations (ör. kube_pod_annotations, kube_deployment_annotations)

controlplane-apiserver (job=controlplane-apiserver)

  • apiserver_request_total
  • apiserver_cache_list_fetched_objects_total
  • apiserver_cache_list_returned_objects_total
  • apiserver_flowcontrol_demand_seats_average
  • apiserver_flowcontrol_current_limit_seats
  • apiserver_request_sli_duration_seconds_bucket
  • apiserver_request_sli_duration_seconds_count
  • apiserver_request_sli_duration_seconds_sum
  • process_start_time_seconds
  • apiserver_request_duration_seconds_bucket
  • apiserver_request_duration_seconds_count
  • apiserver_request_duration_seconds_sum
  • apiserver_storage_list_fetched_objects_total
  • apiserver_storage_list_returned_objects_total
  • apiserver_current_inflight_requests

controlplane-etcd (job=controlplane-etcd)

  • etcd_server_has_leader
  • rest_client_requests_total
  • etcd_mvcc_db_total_size_in_bytes
  • etcd_mvcc_db_total_size_in_use_in_bytes
  • etcd_server_slow_read_indexes_total
  • etcd_server_slow_apply_total
  • etcd_network_client_grpc_sent_bytes_total
  • etcd_server_heartbeat_send_failures_total

networkobservabilityHubble (job=networkobservabilityHubble)ve networkobservabilityCilium (job=networkobservabilityCilium)
Bu hedefler tarafından toplanan ölçümlerin listesi için bkz. Kapsayıcı Ağı Gözlemlenebilirliği ölçümleri

acstor-capacity-provisioner (job=acstor-capacity-provisioner) ve acstor-metrics-exporter (job=acstor-metrics-exporter)
Bu hedefler tarafından toplanan ölçümlerin listesi için bkz . Azure Container Storage ölçümleri.

Windows için kazınmış varsayılan hedefler

Aşağıdaki Windows hedefleri kazınacak şekilde yapılandırılır, ancak kazıma varsayılan olarak etkin değildir (devre dışı/KAPALI), yani bu hedefleri kazımak için herhangi bir kazıma işi yapılandırması sağlamanız gerekmez, ancak bunlar varsayılan olarak devre dışı bırakılır/KAPALI olur ve bölüm altında default-scrape-settings-enabled ama-metrics-settings-configmap kullanarak bu hedefler için kazıma özelliğini AÇIN/etkinleştirmeniz gerekir.

Windows için, Windows'a özgü panolar için gereken ölçümleri kazıyan iki varsayılan iş çalıştırılabilir.

  • windows-exporter (job=windows-exporter)
  • kube-proxy-windows (job=kube-proxy-windows)

Not

Bunun için yapılandırma haritasının ama-metrics-settings-configmap uygulanması veya güncelleştirilmesi ve tüm Windows düğümlerine yüklenmesi windows-exporter gerekir. Daha fazla bilgi için etkinleştirme belgesine bakın.

Windows için kazınmış ölçümler

Windows-exporter ve kube-proxy-windows etkinleştirildiğinde aşağıdaki ölçümler toplanır.

windows-exporter (job=windows-exporter)

  • windows_system_system_up_time
  • windows_cpu_time_total
  • windows_memory_available_bytes
  • windows_os_visible_memory_bytes
  • windows_memory_cache_bytes
  • windows_memory_modified_page_list_bytes
  • windows_memory_standby_cache_core_bytes
  • windows_memory_standby_cache_normal_priority_bytes
  • windows_memory_standby_cache_reserve_bytes
  • windows_memory_swap_page_operations_total
  • windows_logical_disk_read_seconds_total
  • windows_logical_disk_write_seconds_total
  • windows_logical_disk_size_bytes
  • windows_logical_disk_free_bytes
  • windows_net_bytes_total
  • windows_net_packets_received_discarded_total
  • windows_net_packets_outbound_discarded_total
  • windows_container_available
  • windows_container_cpu_usage_seconds_total
  • windows_container_memory_usage_commit_bytes
  • windows_container_memory_usage_private_working_set_bytes
  • windows_container_network_receive_bytes_total
  • windows_container_network_transmit_bytes_total

kube-proxy-windows (job=kube-proxy-windows)

  • kubeproxy_sync_proxy_rules_duration_seconds
  • kubeproxy_sync_proxy_rules_duration_seconds_bucket
  • kubeproxy_sync_proxy_rules_duration_seconds_sum
  • kubeproxy_sync_proxy_rules_duration_seconds_count
  • rest_client_requests_total
  • rest_client_request_duration_seconds
  • rest_client_request_duration_seconds_bucket
  • rest_client_request_duration_seconds_sum
  • rest_client_request_duration_seconds_count
  • process_resident_memory_bytes
  • process_cpu_seconds_total
  • go_goroutines

Panolar

Aşağıdaki varsayılan panolar, Azure İzleyici çalışma alanınızı bir Azure Yönetilen Grafana örneğine bağladığınızda Prometheus için Azure İzleyici yönetilen hizmeti tarafından otomatik olarak sağlanır ve yapılandırılır. Bu panoların kaynak kodu bu GitHub deposunda bulunabilir. Aşağıdaki panolar, Grafana klasöründe belirtilen Azure Grafana örneğinde Managed Prometheus sağlanacaktır. Bunlar, Prometheus ve Grafana ile Kubernetes kümelerini izlemeye yönelik standart açık kaynak topluluk panolarıdır.

  • Kubernetes / Compute Resources / Cluster
  • Kubernetes / Compute Resources / Namespace (Pods)
  • Kubernetes / Compute Resources / Node (Pods)
  • Kubernetes / Compute Resources / Pod
  • Kubernetes / Compute Resources / Namespace (Workloads)
  • Kubernetes / Compute Resources / Workload
  • Kubernetes / Kubelet
  • Node Exporter / USE Method / Node
  • Node Exporter / Nodes
  • Kubernetes / Compute Resources / Cluster (Windows)
  • Kubernetes / Compute Resources / Namespace (Windows)
  • Kubernetes / Compute Resources / Pod (Windows)
  • Kubernetes / USE Method / Cluster (Windows)
  • Kubernetes / USE Method / Node (Windows)

Kayıt kuralları

Aşağıdaki varsayılan kayıt kuralları, Prometheus ölçümlerini bir Azure Kubernetes Service (AKS) kümesinden kazınacak şekilde yapılandırdığınızda Prometheus için Azure İzleyici yönetilen hizmeti tarafından otomatik olarak yapılandırılır. Bu kayıt kurallarının kaynak kodu bu GitHub deposunda bulunabilir. Bunlar, yukarıdaki panolarda kullanılan standart açık kaynak kayıt kurallarıdır.

  • cluster:node_cpu:ratio_rate5m
  • namespace_cpu:kube_pod_container_resource_requests:sum
  • namespace_cpu:kube_pod_container_resource_limits:sum
  • :node_memory_MemAvailable_bytes:sum
  • namespace_memory:kube_pod_container_resource_requests:sum
  • namespace_memory:kube_pod_container_resource_limits:sum
  • namespace_workload_pod:kube_pod_owner:relabel
  • node_namespace_pod_container:container_cpu_usage_seconds_total:sum_irate
  • cluster:namespace:pod_cpu:active:kube_pod_container_resource_requests
  • cluster:namespace:pod_cpu:active:kube_pod_container_resource_limits
  • cluster:namespace:pod_memory:active:kube_pod_container_resource_requests
  • cluster:namespace:pod_memory:active:kube_pod_container_resource_limits
  • node_namespace_pod_container:container_memory_working_set_bytes
  • node_namespace_pod_container:container_memory_rss
  • node_namespace_pod_container:container_memory_cache
  • node_namespace_pod_container:container_memory_swap
  • instance:node_cpu_utilisation:rate5m
  • instance:node_load1_per_cpu:ratio
  • instance:node_memory_utilisation:ratio
  • instance:node_vmstat_pgmajfault:rate5m
  • instance:node_network_receive_bytes_excluding_lo:rate5m
  • instance:node_network_transmit_bytes_excluding_lo:rate5m
  • instance:node_network_receive_drop_excluding_lo:rate5m
  • instance:node_network_transmit_drop_excluding_lo:rate5m
  • instance_device:node_disk_io_time_seconds:rate5m
  • instance_device:node_disk_io_time_weighted_seconds:rate5m
  • instance:node_num_cpu:sum
  • node:windows_node:sum
  • node:windows_node_num_cpu:sum
  • :windows_node_cpu_utilisation:avg5m
  • node:windows_node_cpu_utilisation:avg5m
  • :windows_node_memory_utilisation:
  • :windows_node_memory_MemFreeCached_bytes:sum
  • node:windows_node_memory_totalCached_bytes:sum
  • :windows_node_memory_MemTotal_bytes:sum
  • node:windows_node_memory_bytes_available:sum
  • node:windows_node_memory_bytes_total:sum
  • node:windows_node_memory_utilisation:ratio
  • node:windows_node_memory_utilisation:
  • node:windows_node_memory_swap_io_pages:irate
  • :windows_node_disk_utilisation:avg_irate
  • node:windows_node_disk_utilisation:avg_irate
  • node:windows_node_filesystem_usage:
  • node:windows_node_filesystem_avail:
  • :windows_node_net_utilisation:sum_irate
  • node:windows_node_net_utilisation:sum_irate
  • :windows_node_net_saturation:sum_irate
  • node:windows_node_net_saturation:sum_irate
  • windows_pod_container_available
  • windows_container_total_runtime
  • windows_container_memory_usage
  • windows_container_private_working_set_usage
  • windows_container_network_received_bytes_total
  • windows_container_network_transmitted_bytes_total
  • kube_pod_windows_container_resource_memory_request
  • kube_pod_windows_container_resource_memory_limit
  • kube_pod_windows_container_resource_cpu_cores_request
  • kube_pod_windows_container_resource_cpu_cores_limit
  • namespace_pod_container:windows_container_cpu_usage_seconds_total:sum_rate

Prometheus görselleştirme kayıt kuralları

Prometheus tabanlı Container Insights kullandığınızda, Prometheus görselleştirmelerini desteklemek için daha fazla kayıt kuralı dağıtılır.

  • ux:cluster_pod_phase_count:sum
  • ux:node_cpu_usage:sum_irate
  • ux:node_memory_usage:sum
  • ux:controller_pod_phase_count:sum
  • ux:controller_container_count:sum
  • ux:controller_workingset_memory:sum
  • ux:controller_cpu_usage:sum_irate
  • ux:controller_rss_memory:sum
  • ux:controller_resource_limit:sum
  • ux:controller_container_restarts:max
  • ux:pod_container_count:sum
  • ux:pod_cpu_usage:sum_irate
  • ux:pod_workingset_memory:sum
  • ux:pod_rss_memory:sum
  • ux:pod_resource_limit:sum
  • ux:pod_container_restarts:max
  • ux:node_network_receive_drop_total:sum_irate
  • ux:node_network_transmit_drop_total:sum_irate

Windows desteği için aşağıdaki kayıt kuralları gereklidir. Bu kurallar yukarıdaki kurallarla birlikte dağıtılır, ancak varsayılan olarak etkinleştirilmez. Azure İzleyici çalışma alanınızda kural gruplarını etkinleştirme ve devre dışı bırakma yönergelerini izleyin.

  • ux:node_cpu_usage_windows:sum_irate
  • ux:node_memory_usage_windows:sum
  • ux:controller_cpu_usage_windows:sum_irate
  • ux:controller_workingset_memory_windows:sum
  • ux:pod_cpu_usage_windows:sum_irate
  • ux:pod_workingset_memory_windows:sum

Sonraki adımlar

Prometheus ölçümlerini kazıma işlemini özelleştirin.