Система мониторинга построена на базе VictoriaMetrics и развернута в Kubernetes кластере.
- vminsert - прием метрик
- vmselect - чтение метрик
- vmstorage - хранение метрик
- Namespace:
vmcluster
- Режим: High Availability (2 реплики)
- Назначение: сбор и отправка метрик в VMCluster
- Namespace:
vmcluster
- Назначение: обработка правил алертинга
- Namespace:
vmcluster
- Интеграция: с Alertmanager
- Назначение: маршрутизация и доставка уведомлений
- Namespace:
vmcluster
- Telegram Bot: @ZubatMonitoring (chat_id: -5192759658)
- Покрытие: все ноды инфраструктуры
- Метрики: CPU, память, диски, сеть
- Покрытие: 9 серверов
- Метрики: температура, вентиляторы, питание
- Устройства: DLink DGS-1510-52X
- Метрики: интерфейсы, статистика коммутатора
- Серверы: db-01 (.121), db-02 (.122), db-03 (.123)
- Метрики: производительность БД, соединения, блокировки
- Метод: push метрик в VMInsert
- Назначение: мониторинг источников бесперебойного питания
- Назначение: сбор и агрегация логов
- Интеграция: с Grafana для визуализации
- Masters: master-01, master-02, master-03
- Workers: worker-01..06
- Доступ: через ansible-01 (192.168.100.100)
- Ноды: srv3, srv4, srv7-13
- Мониторинг: через node-exporter и IPMI
- Серверы: db-01..03
- Мониторинг: postgres-exporter
- HAProxy: .131, .132
- Мониторинг: через node-exporter
- Grafana: https://grafana.k8s.cloud.zubat.ru
- VMSelect: внутренний endpoint в кластере
- VMInsert: внутренний endpoint для приема метрик
- Alertmanager: внутренний endpoint в ns vmcluster
- SSH: через ansible-01 (root@192.168.100.100)
- Kubernetes: kubectl конфигурация на ansible-01
- Мониторинг: Grafana web UI
- Bot: @ZubatMonitoring
- Chat ID: -5192759658
- Типы алертов: критические системные события, производительность, доступность сервисов
- Управляются через VMAlert в namespace
vmcluster
- Конфигурация в Kubernetes манифестах