Чому потрібен моніторинг
Мережа провайдера — це сотні пристроїв. Роутери, комутатори, OLT, серверни. Будь-який може впасти в будь-який момент.
Без моніторингу:
- Дізнаєшся про проблему від абонентів
- Витрачаєш час на з'ясування "що впало"
- Реагуєш замість попереджати
З моніторингом:
- Система сповіщає про проблему за секунди
- Бачиш що, де, коли
- Часто виправляєш до того, як абоненти помітять
Що моніторити
1. Доступність (Availability)
Чи живий пристрій? Відповідає на ping?
ICMP echo request → Device Device → ICMP echo reply
Якщо немає відповіді 30+ секунд — alert.
2. Завантаження інтерфейсів
Скільки трафіку проходить через кожен порт.
- In: вхідний трафік (Mbps)
- Out: вихідний трафік (Mbps)
- Utilization: % від макс. швидкості
Якщо утілізація >80% — час апгрейдити канал.
3. Помилки на портах
- CRC errors: пошкоджені пакети (поганий кабель/SFP)
- Drops: скинуті пакети (перевантаження)
- Collisions: колізії (рідко на сучасному обладнанні)
4. Температура та живлення
Обладнання має датчики:
- Температура CPU/шасі
- Швидкість вентиляторів
- Напруга блоків живлення
Якщо температура >60°C — перегрів, треба чистити або охолоджувати.
5. Оптична потужність
SFP модулі вимірюють силу сигналу:
- TX power: скільки передаємо
- RX power: скільки приймаємо
Якщо RX нижче -25 dBm — проблема з кабелем або з'єднанням.
Інструменти
Zabbix
Система моніторингу з відкритим кодом. Ми використовуємо її.
Що моніторить:
- 50+ вузлів (роутери, комутатори, OLT)
- 5000+ портів (кожен абонентський порт)
- 10+ серверів (білінг, моніторинг, DNS)
Інтервал опитування: кожні 60 секунд.
SNMP (Simple Network Management Protocol)
Протокол для отримання статистики з обладнання.
Zabbix → SNMP GET request → Device Device → SNMP response (interface stats, temp, errors)
Кожен пристрій має SNMP OID (Object Identifier) для різних метрик.
NetFlow / sFlow
Аналіз трафіку: хто, куди, скільки.
- Топ IP-адрес за споживанням
- Топ протоколів (HTTP, BitTorrent, etc)
- Виявлення аномалій
Допомагає знайти проблеми: DDoS, зламані сервери, торренти.
Система сповіщень
Коли щось падає — Zabbix відправляє alert:
- Telegram: миттєве повідомлення в чат
- Email: деталі проблеми
- SMS: для критичних подій (магістраль)
Рівні severity:
| Info | Telegram | Інформація (зміна конфігурації) |
| Warning | Telegram + Email | Утілізація >80% |
| Average | Telegram + Email | Помилки на порті |
| High | Telegram + Email + Дзвінок | OLT offline |
| Disaster | Всі канали + SMS | Магістраль offline |
Приклад реального кейсу
Проблема: Абоненти в одному районі скаржаться на низьку швидкість.
Діагностика:
- Відкриваємо Zabbix → графік порту OLT
- Бачимо: утілізація 95%, постійно на межі
- Перевіряємо кількість абонентів: 62 на порті (норма 32-48)
- Рішення: перенести частину абонентів на інший порт
Час діагностики: 5 хвилин.
Без моніторингу: години здогадок і перевірок.
Що бачить абонент
Ми надаємо бізнес-клієнтам доступ до моніторингу:
- Статус вашого каналу (online/offline)
- Графіки трафіку (скільки використовуєте)
- Історія доступності
- Планові роботи
Доступ через особистий кабінет або окремий Grafana dashboard.
Висновки
- Моніторинг — не розкіш
Для провайдера це базова необхідність. - Чим швидше виявлення — тим менше простій
5 хвилин замість 30 — це різниця. - Дані допомагають планувати
Графіки росту трафіку показують, коли треба апгрейдити. - Питайте про моніторинг
"Як ви дізнаєтеся, що мій канал впав?" — хороше питання до провайдера.