Масштабирование ИТ-инфраструктуры для интернет-провайдера
- Analyst
- DevOps
- Tech support
- Docker
- Kubernetes
- Airflow
- Tensorflow
- Istio
- Velero
- Kube-prometheus-stack
- Helmwave
- ArgoCD
- Apache
- Kafka
Индустрия
Телеком
У вас есть задача?
Давайте обсудим?
О клиенте
Компания обеспечивает доступ к широкополосному интернету и цифровому телевидению в Краснодарском крае. Абоненты могут подключиться к сети со скоростью до 100 Мбит/с и смотреть 154 канала. Среди дополнительных опций: трансляция передач на трех независимых устройствах одновременно, интерактивное управление эфиром и наличие архива ТВ-вещаний за неделю.
О проекте
Для интернет-услуг провайдер использует технологию FTTB на базе скоростных волоконно-оптических магистралей с большим запасом пропускной способности. Однако недостаточная емкость ИТ-инфраструктуры приводила к снижению стабильности системы, что негативно влияло на удовлетворенность абонентов. Клиент хотел увеличить мощности программы и обеспечить ее бесперебойную работу.
Описание задачи
Из-за роста пользовательской базы и расширения спектра услуг требовалось модернизировать инфраструктуру. Команде RedLab предстояло оптимизировать имеющиеся ИТ-ресурсы и внедрить набор инструментов и сценариев, нацеленных на автоматизацию разработки.
Клиент сформулировал ряд функциональных требований к системе:
- Повышенная доступность: обеспечение сбалансированной нагрузки и распределение трафика по сети.
- Улучшенная производительность: добавление новых узлов, серверов и других компонентов для увеличения скорости выполнения задач.
- Непрерывное развертывание: внедрение инструментов DevOps, позволяющие быстро и легко управлять разработкой ИТ-продукта.
Реализация
После детального изучения проекта и анализа используемых технологий разработчики RedLab приступили к реализации проекта:
- Перенесли систему с платформы Nomad на Kubernetes, что позволило автоматически масштабировать приложения и эффективно использовать ресурсы.
- Создали личный GitLab, в котором настроили CI/CD. В нем же стали хранить инфраструктурный код Ansible и Terraform, чтобы отслеживать историю изменений в программе, контролировать проекты и репозитории.
- Организовали управление сетевой инфраструктуры по принципу IaC (Infrastructure as Code) для 2.000 коммутаторов и 30.000 активных абонентов — удалось масштабировать сеть и применить изменения к сетевым устройствам без ручного вмешательства.
- Для хранения секретных данных выбрали сервис HashiCorp Vault в режиме высокой доступности (HA). Единая авторизация теперь происходит через Keycloak OIDC.
- Написали 30 Helm чартов, которые обеспечили повторяемость развертываний компонентов и помогли легко управлять зависимостями, версиями и конфигурациями системы.
- Разместили автоматический учет оборудования в NetBox. Теперь найти информацию об устройствах, отследить их местоположение и историю стало проще.
- Установили приватное облако на Opennebula с AutoDiscovery от Consul на 40 серверах, что привело к эффективному распределению ресурсов между различными виртуальными машинами.
- Осуществили мониторинг и наблюдаемость ИТ-инфраструктуры на стеке Prometheus, Grafana, Alertmanager и NetXMS. Технологии помогают обрабатывать большое количество метрик в реальном времени, своевременно обнаруживать и устранять сбои.
Результат
Переходите по ссылке, чтобы узнать об аутсорсинге DevOps-услуг больше.