Система мониторинга и управления автопарком
- PM
- Analytics
- Backend
- Frontend
- QA
- DevOps
- Tech support
- Java/Spring
- Kafka
- Redis
- PostgreSQL
- PureApplication System
- RedHat OpenShift
- IBM MessageSight – MQTT брокер
- IBM Cloudant
- Prometheus
- EFK
У вас есть задача?
Давайте обсудим?
О клиенте
Группа ГАЗ – ведущая российская автомобилестроительная компания, специализирующаяся на разработке и производстве легких коммерческих автомобилей, среднетоннажных грузовиков, автобусов, силовых агрегатов и автокомпонентов. Группа ГАЗ объединяет 13 производственных предприятий в 8 регионах России, а также сбытовые и сервисные организации.
О проекте
Несколько лет назад автозавод выпустил на рынок цифровых услуг сервис по оказанию телематических услуг GAZ Connect, который позволяет вести удаленный контроль за автомобилем, быть на связи с дилером и открывает доступ к партнерским программам. Также с помощью мобильного приложения ГАЗ пользователи могут отслеживать топливные расходы и существенно повысить рентабельность бизнеса на перевозках.
Описание задачи
Число пользователей сервиса по оказанию телематических услуг ежегодно растет, поэтому компания ГАЗ стала планировать расширение ресурса платформы и готовиться к подключению 200 тыс. новых автомобилей, которые в среднем генерируют более 40 тыс. сообщений в секунду. С учетом такого количества клиентов, объем ежемесячной телеметрии составляет более 80 Тбайт. Автомобильному производителю требовалось реализовать в платформе GAZ Connect возможность гибкой настройки параметров, их оптимизации.
В связи с чем возникла потребность в модернизации архитектуры существующего сервиса с целью обеспечения высокой производительности и отказоустойчивости. Во время разработки было необходимо учесть отсутствие в платформе единой точки отказа и концентрации нагрузки и предусмотреть возможность масштабирования платформы без доработок.
Реализация
В ходе реализации системы сбора и обработки данных, включающую подсистему управления бортовыми телематическими устройствами (установленными в автомобилях ГАЗ), была существенно переработана архитектура прикладной части сервиса, изменен их состав и зависимости. Кроме того, в процессе работы оптимизировали инфраструктуру частного облака, в котором эксплуатируется платформа в части эффективного управления вычислительными ресурсами и обеспечения отказоустойчивости.
Частное облако построено на конфигурации PureApplication System, которая обеспечивает размещение виртуальных ресурсов на физических серверах, динамическое выделение вычислительных ресурсов и эвакуацию виртуальных ресурсов на доступные работоспособные физические ресурсы в случае сбоя или отказа оборудования. Также система позволяет мониторить состояние сервиса и нагрузку на физические и виртуальные ресурсы.
Для построения прикладной части платформы используется микросервисная архитектура, сервисы которой функционируют в кластере RedHat OpenShift и включают в себя Service Mesh, Istio и Kiali. Благодаря такому построению ГАЗ обеспечивает автоматическое масштабирование сервисов в зависимости от изменения на них нагрузки, эффективную балансировку нагрузки между сервисами и автоматическое восстановление их работоспособности в случае сбоев.
Для приема данных с бортовых телематических устройств и отправки команд на устройства используется высокопроизводительный MQTT брокер IBM MessageSight, который производит аутентификацию бортового устройства в LDAP при его подключении, получение и буферизацию данных, поступающих от бортовых устройств.
Также при модернизации приложения особое внимание уделили мониторингу и превентивному выявлению рисков, связанных со снижением производительности системы или отказов ее компонентов. В связи с чем была внедрена подсистема мониторинга, журналирования и аудита. Дополнитеной задаче была обозначена разработка процессов управления данными на основе референсной модели DAMA-DMBoK.
Результат
По завершению обновления платформы компания ГАЗ смогла обеспечить эффективное использование ресурсов и снизить затраты на эксплуатацию системы. За два года использования продукта критических сбоев в работе системы не выявлено. Автопроизводитель обеспечил необходимый уровень отказоустойчивости и производительности системы, а также наладил автоматическое масштабирование сервисов в зависимости от нагрузки.
В настоящий момент осуществляется техническая поддержка и оказывается помощь в решении вопросов, возникающих при эксплуатации системы.