Автоматизация скоринговых моделей с помощью MLOps

Экспертиза

DevOps
ML

Техстек

Kubernetes
Kubeflow
Terraform
Iceberg
PostgreSQL
S3
Feast
Tecton
MLflow
Airflow
DVC
TensorFlow
PyTorch
CatBoost
Transformers
KServe
Arize
ArgoCD
FluxCD
MLflow Model Registry

У вас есть задача? Давайте обсудим!

О клиенте

Банк является головной компанией холдинговой группы, которая объединяет организации в сферах страхования, управления активами, лизинга и других финансовых услуг. Учреждение занимает лидирующие позиции в кредитовании малого и среднего бизнеса и активно внедряет цифровые решения, чтобы клиенты могли пользоваться сервисами 24/7. Филиальная сеть насчитывает 1200+ отделений по всей России.

О проекте

Клиент активно использует скоринговые модели для оценки кредитоспособности физических и юридических лиц. Однако по мере роста объемов данных и расширения продуктовой линейки стало очевидно, что существующие процессы разработки и внедрения ML-моделей работают медленно и требуют значительных ресурсов. От момента создания алгоритмов до их интеграции в систему проходило слишком много времени.

Описание задачи

Бизнес принял решение автоматизировать управление моделями машинного обучения с помощью MLOps. Такой подход позволяет стандартизировать жизненный цикл ML: ускорить деплой, автоматизировать мониторинг качества и упростить обновление алгоритмов. Основные требования включали:

Разработку конвейеров (pipelines) для обучения, тестирования и развертывания моделей.
Централизованное управление версиями.
Масштабирование архитектуры вычислений.
Обеспечение быстрого цикла от эксперимента до продакшна.

Реализация

RedLab привлекла ML- и DevOps-инженеров, которые стали частью команды разработки. Аутстафф-специалисты выполнили ряд задач:

Определили оптимальную архитектуру ML-решений и реализовали алгоритмы обучения скоринговых моделей с учетом специфики клиентских данных.
Использовали контейнеризацию на базе Docker и оркестрацию в Kubernetes, что обеспечило отказоустойчивость и масштабируемость сервисов.
Построили пайплайны для подготовки данных и развертывания моделей с возможностью регулярного переобучения.
Настроили GitHub Actions для автоматической сборки и тестирования алгоритмов при каждом изменении кода.
Для соблюдения регуляторных требований применили подходы explainable AI (SHAP, LIME), интегрировав их в процесс MLOps, чтобы формировать интерпретируемые отчеты для внутреннего аудита и ЦБ.

Обеспечили воспроизводимость экспериментов за счет трекинга зависимостей и окружений, а также логирования гиперпараметров и результатов.
Реализовали переобучение ML-моделей на новых сведениях с сохранением исторических версий в model registry. Это позволило применять стратегию отката и проводить A/B-тестирование альтернативных версий в проде.
Организовали непрерывный мониторинг качества работающих алгоритмов с помощью ClearML и KubeFlow. Настроили метрики для отслеживания деградации и data drift, а также интегрировали алерты и дашборды для риск-аналитиков.

Результат

Внедрение MLOps позволило снизить риск ошибок и повысить точность скоринга при оценке кредитоспособности физических и юридических лиц. Время отклика алгоритмов составляет менее 200 мс при росте объема данных. Теперь клиент оперативно реагирует на изменения клиентского поведения, предлагает заемщикам индивидуальные условия и выявляет мошенников.

Переходите по ссылке, чтобы узнать об аутсорсинге MLOps инженеров больше.