Голосовой помощник для федерального мобильного приложения
- Backend
- AI/ML
- UX/UI Design
- Python
- LLM
- NLP
- Voice Interfaces
- Prompt Engineering
У вас есть задача? Давайте обсудим!
О клиенте
Официальное мобильное приложение государственного портала, предназначенное для доступа горожан к цифровым услугам и сервисам столицы. Платформа активно развивается и охватывает ключевые жизненные сценарии москвичей: здравоохранение, образование, ЖКХ и другие городские сервисы. Один из приоритетов клиента — повышение удобства и доступности услуг за счет современных интерфейсов взаимодействия.
О проекте
Цель проекта — разработка кастомного голосового помощника для приложения, который позволяет пользователям получать доступ к городским услугам с помощью голосовых команд. Ассистент стал новым каналом взаимодействия с сервисами, ориентированным на быстрое решение повседневных задач без необходимости ручного ввода.
Описание задачи
Перед командой стояла задача создать интеллектуального голосового помощника, который:
- предоставляет доступ к ключевым услугам приложения через голосовой интерфейс (запись к врачу, передача показаний, информация об учебе ребенка);
- отвечает на вопросы пользователей о возможностях и сервисах приложения;
- поддерживает короткие диалоги (small talk) для повышения естественности общения;
- предоставляет справочную и инструктивную информацию с портала mos.ru в разговорном формате;
- корректно распознает пользовательские намерения и формирует релевантные ответы.
Реализация
В рамках проекта команда выполнила следующие работы:
- Подготовка данных: сформированы и размечены обучающие датасеты для распознавания намерений пользователей и генерации ответов.
- Prompt Engineering: разработаны системные промпты и сценарии диалогов для устойчивой и предсказуемой работы LLM.
- Интеграция LLM: проведено тестирование различных моделей и конфигураций для достижения оптимального качества ответов.
- Диалоговый модуль: реализован чат-бот с поддержкой сервисных запросов и разговорных сценариев.
- UX/UI-дизайн: спроектированы голосовые и текстовые сценарии взаимодействия, обеспечивающие понятный и дружелюбный пользовательский опыт.
- Тестирование: проведена проверка качества распознавания, корректности ответов и устойчивости диалогов в реальных пользовательских сценариях.