VK (ВКонтакте)
Электронная коммерция
Россия
Апрель 2025
Сотрудничество VK и ZeBrains началось с запроса на разработку виртуальной примерочной, встроенной в экосистему социальной сети и доступной аудитории в 79 млн пользователей в сутки.
Технологии VTO активно развиваются: появляются новые подходы и концепты. Прототипы на презентациях впечатляют, но в реальности всё ломается об долгую генерацию, артефакты и искажения поз.
Таким образом и появилась ключевая задача — создать решение, способное стабильно работать под высокой нагрузкой, обеспечивать реалистичность и скорость, необходимые для пользователей.
Задача:
— встроить VTO в mini-app ВКонтакте;
— обеспечить реалистичную примерку для любых телосложений;
— дать брендам инструмент естественного взаимодействия с аудиторией.
Наша цель: создать VTO-продукт, который:
— работает за 1 секунду,
— масштабируется на миллионы пользователей,
— даёт реалистичный результат,
— обеспечивает брендам органичный охват.
Так появилась виртуальная примерочная ВКонтакте — mini-app ВКонтакте, где любой пользователь может сфотографироваться или загрузить изображение, примерить одежду 20+ российских брендов, комбинировать образы и делиться ими в соцсетях.
1 секунда — и ты видишь себя в новом образе.
Без очередей и примерочных.
Работа началась с ключевой точки — момента, когда пользователь нажимает «Примерить». Именно в эту секунду должен происходить эффект «вау», без которого продукт перестаёт существовать. Чтобы эта точка работала без задержек и визуальных ошибок, нам нужно было собрать устойчивый технологический фундамент, способный обеспечить качество, скорость и масштаб.
Для этого мы последовательно выстроили решение из четырёх опорных компонентов:
1. Точные данные как основа генерации
Существующие открытые датасеты имели сильный уклон в сторону женских и стройных моделей, что приводило к критическим артефактам (например, появление женской груди на мужских фигурах). Чтобы модель корректно работала на широком спектре реальных фотографий, мы собрали собственный сбалансированный датасет. Он включает разные типы телосложения, позы и условия съёмки. Такой подход позволил системе уверенно обрабатывать фото пользователей и избегать анатомических ошибок.
2. Оптимизированная модель с моментальной генерацией
Первоначальное время генерации составляло 5 минут, что делало решение нежизнеспособным для массового использования. Мы переработали пайплайн так, чтобы время отклика стало подходящим для живого пользовательского сценария. Оптимизация диффузионной модели, использование LoRA и упрощение вычислительных этапов позволили добиться генерации за одну секунду.
3. Модульный пайплайн для высокого качества изображения
Каждый этап обработки — сегментация человека, выделение одежды, определение позы и собственно генерация — был вынесен в отдельные сервисы. Такой подход обеспечил контролируемость качества, возможность улучшать отдельные компоненты без остановки системы и стабильный визуальный результат на разных типах изображений.
4. Архитектура, готовая к нагрузкам VK
Чтобы система могла работать внутри экосистемы VK и масштабироваться под крупную аудиторию, мы построили распределённую микросервисную архитектуру и добавили асинхронные очереди. Это обеспечило устойчивость сервиса под растущим трафиком, отсутствие узких мест и возможность масштабироваться горизонтально.
В итоге получилась технологическая основа, на которой мы смогли построить продукт: быстрый, стабильный, точный и готовый к массовому использованию в соцсети.
протестировали доступные SOTA-модели VTO,
разработали собственные гипотезы и пайплайны генерации,
сократили latency с 5 минут до 1 секунды,
создали веб-прототип для тестирования.
выбрать одежду (верх/низ),
примерить её онлайн в один клик,
изменить объект примерки,
поделиться результатом,
бренды получают аналитику и административную панель.
добавили брендзоны и автоматический импорт товаров,
реализовали смену пола и удаление пользовательских данных,
внедрили мониторинг и аналитику,
провели полную оптимизацию пайплайна и интеграцию с реальной витриной.
За первые месяцы работы:
— 155 000 запусков mini-app;
— 100 000+ уникальных пользователей;
— 40 000+ успешных генераций;
— 1 секунда на обработку (ускорение х300);
— 8,8 млн органических охватов брендов;
— 30+ fashion-брендов-партнёров.
Появились новые сценарии поведения:
— жители регионов примеряют одежду брендов из других городов;
— подарки и покупки становятся точнее благодаря виртуальной примерке.
— Каждая генерация — это персональный опыт взаимодействия с брендом.