Ищете digital-подрядчика? Выберите его самостоятельно или организуйте тендер, чтобы определить лучшего.
ZeBrains
1 секунда до нового образа: как мы создали масштабируемый VTO-сервис внутри VK
ZeBrains
WDA
2026
#Разработка чат-ботов и Mini Apps

1 секунда до нового образа: как мы создали масштабируемый VTO-сервис внутри VK

95 
ZeBrains Россия, Москва
Поделиться: 0 0 0
Клиент

VK (ВКонтакте)

Сфера

Электронная коммерция

Регион

Россия

Сдано

Апрель 2025

Задача

Сотрудничество VK и ZeBrains началось с запроса на разработку виртуальной примерочной, встроенной в экосистему социальной сети и доступной аудитории в 79 млн пользователей в сутки.

Технологии VTO активно развиваются: появляются новые подходы и концепты. Прототипы на презентациях впечатляют, но в реальности всё ломается об долгую генерацию, артефакты и искажения поз.

Таким образом и появилась ключевая задача — создать решение, способное стабильно работать под высокой нагрузкой, обеспечивать реалистичность и скорость, необходимые для пользователей.

Задача:

— встроить VTO в mini-app ВКонтакте;

— обеспечить реалистичную примерку для любых телосложений;

— дать брендам инструмент естественного взаимодействия с аудиторией.

Наша цель: создать VTO-продукт, который:

— работает за 1 секунду,

— масштабируется на миллионы пользователей,

— даёт реалистичный результат,

— обеспечивает брендам органичный охват.

Так появилась виртуальная примерочная ВКонтакте — mini-app ВКонтакте, где любой пользователь может сфотографироваться или загрузить изображение, примерить одежду 20+ российских брендов, комбинировать образы и делиться ими в соцсетях.

1 секунда — и ты видишь себя в новом образе.

Без очередей и примерочных.

Решение

Работа началась с ключевой точки — момента, когда пользователь нажимает «Примерить». Именно в эту секунду должен происходить эффект «вау», без которого продукт перестаёт существовать. Чтобы эта точка работала без задержек и визуальных ошибок, нам нужно было собрать устойчивый технологический фундамент, способный обеспечить качество, скорость и масштаб.

Для этого мы последовательно выстроили решение из четырёх опорных компонентов:

1. Точные данные как основа генерации

Существующие открытые датасеты имели сильный уклон в сторону женских и стройных моделей, что приводило к критическим артефактам (например, появление женской груди на мужских фигурах). Чтобы модель корректно работала на широком спектре реальных фотографий, мы собрали собственный сбалансированный датасет. Он включает разные типы телосложения, позы и условия съёмки. Такой подход позволил системе уверенно обрабатывать фото пользователей и избегать анатомических ошибок.

2. Оптимизированная модель с моментальной генерацией

Первоначальное время генерации составляло 5 минут, что делало решение нежизнеспособным для массового использования. Мы переработали пайплайн так, чтобы время отклика стало подходящим для живого пользовательского сценария. Оптимизация диффузионной модели, использование LoRA и упрощение вычислительных этапов позволили добиться генерации за одну секунду.

3. Модульный пайплайн для высокого качества изображения

Каждый этап обработки — сегментация человека, выделение одежды, определение позы и собственно генерация — был вынесен в отдельные сервисы. Такой подход обеспечил контролируемость качества, возможность улучшать отдельные компоненты без остановки системы и стабильный визуальный результат на разных типах изображений.

4. Архитектура, готовая к нагрузкам VK

Чтобы система могла работать внутри экосистемы VK и масштабироваться под крупную аудиторию, мы построили распределённую микросервисную архитектуру и добавили асинхронные очереди. Это обеспечило устойчивость сервиса под растущим трафиком, отсутствие узких мест и возможность масштабироваться горизонтально.

В итоге получилась технологическая основа, на которой мы смогли построить продукт: быстрый, стабильный, точный и готовый к массовому использованию в соцсети.

1R&D. Провели глубокое исследование и PoC

протестировали доступные SOTA-модели VTO,

разработали собственные гипотезы и пайплайны генерации,

сократили latency с 5 минут до 1 секунды,

создали веб-прототип для тестирования.

2MVP. Построили mini-app в экосистеме VK, где пользователь может:

выбрать одежду (верх/низ),

примерить её онлайн в один клик,

изменить объект примерки,

поделиться результатом,

бренды получают аналитику и административную панель.

3Enhancement. Мы превратили прототип в продукт:

добавили брендзоны и автоматический импорт товаров,

реализовали смену пола и удаление пользовательских данных,

внедрили мониторинг и аналитику,

провели полную оптимизацию пайплайна и интеграцию с реальной витриной.

Результат

За первые месяцы работы:

— 155 000 запусков mini-app;

— 100 000+ уникальных пользователей;

— 40 000+ успешных генераций;

— 1 секунда на обработку (ускорение х300);

— 8,8 млн органических охватов брендов;

— 30+ fashion-брендов-партнёров.

Появились новые сценарии поведения:

— жители регионов примеряют одежду брендов из других городов;

— подарки и покупки становятся точнее благодаря виртуальной примерке.

— Каждая генерация — это персональный опыт взаимодействия с брендом.

https://vk.com/digital_primerka?ysclid=mj00rnlk8h42950802

Стек технологий

  • Python Python Язык программирования
  • Django Django Фреймворк/библиотека
  • React.js React.js Фреймворк/библиотека

Выскажите мнение
Авторизуйтесь, чтобы добавить свой комментарий.
оставить заявку

Хотите заказать похожий проект?

ZeBrains с удовольствием обсудит вашу задачу

Оставить заявку