Мировой лидер в индустрии табачных изделий
1 000 000
Информационные технологии и интернет
Россия, Москва
Январь 2024
Современные технологии искусственного интеллекта продолжают удивлять: от компьютерного зрения и видеоаналитики до нейросетей, способных обработкой фото определять возраст человека. К нам, в компанию NeuroCore, нередко поступают любопытные запросы, и один из них касался именно разработки нейросети, которая может отличить совершеннолетнего человека от несовершеннолетнего. К слову, никакими готовыми наработками по распознаванию возраста мы на тот момент не обладали, но тема нас увлекла. В этой статье мы расскажем, как происходил сбор датасета, зачем в него попали аниме-девочки и обезьяньи морды, и какие результаты мы в итоге получили.
Нейросетевой полисмен — технологии будущего
Зачем бизнесу и обществу нейросеть, которая отличает совершеннолетних от детей? Применений множество:
• Розничная торговля (ритейл). Видеоаналитика, основанная на технологиях машинного зрения и распознавания объектов, помогает соблюдать возрастные ограничения при продаже алкоголя, табака или определённых игр и фильмов.
• Реклама и маркетинг. Компаниям важно не нарушать законы, ориентироваться лишь на аудиторию 18+ при рекламе определенных продуктов.
• Контроль доступа. Камеры машинного зрения в ночных клубах или казино могут определять возраст посетителей, сокращать очереди и повышать безопасность.
• Онлайн-безопасность и модерация контента. Любая платформа, где важно сохранять доступ к некоторому контенту только для взрослых, может использовать нейросеть для фильтрации аудитории.
Недооценивать пользу такой обработки искусственным интеллектом не стоит — это и снижение риска нарушений законодательства, и оптимизация работы бизнеса за счёт уменьшения ручных проверок, и повышение пользовательского комфорта.
Сбор датасета
Любая нейросеть для видеоаналитики (или компьютерного зрения) нуждается в большом объёме данных для обучения. Нужно чётко понимать, какой искусственный интеллект планируется создавать. Если открытые базы готовых данных отсутствуют либо не совпадают с вашим запросом, без собственной разметки и формирования датасета не обойтись.
В нашем случае заказчик обозначил очень узкую цель — распознать совершеннолетних. Мы собрали для этого два набора данных:
1. Обучающий датасет с фотографиями людей разных возрастов,
2. Обобщающий датасет, в котором оказались фотографии аниме-персонажей и обезьян.
Почему обезьяны и аниме-девочки? Чем шире и необычнее подборка, тем лучше обобщающая способность нейросети. Чем более разнообразные образы мы «скармливаем» алгоритму, тем точнее он впоследствии определяет цель, даже если сталкивается с обстоятельствами, не встречавшимися на этапе обучения.
[Что такое обобщающая способность нейросетей?
Представьте: вы учите компьютер отличать кошек от любых других объектов. Показав ему десятки или сотни фотографий кошек (и предметов без кошек), компьютер научится видеть ключевые признаки кошки. Однако если вы добавите снимки собак, птиц и рыб, компьютер научится общим паттернам распознавания всех животных и лучше выделит уникальные характеристики кошек. Аналогичным образом мы расширяем «кругозор» нашей нейросети, погружая её в самые разные примеры.]
Мы в NeuroCore не боимся экспериментов! В нашем Telegram (t.me/neurocore), например, мы рассказали, как устроили мини-бойцовский клуб ради сбора данных для очередного нестандартного проекта.
Тестирование модели
Когда требуется понять, насколько эффективна нейросеть, распознающая возраст, мы погружаемся в тесты. Этот этап показывает, правильно ли мы выбрали подход к разработке с самого начала.
• Визуальные отчёты. Алгоритм автоматически строит графики по итогам каждого теста. Это удобно: вся команда разработчиков видит, что пошло не так и где ожидаются потенциальные баги.
• Мониторинг продакшн-серверов. Мы следим за загрузкой процессора, сетевой активностью, использованием оперативной памяти и диска, а также за метриками API.
• Автотест из 23 испытаний. Он каждые 15 минут запускается через GitLab Pipeline schedules, результаты фиксируются в Prometheus/Grafana, а в Telegram уходит уведомление, если что-то пошло не так.
Сначала у нас был единый Telegram-канал для уведомлений о состоянии dev-сервера и продакшн-сервера. Но мы быстро поняли: когда тесты падают на dev, это может быть нормой из-за новых фич, а вот если ошибка на продакшн-сервере — будем реагировать молниеносно. Потому каналы разделили.
Матрицы конфузий и отчёты Allure
В результате тестов формируются:
• Матрица конфузий с промежутками 5 лет (в абсолютных значениях),
• Матрица конфузий с промежутками 5 лет (нормализованная),
• График «Реальный возраст — Предсказанный возраст».
[Что такое матрица конфузий?
Это таблица, наглядно показывающая, куда «сместились» прогнозы модели: сколько раз она угадала класс, а сколько — ошиблась. Строки обычно отображают реальный класс, а столбцы — предсказанный. Для задач по распознаванию возраста так легко увидеть, где именно модель допустила неточность.]
В отчёте Allure можно увидеть, сколько раз нейросеть правильно определила совершеннолетних/несовершеннолетних, а где дала сбой: например, низкое качество фото, несколько лиц на одном снимке, отсутствие человека в кадре.
По итогам тестирования нейросеть успешно справилась с 1820 тест-кейсами, что соответствует 80,32% точности.
Результаты
Матрица конфузий наглядна: если число в ячейке близко к 100%, значит модель хорошо определила возрастную группу. Но основная задача была — отсеивать несовершеннолетних и не давать им «18+». И вот некоторые итоги:
• Ни одного младенца нейросеть не признала совершеннолетним;
• В группе 5—9 лет отсутствуют ложные «18+»;
• В группе 10—14 лет в 3,2% случаев модель ошиблась и назначила «18+».
Тестирование — это целая вселенная экспериментов, которые помогают нам понять, как модель реагирует на разные сценарии. Здесь важна экспертиза: и в машинном зрении, и в понимании специфики самого продукта. По нашему опыту, это всегда увлекательно и приводит к новым находкам.
Современная видеоаналитика, основанная на нейросетях и компьютерном зрении, даёт бизнесу мощные инструменты: от распознавания объектов до автоматического контроля возрастных ограничений. И чем дальше мы двигаемся в будущее, тем сильнее ощущается потенциал технологий искусственного интеллекта и их влияние на нашу повседневную жизнь.
Конечно, при разработке нейросетей мы обязаны учитывать этические аспекты и заботиться о приватности данных. Но будущее принадлежит тем, кто умеет находить разумный баланс между инновационностью и безопасностью.
![]()
Neuro Core
Россия Москва
Хотите испытать нейросеть на себе?
На нашем сайте можно загрузить своё фото и узнать, сколько лет вам «назначит» наша исследовательская нейросеть (фото удаляются спустя несколько часов — конфиденциальность превыше всего).
Если нужен подобный сервис для вашего бизнеса или вы хотите создать принципиально новый продукт на базе технологий искусственного интеллекта — оставляйте заявку (мы непременно что-нибудь придумаем!).
• Услуги компьютерного зрения: https://neuro-core.ru/services/computer-vision
• Решения для ретейла: https://neuro-core.ru/services/computer-vision/retail
• Экспертная разметка данных: https://neuro-core.ru/services/data-labeling