Билайн
Культура и исскусство
Россия, Москва
Порталы и сервисы
Декабрь 2024
Литературный кейс, или как LLM меняют читательский опыт.
Главные персонажи:
книги билайн — сервис цифровых книг и аудиокниг.
GigaChat Max — самая мощная модель в линейке GigaChat.
red_mad_robot — технологическая компания. Также известна как Красный Страстный Автомат.
Задачи, которые нам нужно было решить:
1. Разработать адаптивный интерфейс поисковой системы для webview;
2. Настроить ответ системы через GigaChat Max и семантический поиск;
3. Настроить поиск совпадений ответов в базе данных книги билайн и саммарайзер ответа от LLM.
За 1,5 месяца red_mad_robot разработала для книги билайн гибридную систему на основе комбинации технологий GigaChat, Milvus и Reranker.
По данным опроса, проведённого специалистами билайна, около 54% пользователей книжных сервисов в России хотя бы раз сталкивались с трудностями при выборе новой книги.
Так сервис книги билайн решил внедрить умный поиск на базе GenAI. Но не просто систему рекомендаций, а настоящий интеллектуальный инструмент, который подбирает книги по атмосфере, сюжетным линиям, ключевым событиям, сходству с другими произведениями и даже характеристикам персонажей.
Чтобы вы в пару кликов находили мрачный скандинавский детектив с харизматичным злодеем.
Структурировать метаданные всех книг сервиса и настроить поиск по ним — было сложнейшей задачей из-за их большого объёма и специфики данных. Но red_mad_robot вместе с нейросетью GigaChat Max от Сбера смогли её решить.
LLM знает слишком много, поэтому её надо «укрощать». Эту задачу взял на себя red_mad_robot: настроил LLM под цели сервиса книги билайн, а ещё создал векторную базу данных, где хранится вся метаинформация о книгах.
За 1,5 месяца red_mad_robot разработал гибридную систему поиска, которая параллельно обращается и к GigaChat Max, и к векторной базе данных.
Схема умного поиска:
LLM формирует ответ на запрос и сверяет его с базой данных сервиса книги билайн. Одновременно запускается семантический поиск по векторной базе данных, где хранится метаинформация о книгах. Обе системы работают синхронно, что обогащает результаты поиска за счёт объединения двух подходов.
Поисковое решение в сервисе книги билайн — первый кейс внедрения «гибридного» AI, где нейросеть GigaChat Max работает в связке с комбинированным семантическим поиском.
В планах книги билайн и red_mad_robot — развивать сервис с помощью AI-агентов, способных понимать категории запросов пользователей и подбирать оптимальные стратегии поиска в каждом конкретном случае.
Поиск книг стал живым и понятным. Пользователь получает рекомендации прямо в чате, а затем переходит к чтению. В будущем этот формат только улучшится — с книгой можно будет «поговорить» и узнать больше, чем пишут в сухой аннотации.
Сервис отлично справляется даже с неструктурированными, а порой и эмоциональными запросами. С момента его запуска в декабре 2024 года страницу поиска посетили свыше 1,1 млн пользователей.
Мы продолжим развивать сервис в этом году. AI научится распознавать категории запросов и подбирать оптимальные стратегии поиска под каждую задачу. Это сделает работу с «эмоциональными» запросами точнее, а рекомендации — быстрее и релевантнее.
Умный поиск по каталогу сервиса книги билайн доступен в веб-версии и в телеграм-боте @beelinebooks_ai_bot.