Раньше мы учились пользоваться различными приложениями или встроенными возможностями соцсетей, чтобы создавать визуал без помощи фотошопа. Сегодня за иллюстрациями мы обращаемся к нейронным сетям. Разбираемся, какие нейронки генерируют изображения и видео, и в чем их особенности.
Представьте, как много задач сегодня мы можем решать с помощью ИИ-помощников для генерации визуала: подготовка референсов, макетов и набросков решений, выполняемых дизайнерами, создание иллюстраций для публикаций, подготовка визуала для рекламных объявлений — и это только малая часть.
Давайте разберемся с популярными нейросетями для генерации изображений, а также особенностями их использования: платный или бесплатный доступ, ограничения, достоинства и недостатки. На примере одинакового промпта оценим, как ИИ справляется с генерацией визуала.
Промпт на английском: Realistic closeup of a woman walking a fluffy wolf-ish dog in the old town of a city right after rain with a bit of fog in the air
Промпт на русском: Реалистичное изображение крупным планом женщины, выгуливающей пушистую собаку, похожую на волка, в старом городе сразу после дождя, когда в воздухе немного тумана
«Миджорни» давно ассоциируется с генерацией качественных изображений, которая, кажется, не знает границ. Все виды иллюстраций — от сказочных пейзажей и фантастических персонажей до абсолютно реалистичных картинок — впечатляют своей глубокой проработкой рисунка.
Кроме того, Midjourney генерирует и видео-контент.
Стоимость: нет бесплатной версии, подписка от 10 до 120 долларов в месяц
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да, доступна в приложении niji · journey, 20 пробных промптов, в веб-версии недоступна
Язык промпта: английский
Для создания идеального визуала промпт требует детального описания необходимых атрибутов изображения. Уделяйте внимание описанию композиции, объектов на изображении, места действия, обстановки и настроения визуала, погоды, художественного стиля, окружающей обстановки, угла обзора и прочих нюансов.
Как мы видим, Midjourney справился с задачей, но в первом случае мы получили менее подробное изображение обстановки вокруг действующих персонажей, а во втором — вышел проработанный город, но фантастическая собака — настоящий великан. Очевидно, что промпт требуется доработать с учетом указания пропорций человека и собаки, и прописать условия заднего фона.
Китайский сервис для генерации изображений появился на рынке в 2024 году. Нейросеть генерирует изображения и видео.
Стоимость: нет бесплатной версии, подписка от 10 до 99 долларов за покупку кредитов на генерацию визуала
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да, при регистрации пользователи получают 500 кредитов
Язык промпта: английский, испанский, китайский, японский
Hailuo AI при одинаковом промпте справился явно лучше, без уточнения подробностей, которые необходимы в Midjourney. Изображение достаточно реалистично, мы получили и заявленных персонажей, и окружение на визуале.
Российский сервис "Шедеврум" от Яндекса, разработка на основе YaGPT, предлагает создавать изображения и видео.
Стоимость: бесплатно
Использование для коммерческой деятельности: нет, для использования результатов в коммерческих целях требуется согласие Яндекса
Бесплатная пробная версия: —
Язык промпта: русский, английский
Первый результат неплохой: город отлично прорисован, женщина и собака реалистичны, непонятно только, почему способ выгула собаки так отличается от привычного обывателю.
При повторной попытке сгенерировать изображения без правки промпта получилась более традиционная прогулка с собакой по городу:
Нейросеть для генерации визуала от Сбера генерирует изображения и видео. Создавать визуал можно на веб-платформе, через бот в Telegram и даже из приложения Сбера.
Стоимость: бесплатно
Использование для коммерческой деятельности: нет
Бесплатная пробная версия: —
Язык промпта: русский, английский
Как и нейронка Яндекса, «Кандинский» выдал изображение женщины, идущей с собакой в разные стороны.
При повторной генерации с тем же промптом нейросеть исправилась и скорректировала изображение, однако хочется отметить, что собака выглядит очевидно нарисованной.
Любимая всеми нейросеть от OpenAI, которая создает изображения и инфографику.
Стоимость: от 0 до 15 долларов в месяц
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да
Язык промпта: английский, поддерживает русский, но для более точных результатов лучше использовать английский
Вернувшись к нашему английскому промпту, мы получили забавное изображение, где собаку сначала выгуливает женщина, похожая на монахиню в зимнем одеянии, а во вторую попытку она передала эстафету гейше:
Еще одна российская нейросеть Gerwin помогает не только с визуалом, но и с написанием постов в соцсетях или генерацией карточек для маркетплейсов.
Мы испытали генерацию изображения по нашему классическому промпту.
Стоимость: от 280 до 150 тыс рублей в месяц, сумма обменивается на кредиты
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да, при регистрации начисляют 12 тыс кредитов
Активация PRO-аккаунта на 7 дней
Язык промпта: русский
Для нашего запроса Gerwin сгенерировал изображения, где самого процесса выгула собаки не видно, но действующие лица вышли очень реалистичными:
У нейросети доступны бесплатная и платная версии, радуют прозрачные условия оплаты.
Стоимость: 19,99 долларов в месяц или 59,99 долларов в год
Использование для коммерческой деятельности : да
Бесплатная пробная версия: да, 3 дня
Наша система сама подберет вам исполнителей на услуги, связанные с разработкой сайта или приложения, поисковой оптимизацией, контекстной рекламой, маркетингом, SMM и PR.
Заполнить заявку
13230 тендеров
проведено за восемь лет работы нашего сайта.
Язык промпта: английский
DaVinci справился с задачей, но собака выглядит не совсем реалистичной, хотя в целом человек и изображение города вышли очень правдоподобными. Также DaVinci не учел, что в промпте дождь уже закончился, а на визуале мы видим, что он все еще идет.
Китайская нейросеть, которую мы уже тестировали для генерации изображений, создает и видео. Видео можно генерировать по промпту или оживлять изображение.
Стоимость: нет бесплатной версии, подписка от 10 до 99 долларов за покупку кредитов на генерацию визуала
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да, при регистрации пользователи получают 500 кредитов
Язык промпта: английский, испанский, китайский, японский
Мы сгенерировали видео из промпта, получилось два вполне реалистичных варианта:
Еще одна китайская нейронка, которая позволяет оживлять изображения или создавать видео из промпта. Сервис стал популярным в 2024 году.
Стоимость: от 0 до 728,64 (со скидкой)/1104 долларов (без скидки) в год
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да
Язык промпта: английский
Эта нейросеть отличается от конкурентов тем, что не только оживляет текст или изображения, но и создает видео с профессиональным подходом. При генерации вы сможете выбрать оформление видео, прописать сценарий, выбрать озвучивание, согласовать закадровый текст и субтитры.
Стоимость: от 28 до 88 долларов в месяц
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да
Язык промпта: английский
Мы попробовали взять за основу наш английский промпт, а затем определили цель видео как маркетинговую. В уточнениях прописали, что видео должно продвигать идею поиска пушистого друга из приюта для животных, а также нацелено на любителей животных.
Кроме красивой истории, мы, к сожалению, вообще не получили в кадре ни женщину, ни собаку, которые должны вместе гулять.
Filki требует детальной проработки всего процесса создания видео, сгенерировать быструю видеоиллюстрацию в сервисе не получится.
Runway умеет оживлять изображения, генерирует как видео, так и фото. Кроме того, нейронка сможет озвучить текст.
Стоимость: от 0 до 76 долларов в месяц
Использование для коммерческой деятельности: да
Бесплатная пробная версия: да
Язык промпта: английский
Мы использовали одно из сгенерированных ранее изображений, чтобы нейросеть оживила его. Runway отлично справилась, прогулка с собакой выглядит реалистично.
Нейронная сеть для генерации видео, за которой стоит исследовательский подход. Genmo хорошо понимает, что от нее хотят, четко следуя запросу по содержанию видео.
Стоимость: от 10 до 30 долларов в месяц
Использование для коммерческой деятельности: да, если приобретена подписка, для бесплатной версии — нет
Бесплатная пробная версия: да
Язык промпта: английский, понимает запросы на русском
Результат соответствует нашему запросу, но мы видим, что изображение нарисовано, нет эффекта реалистичного видео.
Еще одна разработка OpenAI, в этот раз для генерации видео. Подписка на Sora входит в общую подписку на ChatGPT.
Стоимость: от 20 до 200 долларов в месяц, входит в подписку на ChatGPT
Использование для коммерческой деятельности: да
Бесплатная пробная версия: нет, видео входят только в подписку
Язык промпта: английский
Пример видео из библиотеки Sora:
Несмотря на колоссальный прогресс в области, нейросети пока не могут на 100% заменить работу дизайнеров, фотографов и графических редакторов, где требуется экспертиза и критическое мышление человека.
Исходя из пользовательских соглашений, большинство нейросетей с бесплатным доступом или пробной версией не позволяют использовать результаты генерации в коммерческих целях.
Чем сложнее и более комплексно нейросеть подходит к решению задачи, тем выше стоимость подписки. Для крупных компаний, которые могут использовать весь лимит генераций, входящих в подписку, стоимость может быть оправданной. Но малый бизнес, который, возможно, не сталкивается с большим количеством запросов на генерацию видео или изображений, вряд ли посчитает эффективными траты на несколько изображений в месяц.
Кроме того, для формирования промпта нужны навыки. Наш тестовый прогон одного и того же запроса по различным нейросетям подразумевал быструю генерацию визуала. Некоторые нейронки справились хорошо с первого или второго раза, но другие, например, Midjourney, требуют детальной проработки промпта. В идеале — прокачанный навык составления запросов у пользователя. Соответственно, в компании все равно нужен человек, который умело будет пользоваться нейронными сетями для генерации визуала.
Это также приводит к тому, что сегодня нейросети не всегда могут быстро обеспечить нас изображением или видео. Некоторые задачи дизайнер сможет выполнить быстрее.
И очевидно, что человек все еще лучше справляется с учетом важных комментариев заказчика, соблюдением фирменного стиля и может оперативно вносить необходимые правки. Как показывает практика, нейронные сети все еще не очень хорошо вносят точечные корректировки в сгенерированный визуал, когда нам все нравится, но мы хотим заменить какую-то деталь. Обычно результат сильно отличается от понравившейся нам версии.
Нейросети отлично справляются с типовыми задачами и быстрыми концептами, но, когда нужен точный брендинг, сложная композиция или нестандартная идея — без дизайнера не обойтись. Особенно если требуется доработка по ТЗ, адаптация под гайдлайны или контроль качества на всех этапах. Искусственный интеллект пока не умеет думать стратегически — это по-прежнему прерогатива человека.
Юлия Калинина, руководитель отдела дизайна и креатива в Ingate Communications
Кстати, недавно мы запустили новую услугу — Экспресс-дизайн. Она отлично подойдет для тех случаев, когда вам нужен быстрый результат, но сгенерированный визуал не закрывает ваши задачи. В срок от 24 часов мы подготавливаем презентации, визуал и motion для соцсетей, типографские материалы и оперативные веб-решения.
Оперативно решаем горящие задачи с услугой Экспресс-дизайн