Всем привет! Это снова Ангелина. Недавно у нас в офисе был полный переполох.
Мы решили отойти от Gpt и попробовать что-то новенькое. Да-да, именно GPT. Выбрали Deepsick.
А что у нас из
этого вышло – читайте далее. Спойлер уже в названии.
Давайте начнем с простого, к GPT мы все привыкли, о нем кричат на каждом углу, казалось бы, зачем? Ответ простой, захотелось чего-то другого, нового, возможно какого-то роста. А тут DeepSeek – амбициозная разработка китайских инженеров, которая стремится конкурировать с GPT-моделями по качеству генерации текста, коду, переводу и другим задачам. Но в чем же разница?
Архитектура
DeepSeek строится на модифицированной архитектуре LLaMA (Large Language Model Meta AI) — модели с открытым кодом от Meta, которая послужила базой для многих современных open-source ИИ. В частности, DeepSeek использует:
В сравнении:
Вывод: архитектурно DeepSeek идёт в ногу с современными трендами — экономичен, масштабируем, но пока проигрывает в зрелости и оптимизации.
Обучение и данные
DeepSeek обучен на 2 триллионах токенов, включая:
В модели присутствует явный фокус на двуязычность (особенно китайско-английскую) и code generation.
GPT, в свою очередь:
Вывод: GPT выигрывает за счёт богатой RLHF-финетки и большего числа живых диалогов, но DeepSeek явно силён в коде и техническом тексте.
Качество ответов: кто умнее?
1. Диалоги и эмоции
2. Генерация кода
3. Логика / рассуждения
4. Китайский язык
5. Английский язык
6. Многозадачность (MMLU)
Да, иногда вы можете дать запрос Deepsick, однако в ответ получите тишину.
Наша система сама подберет вам исполнителей на услуги, связанные с разработкой сайта или приложения, поисковой оптимизацией, контекстной рекламой, маркетингом, SMM и PR.
Заполнить заявку
13227 тендеров
проведено за восемь лет работы нашего сайта.
7. Скорость генерации
Вывод: GPT выигрывает в языке и логике, DeepSeek — в скорости, двуязычии и генерации кода. Но разница в user experience пока заметна не в его пользу. Использование и API
Плюс DeepSeek можно развернуть локально — как и многие open-source модели, в отличие от GPT-4, который полностью закрыт.
Тест: генерация кода
Запрос: Напиши функцию на Python, которая определяет, является ли строка палиндромом.
GPT-4 ответ:
DeepSeek ответ:
Вывод: оба справляются, DeepSeek даже аккуратнее типизирует. Но GPT обычно лучше поясняет логику кода и предлагает варианты тестов.
Еще одно очень важное уточнение, Deepsick не генерирует изображения, в то время как GPT может не только создать по описанию что-либо, но и исправить существующее, а также позволяет менять что-либо в том, что сам и создал.
Кстати, кому очень важен этот пункт, и кроме GPT хочется чего-то еще, открыла для себя Imagen 4 Ultra. Да, он не может видоизменять готовое изображение, однако, хорошо справляется с генерацией нового контента, даже быстрее чем GPT, который иногда может думать весьма долго. Привожу пример, далее судите сами.
Промт был такой:
Создай изображение женщины, с темными волосами, которая идет под деревьями с розовыми лепестками, в весеннем цветочном платье, волосы в небрежной косе, улыбается, подлинный вид.
Imagen 4 Ultra:
GPT:
На мой взгляд, хоть GPT и сделал изображение более детальным и качественным, Imagen 4 Ultra cделал его более естественным. Возвращаясь к нашей основной теме, хоть Deepsick и оказался отнюдь неплохим решением, однако с нашими задачами он не совсем справлялся. Когда это начало влиять на качество работы, а именно замедлять и усложнять те вещи, которые раньше решались на раз-два, мы решили вернуться обратно. Однако, Deepsick остался моим вторым помощником в решении различных вопросов. Как говорят, одна голова –хорошо, а две – лучше.
Надеюсь, вам было интересно, до встречи в следующей статье.