IT обозрение
Четверг, 21 мая, 2026
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

DeepSeek обрушил рынок: почему китайский ИИ оказался в 30 раз эффективнее GPT-4

29.01.2025
A A
0
Share on FacebookShare on Twitter

2025-01-28 14.57.54

В конце января малоизвестный китайский стартап DeepSeek оказался в центре внимания мировых СМИ. Скромные инвестиции в $5,6 млн в разработку новой модели обернулись сокрушительным ударом по рынку — американские техногиганты в совокупности потеряли почти $1 трлн капитализации.

ЭТО ИНТЕРЕСНО

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

05.03.2026
Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

05.03.2026

Появление доступного аналога ChatGPT, претендующего на звание «убийцы Кремниевой долины», вызвало настоящий переполох в индустрии. ForkLog рассказывает, откуда взялась компания DeepSeek, как она добилась успеха и что ждет мировой рынок языковых моделей.

История восхождения DeepSeek

DeepSeek начала самостоятельный путь в мае 2023 года в Ханчжоу — столице провинции Чжэцзян. Этот город считается крупнейшим в Китае центром электронной коммерции, где располагаются штаб-квартиры гигантов вроде Alibaba Group, Geely, Hikvision и Ant Group.

За проектом стоит Лян Вэньфэн — предприниматель и сооснователь хедж-фонда High-Flyer, управляющего активами в размере $8 млрд. Основанная в 2015 году компания давно проявляла интерес к машинному обучению, инвестируя значительные средства в создание собственной вычислительной инфраструктуры, а также в исследования в области искусственного интеллекта. Именно из ее структуры возникла DeepSeek.

В 2020 году High-Flyer представила суперкомпьютер Fire-Flyer I стоимостью 200 млн юаней ($27,6 млн), специализирующийся на глубоком обучении ИИ. Годом позже появился Fire-Flyer II — система за 1 млрд юаней ($138 млн), оснащенная более чем 10 000 графических процессоров Nvidia A100.

Дебютная модель DeepSeek, выпущенная в ноябре 2023 года, сразу продемонстрировала производительность на уровне GPT-4 и была предоставлена бесплатно для исследователей и коммерческого использования. К маю 2024 года запущена DeepSeek-V2, при этом конкурентная ценовая политика компании заставила даже таких гигантов, как ByteDance, Tencent, Baidu и Alibaba снизить цены на свои ИИ-решения. В итоге DeepSeek удалось сохранить прибыльность, в то время как конкуренты несли убытки.

В декабре 2024 года появилась модель DeepSeek-V3, чьи показатели в тестах превзошли последние разработки OpenAI и Anthropic. На ее основе компания создала DeepSeek-R1 и ее производные, которые и легли в основу нашумевшего сервиса.

Сравнение производительности моделей DeepSeek с моделями OpenAI в различных тестах. Данные: DeepSeek.

Главное преимущество новой модели — беспрецедентно низкая стоимость использования. За обработку миллиона токенов DeepSeek берет всего $2,19, тогда как OpenAI за аналогичный объем взимает $60.

За кулисами прорыва: как устроен DeepSeek-R1

Согласно опубликованному исследованию, в основе модели DeepSeek-R1 лежат методы обучения с подкреплением и «холодного старта». Это позволило достичь исключительной производительности в таких областях, как математические вычисления, программирование и логическое мышление.

Ключевой особенностью модели стал подход Chain of Thought, позволяющий разбивать сложные задачи на последовательные шаги, имитируя человеческое мышление. Система анализирует задачу, разделяет ее на этапы и проверяет каждый шаг на наличие ошибок перед формированием окончательного ответа.

Техническая реализация впечатляет своей эффективностью. DeepSeek-R1 обучалась на системе из 2048 ускорителей Nvidia H800, затратив около 2,788 млн часов работы GPU. Оптимизация процесса достигается за счет применения смешанной точности FP8 и технологии Multi-Token Prediction, что существенно снижает требования к оборудованию.

Архитектура модели включает 671 млрд параметров. Но уникальность метода в том, что за один проход активируется только 37 млрд из них. Использование «смеси экспертов» (Mixture of Experts) обеспечивает масштабируемость без пропорционального роста вычислительных затрат.

Отдельного внимания заслуживает инновационный метод Group Relative Policy Optimization (GRPO). Он позволяет обучать модель без использования критика, что значительно повышает эффективность процесса.

Как отметил старший менеджер по исследованиям в Nvidia Джим Фан, это напоминает прорыв AlphaZero от Google DeepMind, научившейся играть в го и шахматы «без предварительного подражания человеческим гроссмейстерским ходам». По его словам, это «самый важный вывод из исследовательской статьи».

https://twitter.com/DrJimFan/status/1881353126210687089

Новый подход к обучению языковых моделей

Особенно интересен подход DeepSeek к обучению. В отличие от других ведущих LLM, R1 не проходила традиционную «предварительную подготовку» на данных с человеческой разметкой. Исследователи нашли способ, позволяющий модели развивать собственные способности к рассуждению практически с нуля.

«Вместо того, чтобы явно обучать модель тому, как решать проблемы, мы просто предоставляем ей правильные стимулы, и она автономно разрабатывает передовые стратегии», — говорится в исследовании.

Модель также представляет новую парадигму в развитии ИИ: вместо простого наращивания вычислительных мощностей для обучения, акцент делается на том, сколько времени и ресурсов модель тратит на обдумывание ответа перед его генерацией. Это масштабирование «вычислений в тестовое время» отличает новый класс «рассуждающих моделей» вроде DeepSeek R1 и OpenAI-o1 от их предшественников.

Критический взгляд на прорыв DeepSeek

Успех DeepSeek вызывает немало вопросов в профессиональном сообществе. Гендиректор Scale AI Александр Ванг, утверждает, что компания располагает 50 000 чипов Nvidia H100, что прямо противоречит американским экспортным ограничениям.

«Насколько я понимаю, в DeepSeek установлено 50 тысяч H100 […]. Они не могут говорить о них [публично], потому что это противоречит экспортному контролю США», — сказал Ванг.

Учитывая, что после введения ограничений стоимость контрабандных H100 в Китае взлетела до $23 000–30 000, такой кластер обошелся бы в $1–1,5 млрд.

Аналитики Bernstein ставят под сомнение заявленную стоимость обучения модели V3 в $5,6 млн и отмечают отсутствие данных о затратах на разработку R1. По мнению эксперта Peel Hunt Даминду Джаявира, публичные цифры отражают только стоимость GPU-часов, игнорируя другие существенные расходы.

«Она была обучена менее чем за 3 млн часов работы GPU, что соответствует стоимости обучения чуть более $5 млн. Для сравнения, по оценкам аналитиков, обучение последней крупной модели ИИ компании Meta обошлось в $60–70 млн», — сказал Джаявира.

Политический аспект также вызывает опасения. Участие основателя DeepSeek Лян Вэньфэна в закрытом симпозиуме под председательством премьер-министра Китая Ли Цяна может указывать на стратегическую роль компании в преодолении экспортных ограничений и достижении технологической независимости КНР.

«Существует большая вероятность того, что DeepSeek и многие другие крупные китайские компании поддерживаются правительством Китая не только в денежном выражении», — заявил Эдуард Харрис, технический директор Gladstone AI, тесно сотрудничающей с правительством США.

Нельзя не отметить и встроенные механизмы цензуры в API-версии R1, особенно в отношении политически чувствительных для КНР тем. Модель отказывается обсуждать события на площади Тяньаньмэнь, права человека в Китае или статус Тайваня, заменяя сгенерированные ответы стандартными уклончивыми формулировками.

Отдельные опасения вызывает вопрос конфиденциальности данных. Согласно политике DeepSeek, личная информация пользователей хранится на серверах в КНР, что может создать для компании проблемы, аналогичные тем, с которыми столкнулся TikTok. Особенно острым этот вопрос может стать на американском рынке, где регуляторы уже проявили повышенное внимание к китайским технологическим компаниям в контексте защиты персональных данных.

Фрагмент политики конфиденциальности DeepSeek. Данные: DeepSeek.

Будущее языковых моделей после DeepSeek

Несмотря на противоречия, достижения DeepSeek нельзя недооценивать. Результаты тестирования показывают, что модель R1 действительно превосходит американские аналоги по многим параметрам. Как отметил Александр Ванг, это «тревожный звонок для Америки», требующий ускорения инноваций и усиления экспортного контроля над критически важными компонентами.

https://twitter.com/alexandr_wang/status/1883368885640102092

Хотя OpenAI пока сохраняет лидерство в отрасли, появление DeepSeek существенно меняет расстановку сил на рынке ИИ-моделей и инфраструктуры. Если официальные данные соответствуют действительности, китайской компании удалось создать конкурентоспособное решение с существенно меньшими затратами благодаря инновационным подходам и оптимизации. Это ставит под вопрос стратегию простого наращивания вычислительных мощностей, которой придерживаются многие участники рынка.

Интерес к технологиям DeepSeek растет: Meta уже создала четыре «военных кабинета» для анализа китайских моделей, стремясь применить полученные знания в развитии собственной экосистемы Llama с открытым исходным кодом.

Некоторые эксперты видят в успехе DeepSeek не столько угрозу технологическому доминированию США, сколько признак формирования многополярного мира ИИ. Как отметил бывший сотрудник отдела политики OpenAI Майлз Брундадж:

«Китай все равно обзаведется собственным суперинтеллектом(ами) не более чем на год позже США, если не случится войны. Так что если вы не хотите (в буквальном смысле) войны, вам нужно иметь видение того, как ориентироваться в многополярных результатах развития ИИ».

Похоже, мы наблюдаем начало новой эры в развитии искусственного интеллекта, где эффективность и оптимизация могут оказаться важнее чистой вычислительной мощности.

Читайте так-же

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic
ИИ

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

05.03.2026
0

Недавняя инвестиция $30 млрд в OpenAI «может стать последней» для Nvidia перед выходом ИИ-стартапа на биржу. Об этом заявил генеральный...

Read more
Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

05.03.2026
Падение доходов заставило биткоин-майнеров променять крипторезервы на ИИ-инфраструктуру

Падение доходов заставило биткоин-майнеров променять крипторезервы на ИИ-инфраструктуру

05.03.2026
OpenAI и Google представили новые ИИ-модели GPT-5.3 Instant и Gemini 3.1 Flash-Lite

OpenAI и Google представили новые ИИ-модели GPT-5.3 Instant и Gemini 3.1 Flash-Lite

05.03.2026
X ввела наказания за публикацию ИИ-видео военных конфликтов без маркировки

X ввела наказания за публикацию ИИ-видео военных конфликтов без маркировки

04.03.2026

ТОП НОВОСТИ

Будущий Apple Watch Ultra 4 получит новые медицинские датчики и лучшие оповещения о высоком давлении

Будущий Apple Watch Ultra 4 получит новые медицинские датчики и лучшие оповещения о высоком давлении

19.05.2026
Realme 16 5G вышел в России

Realme 16 5G вышел в России

19.05.2026
Документальный фильм Деми Мур и Вуди Гарелсона Groundswell получил престижную награду в Каннах

Документальный фильм Деми Мур и Вуди Гарелсона Groundswell получил престижную награду в Каннах

19.05.2026
Срочные изменения в сериале «Гарри Поттер» от HBO: одну из главных актрис заменят во втором сезоне

Срочные изменения в сериале «Гарри Поттер» от HBO: одну из главных актрис заменят во втором сезоне

19.05.2026
Red Magic Gaming Pad 5 Pro выйдет в июне

Red Magic Gaming Pad 5 Pro выйдет в июне

19.05.2026

ПОПУЛЯРНОЕ

  • Blizzard анонсировала крупнейшее обновление Overwatch – синематик Вендетты, 10 героев в год и ребрендинг без цифры «2»

    Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

    0 shares
    Share 0 Tweet 0
  • Honor X7e замечен в Саудовской Аравии с большой батареей и NFC

    0 shares
    Share 0 Tweet 0
  • Все против всех: украинская комедия «Родственники» покажет ожесточенную войну за наследство

    0 shares
    Share 0 Tweet 0
  • Шаг к 6G: исследователи достигли скорости беспроводной передачи данных 112 Гбит/c

    0 shares
    Share 0 Tweet 0
  • ИИ предсказал ураган категории 5 за пять дней и спас Ямайку от катастрофы

    0 shares
    Share 0 Tweet 0
  • О нас
  • Реклама
  • Контакты
  • Политика конфиденциальности
  • Sitemap
Реклама: digestmediaholding@gmail.com

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

wpDiscuz