Среда 28 мая 2025

Ударная ИИ-волна Поднебесной

За последние несколько месяцев ведущие ИИ-разработчики из КНР добились ошеломительного успеха. Совместные усилия частного бизнеса и государства позволили быстро преодолеть многочисленные барьеры и вплотную приблизиться к глобальному лидеру индустрии — США
Ударная ИИ-волна Поднебесной
Лян Вэньфэн — китайский предприниматель и бизнесмен, соучредитель количественного хедж-фонда High-Flyer, а также основатель и генеральный директор его компании по искусственному интеллекту DeepSeek
«Стимул»

Еще осенью 2024 года многочисленные западные аналитики, специализирующиеся в сфере ИИ-технологий, практически единодушно утверждали, что китайские разработчики по ключевым направлениям порядочно отстают от американских лидеров и в обозримом будущем этот разрыв, скорее всего, будет только расти. Причем акцент, как правило, делался на то, что китайские ИИ-продукты заметно уступают американским по части универсальности и креативности (на все лады обыгрывался заезженный тезис The U. S. innovates, China iterates — «США создают инновации, Китай повторяет»).

Но уже к весне 2025-го оценки западных ИИ-гуру кардинально изменились. Так, в недавнем интервью американской CNBC Рэй Ван, основатель и главный аналитик исследовательской компании Constellation Research, констатировал: «Если раньше мы думали, что Китай отстает от США в области искусственного интеллекта на год-два, то теперь… это отставание составляет, вероятно, лишь от трех до шести месяцев».

Многие независимые эксперты отмечают, что в ряде важных подсегментов, таких как технологии компьютерного зрения (распознавание лиц, объектов и т. п.) и промышленный ИИ (интернет вещей, автоматизация / роботизация заводов, логистики и энергообъектов), КНР уже стала мировым лидером, а в сфере разработки прикладных ИИ-моделей для генерации графических изображений, коротких видеоклипов и для преобразования текста в аудио ведущие китайские компании как минимум на равных конкурируют с зарубежными (в основном, конечно, американскими).

Дополнительным мощным катализатором для развития «самодостаточных» ИИ-технологий в Китае, безусловно, стали и жесткие ограничения, наложенные США на экспорт передовых микросхем и промышленного оборудования для их производства.

И сегодня Китай, сделавший стратегическую ставку на разработку относительно дешевых открытых моделей ИИ, а также на изобильные людские ресурсы (огромное население и продвинутая цифровая экономика уже дают КНР уникальные конкурентные преимущества по части обработки массивов больших данных, которые мощно подпитывают его передовые ИИ-модели), не просто быстро догоняет США почти по всем технологическим параметрам — он, по сути, меняет основные правила игры в индустрии в целом, ставя под сомнение целесообразность огромных расходов ведущих западных технологических корпораций на разработку проприетарных больших языковых моделей (Large Language Models, LLMs) и строительство дорогостоящих центров обработки данных (ЦОД).


ПОЛИЦ ЗРЕНИЕ.jpg
Полицейские используют очки с искусственным интеллектом на улице в Лояне, провинция Хэнань, Китай
«Стимул»

Период «тысячи цветов»

Китай приступил к активному развитию ИИ-технологий задолго до начала большой волны 2022 года, когда состоялся триумфальный дебют ChatGPT от OpenAI. Первой важной вехой можно считать июль 2017 года, когда Госсовет КНР утвердил «План развития искусственного интеллекта нового поколения» (Next Generation AI Development Plan). Основная заявленная цель этой долгосрочной госпрограммы заключалась в том, чтобы сделать Китай мировым лидером в сфере ИИ к 2030 году (в документе были также обозначены три последовательных этапа: догнать лидеров к 2020-му, выйти на топовые позиции к 2025-му и достичь глобального доминирования к 2030 году).

И уже к 2020 году совокупный объем инвестиций в ИИ-отрасль КНР (как государственных, так и частных) оценивался примерно в 25 млрд долларов (усредненные данные Statista и ряда китайских СМИ).

Общий тон на этом раннем этапе главным образом задавали китайские технологические тяжеловесы: Baidu, Tencent, Alibaba и Huawei. Так, платформа Apollo для беспилотных авто ИИ-флагмана Baidu была запущена в 2017 году, а к 2020-му Apollo уже активно сотрудничала более чем с 70 автопроизводителями. Кроме того, еще в 2018 году Baidu представила ERNIE (Enhanced Representation through Knowledge Integration) — большую языковую модель, которая к 2022-му достигла отметки в 10 млрд параметров и стала основой для их последующих ИИ-разработок.

В свою очередь, Alibaba в 2017 году основала DAMO Academy — специализированный исследовательский центр ИИ, а в 2021-м запустила M6 — мультимодальную модель («многозадачный мегатрансформер») с заявленными 10 млрд параметров.

Корпоративный исследовательский центр искусственного интеллекта AI Lab был создан в 2016 году компанией Tencent (уже к 2020-му в нем насчитывалось более 650 сотрудников), которая к началу нынешнего десятилетия активно использовала ИИ-наработки в играх, рекламе и в своей медиаплатформе WeChat. Наконец, Huawei в 2021 году запустила свою ИИ-модель PanGu с 13 млрд параметров.

Отдельного упоминания заслуживают независимые компании — разработчики передовых технологий компьютерного зрения: SenseTime и Megvii. Первая из них была основана в 2014 году и к 2021-му оценивалась в 12 млрд долларов и активно поставляла свои системы распознавания лиц для госнужд. Megvii (она создана еще раньше, в 2011-м) со своей системой аналогичного профиля Face++ конкурировала в той же нише и к 2020 году привлекла около 1,5 млрд долларов инвестиций.

Всего же к 2020 году в Китае было создано более 1000 различных ИИ-стартапов (оценочные данные исследовательской компании CB Insights). Отметим также, что еще в 2021 году на Китай приходилось около 60% мировых ИИ-патентов (WIPO), тогда можно было считать это свидетельством глобального успеха долгосрочной национальной ИИ-программы.

magnifier.png В начале 2025 года фаза хаотичных «проб и ошибок» внезапно завершилась тем, что на рынок ИИ ворвался DeepSeek, мало кому до этого известный молодой стартап из Ханьчжоу, представивший свою революционную новую модель R1

Первая фаза новой гонки преследования в сфере наиболее перспективных генеративных ИИ-технологий в Китае, как мы уже упомянули, началась два с небольшим года назад — вскоре после запуска в ноябре 2022 года американской пионерской модели ChatGPT, когда все ИИ-разработчики Поднебесной дружно бросились выпускать свои версии LLMs. По оценкам гонконгского издания South China Morning Post, в этом «ИИ-шоу» в общей сложности поучаствовало более сотни различных китайских моделей, большинство из которых представляли собой весьма сырые и низкоэффективные продукты.

И в целом еще в середине прошлого года сектор LLM Китая выглядел крайне фрагментированным и переполненным мелкими игроками.

Однако в начале 2025 года фаза хаотичных «проб и ошибок» внезапно завершилась тем, что на рынок ИИ ворвался DeepSeek, мало кому до этого известный молодой стартап из Ханьчжоу, представивший свою революционную новую модель R1.

Компания DeepSeek, созданная всего два года назад, в 2023-м, богатым предпринимателем — основателем китайского квантового хедж-фонда High-Flyer Лян Вэньфэном, выпустила так называемую рассуждающую (reasoning) большую языковую модель, которая по своей производительности соответствовала передовой модели той же категории o1 от OpenAI (разработчика семейства ChatGPT), появившейся всего несколькими месяцами ранее. При этом, по утверждениям руководства самой компании, общие затраты на обучение R1 составили всего порядка 6 млн долларов по сравнению с десятками и даже сотнями миллионов, которые тратились на разработку LLMs в США (данное заявление до сих пор является предметом бурных дискуссий в экспертной среде, но mutatis mutandis большинство все-таки признает, что цифры едва ли сильно занижены по сравнению с реальными).

И, как отметил в беседе с нами руководитель отдела исследований компании «Антиплагиат», доцент кафедры интеллектуальных систем МФТИ Андрей Грабовой, «можно, по крайней мере, утверждать, что все формальные заявления DeepSeek вполне подкрепляются реальными тестами на различных специализированных бенчмарках для моделей ИИ. В частности, по метрикам, которые сам DeepSeek заявил в своих опубликованных статьях, в том числе в целом по естественным языкам — английскому, китайскому, по простым вопросам, они соизмеримы с показателями основных конкурентов… Причем все эти отличные результаты они получили всего за два года планомерных исследований».

К числу же текущих основных проблем DeepSeek, по мнению Грабового, следует отнести неустойчивость его работы, особенно в случае с множественными параллельными запросами: «Его API (интерфейс программирования приложения. — Стимул) очень уж нестабилен. Видно, что ресурсов, мощности пока не хватает. Но это, скорее всего, проблема самого стартапа. И если государство ему поможет, а в Китае оно очень отзывчиво в этом плане, то вполне возможно, что его новые модели смогут даже превзойти тот же OpenAI».

Уточним в связи с этим, что по состоянию на март 2025 года, по оценкам ряда китайских СМИ, в компании работало всего около 160 сотрудников (для сравнения: общая численность персонала в Zhipu, крупнейшем стартапе КНР в сфере разработки LLMs, составляет порядка 800 человек).

Что же касается помощи государства, то, пожалуй, самым мощным стимулом стало оперативное включение главы DeepSeek Лян Вэньфэна в «группу избранных» на февральской встрече председателя КНР Си Цзиньпина с ведущими частными компаниями китайского хайтека.

И, как едко констатировала в своей недавней публикации The New York Times, «после того как основатель китайского ИИ-стартапа DeepSeek пожал руку высшему лидеру Китая, многочисленные госструктуры, как на общенациональном, так и на региональном уровне, а равно и различные частные компании по всей стране тут же поспешили продемонстрировать свое желание в массовом порядке внедрять новые ИИ-технологии компании из Ханьчжоу».

Инновации от Deepseek

DeepSeek добилась впечатляющих успехов, значительно сузив многие проблемные зоны в разработке ИИ-моделей. Не вдаваясь в технические детали, выделим лишь наиболее существенные моменты.

К числу таковых прежде всего следует отнести примененные командой DeepSeek эффективные инструменты, позволившие существенно оптимизировать второй ключевой этап создания больших языковых моделей (после первого этапа — «предварительного обучения», pre-training — на базе массивного набора исходных данных начинается «посттренинг», в ходе которого разработчики учат модель следовать инструкциям, например решать математические задачи или кодировать).

Одним из базовых методов, используемых при посттренинге LLM, является процесс «обучения с подкреплением на основе человеческой обратной связи» (reinforcement learning from human feedback, RLHF).

Данный метод был впервые использован OpenAI для улучшения работы ChatGPT.

Этот этап может быть весьма трудоемким и затратным, часто требующим привлечения дополнительного технического персонала, занимающегося маркировкой данных (human data labellers).

И одной из главных технических изюминок DeepSeek стала эффективная автоматизация процесса RLHF при помощи специальной методики, которая «вознаграждает» ИИ-модель в случае ее правильных действий (корректных ответов и решений).

К числу других важных достижений китайского стартапа также следует отнести успешное использование такого продвинутого метода, как генеративное обоснование и оптимизация планирования (Generative Reasoning and Planning Optimization, GRPO), который позволяет ИИ заранее продумывать ход выполнения более сложных задач и затем последовательно улучшать этот процесс.

Еще одним существенным плюсом стало создание специалистами DeepSeek очень компактных версий своей модели, которые можно запускать на мобильных телефонах и в веб-браузерах, сохраняя при этом достаточно высокое качество выдаваемых результатов.

Наконец, разработчики DeepSeek представили широкой общественности технический отчет, в котором достаточно подробно описали основные методы, использованные ими в процессе обучения модели R1. Однако, как отмечают многие специалисты, в этом отчете фактически так и не было дано внятных пояснений относительно важнейшего механизма так называемой дистилляции, то есть конкретного набора инструментов и методов, при помощи которых DeepSeek удалось обеспечить эффективный переход от большой модели, обладающей общими знаниями и предварительно обученной на огромном массиве исходных данных, к более компактной, которая очень хорошо разбирается в узкой области.

Китайская бритва Оккама

Марк Андреессен, соучредитель известной венчурной фирмы Andreessen Horowitz, назвал появление R1 от DeepSeek «моментом спутника для ИИ» (AI’s Sputnik moment), сравнив его воздействие с эффектом, который произвел запуск первого советского спутника, положивший начало большой космической гонке.

Причем помимо того, что модель DeepSeek R1 произвела настоящий фурор в сфере технологий ИИ благодаря своей высокой производительности и качеству в сочетании с очень низкими удельными затратами, целый ряд отраслевых аналитиков обращает внимание на то, что еще более важным вкладом китайского техностартапа стало резкое ускорение процесса внедрения моделей ИИ с открытым исходным кодом.

Так, базовая модель R1 от DeepSeek распространяется по «лицензии MIT», которая считается одной из самых разрешительных и широко распространенных лицензий с открытым исходным кодом, обеспечивающей неограниченные использование, модификацию и распространение, в том числе в коммерческих целях.

Прорыв DeepSeek стал своего рода бритвой Оккама для молодой китайской индустрии ИИ, которая была вынуждена в экстренном порядке начать коренную перестройку своих базовых подходов с учетом четко наметившейся новой парадигмы, в которой относительно недорогие «дистиллированные» модели с открытым исходным кодом могут привести к более быстрому внедрению инновационных решений. И сегодня самым актуальным для ее дальнейшего развития становится уже не столько то, кто и как сможет создать лучшую большую языковую модель, сколько то, как и при помощи каких инструментов и методов добиться наибольшей эффективности работы различных прикладных (специализированных под конкретные задачи) моделей.

Так, по словам Ван Тижэня, аналитика исследовательского центра Hugging Face (сверхпопулярной в ИИ-среде компании с французскими корнями, предоставляющей возможности репозитория и обеспечивающей прямой доступ к различным языковым моделям с открытым исходным кодом), который в рамках специального проекта Open-R1 Project предпринимает значительные усилия для того, чтобы «систематически реконструировать данные и обучающий конвейер DeepSeek-R1» для широкой публики, «DeepSeek побудил многие компании перенаправить свои ресурсы на пользовательские приложения, а не на разработку фундаментальных моделей».

magnifier.png Прорыв DeepSeek стал своего рода бритвой Оккама для молодой китайской индустрии ИИ, которая была вынуждена начать коренную перестройку своих базовых подходов с учетом наметившейся новой парадигмы, в которой относительно недорогие «дистиллированные» модели с открытым исходным кодом могут привести к более быстрому внедрению инновационных решений

Один из наиболее показательных примеров того, как под воздействием «феномена DeepSeek» быстро меняется общий ландшафт ИИ-индустрии в Китае, — экстренная смена общей стратегии одного из ее ведущих игроков, Baidu. На протяжении долгого времени эта компания упрямо выступала против использования открытого исходного кода, жестко придерживаясь политики лицензирования своего ПО. А 16 марта Baidu выпустила последнюю версию своей флагманской ИИ-модели ERNIE 4.5, а также новую «модель рассуждений» ERNIE X1, сделав их полностью бесплатными для индивидуальных пользователей, и официально объявила, что планирует представить новую серию моделей ERNIE 4.5 с открытым исходным кодом уже в конце июня этого года.

Справедливости ради, впрочем, можно упомянуть, что другой китайский техногигант, Alibaba, еще в 2024 году представил в открытом доступе свою продвинутую LLM-модель Qwen 2, а уже в феврале 2025-го компания заявила, что открывает исходный код своих специализированных ИИ-моделей для генерации видео. И наконец, третий «кит», Tencent, в начале марта выпустил сразу пять новых моделей с открытым исходным кодом, которые позволяют преобразовывать текст и обычные картинки или фотографии в 3D-изображения.

При этом, как отмечает редактор технологического отдела South China Morning Post Чжоу Синь, «оглядываясь назад, можно сказать, что жесткая конкуренция китайских ИИ-разработчиков во многом отражала траекторию, наблюдаемую в секторах смартфонов и электромобилей (EV) в Китае.

Два десятилетия назад китайский рынок смартфонов был домом для сотен брендов, многие из которых были подделками, известными на местном уровне как shanzhai. Потребовалось около десятилетия жесткой конкуренции, чтобы рынок достиг относительного равновесия. Сегодня сектор консолидировался вокруг шести ведущих игроков, и Apple — единственный иностранный бренд среди них.

Аналогичным образом на пике своего развития в 2018 году рынок электромобилей насчитывал около 500 производителей. Сейчас в отрасли происходит консолидация, и многие аналитики прогнозируют, что выживут менее десяти. Однако в случае с китайским ИИ-сектором темпы его консолидации и эволюции были намного быстрее».

И, как отмечает Ван Тижэнь из Hugging Face, «китайский рынок LLM сегодня стремительно консолидируется вокруг горстки явных лидеров, наиболее яркий из которых, безусловно, DeepSeek».

По мнению Чжоу Синя, «DeepSeek не только заметно укрепил амбиции Китая в его стремлении к лидерству в мировой индустрии искусственного интеллекта, но и радикально преобразовал отечественный ландшафт моделей ИИ в “солнечную систему”, где стартап из Ханьчжоу становится большой звездой, вокруг которой вращается несколько крупных планет».

Впрочем, с последним утверждением, безусловно, можно поспорить, поскольку не следует сбрасывать со счетов и целый ряд других сильных игроков в китайском ИИ-секторе, прежде всего мощные ИИ-подразделения гигантов китайской техноиндустрии — Alibaba, Tencent, Baidu и ByteDance.

Новые и старые драконы

Перечислим ключевых игроков китайской ИИ-индустрии и их главные модели (оставляя за скобками главного «разрушителя», DeepSeek).

1. Baidu — один из технологических гигантов Китая, известный в том числе своей продвинутой поисковой системой. В последние годы компания активно инвестирует в ИИ, особенно в области обработки естественного языка (NLP) и автономного вождения. Ее флагманская ИИ-модель (точнее, серия моделей) — ERNIE (Enhanced Representation through Knowledge Integration), последние версии которой (4.х) демонстрируют впечатляющие результаты в задачах понимания текста, генерации контента и многоязычной обработки.

2. Alibaba через свою исследовательскую структуру Damo Academy активно развивает ИИ для электронной коммерции, облачных вычислений и логистики.

Флагманская LLM-модель компании — Qwen (Tongyi Qianwen), последняя официальная версия которой, Qwen 2 (запущена в 2024 году), представлена в открытом доступе.

3. Tencent — лидер в игровой индустрии и в сегменте социальных сетей (благодаря платформе WeChat), энергично развивающий различные ИИ-проекты. Передовая ИИ-модель компании — Hunyuan, универсальная модель ИИ, представленная в 2023 году и улучшенная к 2025-му. Она применяется в генерации контента (текст, изображения), обработке языка, создании виртуальных персонажей для игр и т.п.

4. ByteDance, владелец TikTok, использует ИИ для предоставления рекомендаций по контенту, обработки видео и создания трендовых алгоритмов. Основная языковая модель компании — Doubao, разработанная прежде всего для поддержки различных продуктов и сервисов ByteDance (она ориентирована на генерацию текстов, анализ пользовательских предпочтений и работу с коротким контентом).

5. xAI (не следует путать ее с одноименной компанией Илона Маска) — независимый игрок, фокусирующийся на разработке моделей ИИ для научных исследований и промышленности. Ее флагманская модель — WuDao, впервые представленная еще в 2021-м и значительно доработанная к 2025 году.

6. Zhipu — ведущий китайский ИИ-стартап, стремящийся стать одним из лидеров в сегменте моделей с открытым кодом. Его главная «фишка» — модель ChatGLM, версия которой ChatGLM-6B была выложена в открытый доступ еще в 2023 году.

Большая разработческая команда в основном представлена спецами из Университета Цинхуа.

7. Kuaishou изначально специализировалась на коротких видео (а-ля TikTok), но в последнее время предпринимает серьезные усилия на ИИ-направлении. Ее модель KwaiYii — это амбициозная попытка сделать универсальный ИИ для обработки текста и мультимедиа. Модель была запущена в 2023 году и уже интегрируется в медиа-платформу Kuaishou с 700 млн активных пользователей в месяц (данные на 2024 год). Предмет особой гордости компании — специализированная модель видеогенерации Kling, запущенная в середине 2024 года.

8. 01.ai. Компания основана в 2023 году Кай-Фу Ли, легендой китайского техномира. Флагманская модель — Yi-34B (на базе 34 млрд параметров), призванная конкурировать с топовыми западными ИИ-моделями вроде ChatGPT.

9. Baichuan создана бывшими сотрудниками Baidu в 2023 году. Их модель — Baichuan-13B — мощный языковой ИИ с открытым кодом.

10. Manus — специализированная китайская компания, сосредоточенная на разработке ИИ для робототехники, автоматизации и промышленных приложений. Ее основной продукт — Manus AI Platform. Это не единая модель, а экосистема ИИ-инструментов, включающая модели компьютерного зрения, обработки данных и принятия решений. К 2025 году Manus внедрила мультимодальные системы, которые интегрируют текст, изображения и сенсорные данные для управления автономными системами.

Инфраструктурные виражи

Как отмечается в недавнем большом обзоре MIT Review, когда в конце 2022 года на ИИ-сцену резко ворвался ChatGPT, китайские власти отреагировали на это очень быстро. Правительство определило инфраструктуру ИИ в качестве национального приоритета, призвав местные органы власти значительно ускорить развитие так называемых интеллектуальных вычислительных центров — термин, придуманный в Поднебесной для описания центров обработки данных, ориентированных на поддержку ИИ-моделей.

По данным исследовательской компании KZ Consulting, в 2023–2024 годах в Китае было анонсировано более 500 новых проектов строительства ЦОДов по всей стране. И, по оценкам комитета по центрам обработки данных Китайской ассоциации индустрии связи, уже к концу 2024 года не менее 150 новых ЦОДов были готовы и начали работать.

Государственные предприятия, публичные компании и государственные фонды фактически выстраивались в очередь, чтобы инвестировать в них, надеясь в дальнейшем позиционировать себя в качестве лидеров в области ИИ. Местные же органы власти активно продвигали их в надежде, что они придадут мощный стимул росту региональной экономики и сделают их территории центрами притяжения компаний — разработчиков ИИ и прочих высоких технологий.

Однако, цитируя обзор MIT Review, «по ходу практической реализации этих дорогостоящих строительных проектов былой ажиотаж вокруг больших языковых моделей заметно поубавился, сменившись всеобщим разочарованием. Причина проста: аренда графических процессоров (GPU) практически перестала быть прибыльным бизнесом». И хотя только в 2024 году «более 140 компаний зарегистрировались в Администрации киберпространства Китая — центральном интернет-регуляторе страны — для разработки своих собственных LLMs, по информации китайского издания Economic Observer, уже к концу года лишь около 10% этих компаний продолжали активно инвестировать в масштабную тренировку своих ИИ-моделей».

Иными словами, процесс привлечения новых клиентов ЦОДов резко забуксовал, «лишь несколько ведущих технологических компаний в Китае в настоящее время в значительной степени используют вычислительные мощности для обучения своих ИИ-моделей. А многие мелкие игроки просто отказываются от предварительного обучения своих моделей или иным образом меняют свою стратегию с момента появления DeepSeek…»

Наметившийся бурный рост числа «рассуждающих моделей», пионерами которых были R1 DeepSeek и, чуть ранее, ChatGPT o1 и o3 OpenAI, заметно повлиял на специфику запросов многих компаний — разработчиков ИИ к центрам обработки данных.

С развитием этой альтернативной технологии основные вычислительные потребности многих компаний постепенно переориентируются на обеспечение эффективных пошаговых цепочек «логических рассуждений» ИИ в ответ на запросы пользователей в реальном времени, тогда как сам процесс обучения и создания базовых моделей отчасти отходит на второй план. Причем этот новый тренд четко наметился уже не только в Китае, но и в глобальном масштабе.

magnifier.png Основные вычислительные потребности многих компаний постепенно переориентируются на обеспечение эффективных пошаговых цепочек «логических рассуждений» ИИ в ответ на запросы пользователей в реальном времени, тогда как сам процесс обучения и создания базовых моделей отчасти отходит на второй план

В частности, задействуя «процесс рассуждений» (reasoning process), ИИ часто выдает более качественные результаты, но этот процесс занимает значительно больше времени по сравнению с «классическим» реагированием ИИ-моделей.

Поэтому первостепенное значение теперь имеет оборудование / аппаратное обеспечение с низкой задержкой (low latency — время, необходимое для передачи данных из одной точки сети в другую). А из этого, в свою очередь, следует, что в идеале ЦОДы должны располагаться как можно ближе к крупным технологическим узлам, чтобы свести к минимуму такие задержки и обеспечить максимально быстрый доступ к оборудованию высококвалифицированного персонала, занимающегося его эксплуатацией и техническим обслуживанием.

И в случае с Китаем это означает, что многие новые ЦОДы, уже построенные или еще только создаваемые в центральных, западных и прочих отдаленных сельских районах, которые ранее считались перспективными благодаря относительной дешевизне цен на электроэнергию и землю, быстро теряют свою былую привлекательность для компаний, непосредственно занимающихся разработкой ИИ.

Еще одной очень серьезной hardware-проблемой для дальнейшего развития китайской ИИ-индустрии, безусловно, является заметное отставание от США по части продвинутых микросхем для ИИ (AI accelerators), непосредственно проистекающее из введенных американцами жестких ограничений на их поставки в КНР. Например, топовые чипы Nvidia (серии H100 или A100), всеобщего фаворита ИИ-индустрии, обеспечивают в три-четыре раза большую вычислительную мощность на ватт по сравнению с лучшими китайскими разработками (такие оценки, в частности, даны в отчетах IEEE и AnandTech за 2024 год).

Китайцы героически преодолевают эти внешние барьеры. В частности, ведущие разработчики (совместная команда Huawei и SMIC, а также стартапы Biren Technology и Cambricon Technologies) уже смогли освоить 7-нанометровый техпроцесс, но массовое производство на 5 нм и ниже (как у тайваньской TSMC для чипов Nvidia) пока еще значится лишь в «планах на будущее», что в том числе объясняется параллельными запретами на поставку оборудования EUV-литографии.

При этом, по мнению Андрея Грабового, основная проблема заключается даже не в качестве самих новых китайских чипов, а в их программировании, в программном обеспечении. «То есть, говоря по-простому, Nvidia сейчас выигрывает прежде всего за счет своей CUDA (Compute Unified Device Architecture — программно-аппаратная архитектура параллельных вычислений, которая позволяет существенно увеличить вычислительную производительность графических процессоров Nvidia. — Стимул). В Китае есть ее аналоги, но на них, как мне говорили, умеют программировать только сами китайцы. И, соответственно, открытые технологии туда вносить намного сложнее».

Тем не менее, по недавним оценкам ряда отраслевых аналитиков (например, исследовательской компании SemiAnalysis), китайские ИИ-чипы уже достигли уровня, сопоставимого с чипами Nvidia A100 (2020 года), хотя и заметно недотягивают до флагманских H100 (представленных в 2023 году). В узкоспециализированных же задачах (например, в обработке китайского языка или в компьютерном зрении) этот разрыв за счет оптимизации еще меньше.


БАЙДУ.jpg
Штаб-квартира компании Baidu в Пекине
Wikipedia

Пружина готова распрямиться

Как бы то ни было, многочисленные инвесторы (как зарубежные, так и китайские) на фоне впечатляющего прогресса, достигнутого за последние несколько месяцев ведущими ИИ-разработчиками Поднебесной, снова стали активно вкладываться в китайские технологические акции. Индекс Hang Seng Tech, который отслеживает технологические компании, котирующиеся на Гонконгской фондовой бирже, вырос с начала года примерно на 35% (данные на конец марта). Среди тех, кто сильнее других увеличил свои биржевые показатели, компании Alibaba, Kuaishou, создавшая сверхпопулярную модель видеогенерации Kling, и SMIC — китайский национальный чемпион по производству микросхем, который помогает Huawei производить специализированные ИИ-чипы.

Китайская ИИ-отрасль сегодня — это уже практически сформировавшаяся гигантская экосистема, подкрепленная мощными инвестициями (как государственными, так и частными) в сотни миллиардов долларов и почти полуторамиллиардной пользовательской базой.

Многочисленные китайские университеты исправно штампуют десятки тысяч молодых увлеченных инженеров и программистов, которых могут использовать для своих инновационных разработок ИИ-стартапы.

magnifier.png Специализированные научно-технические издания и интернет-ресурсы буквально ломятся от обилия свежих публикаций и обзоров китайских авторов, причем особенно это заметно в таких специализированных сегментах, как разработка новых моделей и методик для графической и видеогенерации, аудиоприложений, обработки больших массивов данных в целом

Специализированные научно-технические издания и интернет-ресурсы буквально ломятся от обилия свежих публикаций и обзоров китайских авторов, причем особенно это заметно в таких специализированных сегментах, как разработка новых моделей и методик для графической и видеогенерации, аудиоприложений, обработки больших массивов данных в целом и т.д.

К числу же существенных недостатков ИИ-индустрии КНР помимо уже упомянутого отставания в «железе» сегодня можно отнести относительную неразвитость венчурного бизнеса в стране: как отмечается в обзоре Fortune, «в самом Китае почти не осталось венчурных фирм, а иностранные венчурные инвесторы отступили, поскольку возросла геополитическая напряженность в отношениях с США (DeepSeek, в частности, вообще не имела венчурной поддержки, полагаясь на глубокие карманы своей материнской компании — хедж-фонда)».

Однако и это слабое звено уже на контроле у зорких китайских лидеров: так, в начале марта на сессии Всекитайского собрания народных представителей было заявлено, что планируется создать национальный фонд управления венчурным капиталом, который мобилизует один триллион китайских юаней (138 млрд долларов) на развитие «тяжелых» технологий (hard technology), одним из ключевых реципиентов которого, очевидно, должна стать молодая ИИ-индустрия КНР.

Впрочем, в публикации того же Fortune констатируется: «Как показывают достижения DeepSeek, китайским стартапам в области ИИ, возможно, и не понадобятся эти огромные суммы, чтобы быть конкурентоспособными на мировом рынке. Китайские лидеры теперь делают акцент на поддержку относительно дешевой разработки моделей ИИ с открытым исходным кодом как способ активного поощрения более широкого внедрения китайских технологий».

Темы: Среда

Еще по теме:
16.06.2025
Новые неформальные торговые блоки, скорее всего, появятся в Южной Азии с центром в Индии или в одной из крупных стран АС...
10.06.2025
Американские и мировые СМИ пестрят апокалиптическими заголовками в связи с планами сократить бюджет NASA. «Стимул» пытае...
05.06.2025
В новом нацпроекте «Космос» частным компаниям предложено поучаствовать в создании низкоорбитальных группировок спутников...
03.06.2025
В городе-курорте стартовало мероприятие-спутник V Конгресса молодых ученых. Ученым предстоит отобрать лучшие технологиче...
Наверх