ИИ с раскосыми глазами

Один из мировых лидеров в области технологий распознавания лиц китайская компания Megvii в скором времени может стать первым представителем плеяды молодых ИИ-суперзвезд Поднебесной, который осуществит IPO на фондовом рынке
ИИ с раскосыми глазами
Китай достиг серьезных успехов в компьютерном распознавании речи и распознавании образов, прежде всего человеческих лиц
thumbor.forbes.com

Неофициальная информация о том, что Megvii планирует подать предварительную заявку на IPO на Гонконгской фондовой бирже впервые появилась в конце прошлой недели, а уже утром в понедельник 26 августа черновой текст этой заявки появился на одном из специализированных интернет-сайтов Гонконга (сильно усеченную 46-страничную версию этого документа можно свободно скачать в интернете).

Согласно сведениям из «хорошо информированных анонимных источников», Megvii рассчитывает привлечь в результате первичного размещения от 500 млн до 1 млрд долларов.

 

Проект золотого щита

Интересно, что целый ряд крупных компаний, включая пивного гиганта Anheuser-Busch InBev и интернет-динозавра Alibaba Holdings отложили свои гонконгские биржевые проекты до лучших времен в связи с затянувшимися массовыми протестными акциями в этом автономном анклаве КНР. Причем совет директоров Alibaba Holdings принял решение о перенести свой дебют в Гонконге, который был намечен на август, только в начале прошлой недели (для этого титана китайского хайтека это было бы вторичным размещением — в сентябре 2014 года состоялось его легендарное IPO на NYSE).

magnifier (1).png Согласно сведениям из «хорошо информированных анонимных источников», Megvii рассчитывает в результате выхода на гонконгскую биржу получить от 500 млн до 1 млрд долларов

Однако руководство Megvii, судя по всему, весь этот неприятный внешний фон отнюдь не смущает: компания твердо намерена опередить своих многочисленных конкурентов на сильно разогретом внутреннем рынке технологий искусственного интеллекта, которые, как известно, руководство КНР рассматривает как один из главных козырей долгосрочной экономической стратегии страны.

Напомним, что согласно Национальной стратегии развития технологий искусственного интеллекта, утвержденной на заседании Госсовета КНР в июле 2017 года, к 2020-му Китай должен «сравняться с основными мировыми лидерами в сфере ИИ-разработок», а сами ИИ-технологии должны стать «новыми двигателями экономического роста КНР». В 2025 году ИИ-технологии уже должны стать «главным драйвером экономики Китая», за счет них будут совершены «важнейшие научно-технологические прорывы». И наконец, к 2030 году планируется решить главную задачу: КНР должна достичь глобального инновационного лидерства в сфере ИИ-технологий. К этому времени, по расчетам китайских идеологов, объем национальной индустрии технологий искусственного интеллекта должен преодолеть психологически важную планку — триллион юаней, что по текущему курсу составляет примерно 140 млрд долларов.

Как мы отмечали еще два года назад в одной из наших публикаций, «можно выделить как минимум два направления коммерческих разработок в сфере ИИ, на которых Китай уже достиг серьезных успехов, — это компьютерное распознавание речи и распознавание образов, прежде всего человеческих лиц».

magnifier (1).png Начиная с 2000 года в Китае реализуется госпрограмма, «Проект золотого щита». Ее главная цель — создание централизованной базы визуальных данных всех граждан страны, доступ к которой в реальном времени должны получить правоохранительные органы КНР

На втором из этих направлений китайцы уже сегодня считаются бесспорными мировыми лидерами — как по количественным, так и по качественным показателям.

По оценкам исследовательской компании IHS Markit, уже в 2017 году общее число установленных в КНР камер видеонаблюдения в городской и сельской местности достигло 176 млн единиц, тогда как в США их насчитывалось лишь 50 млн; к концу 2020 года их может стать уже 450 млн.

Начиная с 2000 года в Китае реализуется специальная госпрограмма Golden Shield Project («Проект золотого щита»). Ее главная цель — создание централизованной базы визуальных данных всех граждан страны, доступ к которой в реальном времени должны получить правоохранительные органы КНР. Два других масштабных госпроекта, запущенных относительно недавно, — Skynet Project, предусматривающий установку камер видеонаблюдения в различных зонах общего пользования в крупнейших городах страны, и Sharp Eye Project, который нацелен на создание аналогичных наблюдательных систем в сельской местности.

Кроме того, в Китае насчитывается уже как минимум четыре частные компании, специализирующиеся на технологиях визуального распознавания, рыночная стоимость которых сегодня заметно превышает миллиард долларов: помимо Megvii это SenseTime, Yitu Technology и CloudWalk Technology.

МЕГВИ ИНЬ ЦИ.png
Название своей компании Megvii, ее основатель, выпускник престижного пекинского университета Цинхуа Инь Ци, в одном из интервью расшифровал как MegaVision
scmp.com

 

Главное — застолбить место

Впрочем, предполагаемый пионер фондового рынка Megvii (это название ее основатель, выпускник престижного пекинского университета Цинхуа Инь Ци, в одном из интервью расшифровал как MegaVision) пока не может похвастаться яркими финансово-экономическими результатами. По итогам первого полугодия 2019 года компания получила серьезные убытки — 5,2 млрд юаней. Как несколько туманно объясняется в заявочном проспекте компании, столь сильный рост убытков «в основном был вызван изменением справедливой стоимости наших привилегированных акций и нашими постоянными инвестициями в R&D». В частности, расходы на R&D составили 43% выручки за 2018 год и 49% выручки за первое полугодие 2019-го.

А одним из немногих позитивных моментов в драфте ее заявки на IPO можно считать разве что информацию о том, что за первое полугодие 2019-го компании удалось более чем втрое увеличить выручку по сравнению с аналогичным периодом прошлого года — до 949 млн юаней.

Тем не менее за восемь лет, прошедших с момента основания Megvii в 2011 году, ее руководству удалось привлечь весьма значительные средства от многочисленных внешних инвесторов.

magnifier (1).png К 2030 году, по расчетам китайских идеологов, общий объем национальной индустрии технологий искусственного интеллекта должен преодолеть психологически важную планку — триллион юаней

Так, по итогам последнего крупного раунда финансирования (Series D), осуществленного компанией в мае этого года, Megvii получила 750 млн долларов.

Главными «донорами» в этом раунде стали Bank of China Group Investment (венчурное подразделение китайского центробанка), Abu Dhabi Investment Authority (ADIA), австралийская Macquarie Group и гонконгская ICBC Asset Management.

Среди прочих солидных инвесторов Megvii значатся Ant Financial (автономное финансовое подразделение Alibaba), гонконгская Boyu Capital,, южнокорейский многопрофильный холдинг SK Group, крупнейший тайваньский производитель полупроводниковой продукции Foxconn и два китайских венчурных фонда — Qiming Venture Partners и Sinovation Ventures.

В качестве же стратегических инвесторов руководство компании называет прежде всего Alibaba Holdings и ее финансовое подразделение Ant Financial, а также еще одного лидера китайского хайтека Lenovo Group и ведущего сотового оператора страны China Mobile Ltd.

Основными заказчиками инновационных технологий визуального распознавания компании являются различные госструктуры, муниципальные власти, учреждения здравоохранения, а также ряд крупных частных компаний.

Причем согласно заявочному проспекту Megvii 73% ее выручки приходится на контракты в области интернета вещей (IoT) на городском уровне.

МЕГВИ СЕНС ТАЙМ.png
Система распознавания лиц компании SenseTime Group в новом пекинском аэропорту
algorithmxlab.com

 

Семейство китайских единорогов

Главным конкурентом Megvii среди множества молодых китайских компаний-разработчиков технологий распознавания лиц считается SenseTime Group.

Эта компания, штаб-квартира которой находится в Пекине, была создана в 2014 году в Гонконгском научном парке (Hong Kong Science Park) профессором Chinese University of Hong Kong Таном Сяо’оу, получившим докторскую степень в американском MIT за исследования в области машинного распознавания образов еще в 1996 году.

Тан и его студенты смогли разработать весьма эффективный алгоритм распознавания лиц, в ходе первых тестов продемонстрировавший точность 98,52% (тем самым разработчикам впервые удалось превзойти уровень «хорошо натренированного человеческого глаза»).

Самым первым инвестором SenseTime был американский венчурный фонд IDG Capital, профинансировавший молодой стартап на несколько десятков миллионов долларов уже в августе 2014 года, а первым большим клиентом — ведущий госоператор сотовой связи КНР China Mobile.

magnifier (1).png Главным конкурентом Megvii среди множества молодых китайских компаний — разработчиков технологий распознавания лиц считается SenseTime

За пять лет своего существования SenseTime обзавелась множеством филиалов и R&D-подразделений, в том числе в США, Сингапуре, Малайзии и ОАЭ, а также полутора тысячами ИИ-патентов.

Число ее сотрудников уже превышает три тысячи человек, среди которых, по заявлениям руководства компании, «более 150 обладателей докторских ученых степеней в сфере ИИ».

Главный спонсор китайских стартапов, разрабатывающих технологии распознавания лиц, Alibaba Group Holding, был в числе ведущих инвесторов одного из двух прошлогодних раундов SenseTime в апреле 2018 года, на общую сумму 620 млн долларов, который вскоре был признан рекордным по объемам привлеченных ресурсов среди стартапов в сфере технологий ИИ. Помимо Alibaba Holding ее крупными инвесторами являются сингапурская Temasek Holdings, британская Fidelity International и венчурное подразделение ведущего американского производителя микрочипов Qualcomm. И тогда же была представлена солидная официальная оценка предполагаемой рыночной стоимости SenseTime — 4,5 млрд долларов.

Однако уже в сентябре 2018-го SenseTime умудрилась побить свой же инвестиционный рекорд: в новой серии D она привлекла еще от 1 до 1,6 млрд долларов (такой сильный оценочный разброс объясняется закрытостью последнего инвестраунда) от группы компаний, предположительно возглавлявшейся шанхайским венчурным подразделением японского SoftBank — SBCVC (Softbank China Venture Capital). Таким образом, по состоянию на конец прошлого года SenseTime в общей сложности получила от 2,6 млрд (версия Crunchbase) до 3,6 млрд долларов (оценка интернет-ресурса Owler), и, по информации, полученной в январе 2019 года Bloomberg «из осведомленных источников», рассчитывала в этом году разжиться еще как минимум двумя миллиардами, причем в числе потенциальных крупнейших инвесторов тогда назывался и главный технофонд Масаёси Сона со товарищи — VisionFund.

Важным преимуществом SenseTime по сравнению с Megvii аналитики считают тот факт, что ей еще в 2017 году удалось стать прибыльной. Очень мощными темпами на протяжении последних трех лет (2016–2018 гг.) растет и ее общая выручка, которая увеличилась за этот период почти на 400%.

МЕГВИ ЮТИ.png
Система компании Yitu Technology способна идентифицировать лицо из базы более чем в 1,8 миллиона человек менее чем за три секунды
abc.net.au

К настоящему времени SenseTime располагает более чем 700 крупными корпоративными клиентами и в Китае, и за рубежом. В числе ее заказчиков такие гранды, как Qualcomm, Nvidia, Alibaba, Xiaomi Corp, Oppo, Vivo, Honda Motor, China Mobile и UnionPay.

Кроме того, компании в прошлом году удалось заключить очень выгодный контракт на поставку своих систем мониторинга дорожного трафика с крупнейшим китайским оператором городского метрополитена Shanghai Shentong Metro Group.

Еще один заметный китайский игрок на быстрорастущем рынке интеллектуальных технологий распознавания образов — Yitu Technology (ее полное название — Shanghai Yitu Network Technology Co.). Эта компания была основана в 2012 году в Шанхае молодым, но уже довольно известным к тому времени специалистом в области ИИ-технологий Лео Чжу (в китайской версии — Чжу Си), выпускником Калифорнийского университета Лос-Анджелеса (UCLA), некоторое время работавшим затем в AI laboratory MIT, в котором ранее защитился его более опытный коллега-конкурент Тан Сяо’оу из SenseTime.

Лео Чжу является CEO компании, а другим сооснователем Yitu был Линь Чэньси, один из ведущих IT-специалистов Alibaba Cloud — облачного подразделения вездесущей Alibaba, и, как нетрудно догадаться, Alibaba в дальнейшем принимала активное участие в становлении и этой перспективной ИИ-компании.

МЕГВИ КЛАУДВОК.png
Ежедневно Cloudwalk сканирует более 1 млрд лиц и продолжает пополнять свою базу данных. За последние четыре года Cloudwalk помогла полиции КНР задержать 10 тыс. преступников
hightech.plus

В июне 2014 года Yitu была приобретена китайской венчурной компанией Gaorong Capital. Согласно последним оценкам Owler, по состоянию на конец прошлого года общий объем инвестиций, привлеченных Yitu Technology, составил порядка 370 млн долларов, то есть был заметно меньше, чем у двух явных лидеров на этом технологическом направлении, Megvii и SenseTime, но все же более чем достаточным для того, чтобы Yitu стала еще одним членом элитного клуба ИИ-единорогов.

Стоит отметить еще один любопытный момент: согласно последним тестам, проведенным в конце прошлого года экспертами американского Национального института стандартов и технологий (NIST), алгоритмы Yitu показали более высокие результаты по точности распознавания лиц по сравнению с алгоритмами SenseTime.

И наконец, четвертый представитель «рогатой ИИ-технофауны» Китая, обладающий к тому же весьма оригинальной биографией, — стартап CloudWalk Technology, базирующийся в Гуанчжоу.

В отличие от трех вышеперечисленных компаний, Cloudwalk, основанная в 2015 году группой специалистов Китайской академии наук, изначально активно поддерживалась различными госструктурами и органами власти, как на общенациональном, так и на региональном уровне. Так, в 2017 году Cloudwalk получила очень солидный грант — 2 млрд юаней (около 300 млн долларов) — от муниципального правительства Гуанчжоу, а позднее — инвестиции от целого ряда государственных инвестиционных фондов, в том числе курируемого непосредственно Госсоветом КНР China Reform Holdings.

magnifier (1).png Благодаря мощной финансовой поддержке государства Cloudwalk также довольно быстро перешла в престижную категорию ИИ-единорогов: в недавнем докладе Credit Suisse текущая рыночная стоимость компании оценивается примерно в три миллиарда долларов

Эта инвестиционная специфика, по всей видимости, была связана с тем, что технологические наработки специалистов Cloudwalk были особенно востребованы китайскими правоохранительными органами (прежде всего министерством общественной безопасности КНР): по данным, приведенным в марте 2019 года гонконгским изданием South China Morning Post, благодаря технологиям визуального распознавания Cloudwalk китайская полиция за последние четыре года смогла задержать более десяти тысяч преступников, тогда как та же Megvii, согласно официальной статистике, недавно представленной руководством компании, пока может записать на свой счет пять тысяч арестов, проведенных сотрудниками правоохранительных органов КНР.

Впрочем, справедливости ради уточним, что на первых порах Cloudwalk в основном фокусировалась на работе с различными кредитно-финансовыми учреждениями страны и достигла впечатляющих успехов и на этом важном направлении: ее технологии используются более чем 400 китайскими банками, в том числе Bank of China и Agricultural Bank of China.

И еще один интересный факт: технологии визуального сканирования этой компании сегодня используются более чем в 60 аэропортах КНР.

Благодаря мощной финансовой поддержке государства Cloudwalk также довольно быстро перешла в престижную категорию ИИ-единорогов: в недавнем докладе Credit Suisse текущая рыночная стоимость компании оценивается примерно в три миллиарда долларов.

Наши лидеры

В России в числе технологических лидеров в сфере разработок технологий распознавания образов можно назвать следующие компании:

ISS — один из участников проекта Минэкономразвития «Поддержка частных высокотехнологических компаний-лидеров» («Национальные чемпионы»), недавно представившая свой новый нейросетевой модуль SecurOS FaceХ;

— ГК «Центр речевых технологий» (ЦРТ), также входящий в число участников этого проекта (среди множества его инновационных разработок — универсальная система биометрического распознавания лиц «Визирь» и специализированная система видеоидентификации на различных спортивных объектах «Визирь. Арена»;

«Вокорд», резидент ИТ-кластера фонда «Сколково», приобретенная в июне 2019 года китайской Huawei ;

VisionLabs, 25-процентный пакет акций которой в 2017 году купил Сбербанк.

Отдельного упоминания заслуживает NTechLab — стартап, основанный в 2015 году программистом МГУ Артемом Кухаренко и бизнесменом Александром Кабаковым. Уже в 2017 году он победил в двух из трех номинаций («Скорость идентификации» и «Точность верификации») в престижном конкурсе Face Recognition Prize Challenge, организованном американским Агентством передовых исследований в сфере разведки (IARPA) совместно с Национальным институтом стандартов и технологий США (показательно, что в третьей номинации этого конкурса, «Точность идентификации», лучшей была признана китайская компания Yitu, о которой мы упоминали выше).

Об этой компании «Стимул» подробно рассказывал в том же 2017 году. Отметим также, что на прошлой неделе NTechLab анонсировала перспективную ИИ-технологию распознавания человека по силуэту.

Темы: Компания

Еще по теме
«ОРГА-Зеленоград», владея замечательными научно-техническими кадрами, не раз становилась лидером новых рынков, но оказал...
История доминирования Tesla на мировом электромобильном рынке близится к завершению. На большой EV-арене появляются дино...