Натиск искусственного интеллекта

Институт проблем передачи информации РАН на мировом уровне занимается искусственным интеллектом с 1961 года. Его опыт показывает, насколько важно не иметь разрывов между технологиями и наукой
Натиск искусственного интеллекта
В центре Андрей Соболевский, слева Андрей Большаков, справа Егор Ершов
Олег Сердечников

Статья публикуется одновременно в «Эксперте» и в «Стимуле»

Cтремительный прогресс в сфере искусственного интеллекта сейчас обеспечивают главным образом большие корпорации, которые способны создать большую концентрацию специалистов, идей, больших данных и вычислительных мощностей. Но за концентрацией идей и специалистов стоят десятилетия научного поиска. И новые прорывы потребуют фундаментальных открытий и живой науки. Это следует из разговора, который состоялся в Институте проблем передачи информации (ИППИ) РАН им. А. А. Харкевича.

Институт был спроектирован и создан в 1961 году Александром Александровичем Харкевичем, который одним из первых в СССР понял значение теории информации, которая во многом лежит в основании информационного века, и стал ее развивать. Теория информации тогда чаще называлась «теорией связи» и возникла как теоретическое расширение практических задач. Математики искали пути решения задач, связанных, например, с удалением помех в радиосигнале, вычленением информации из шума, но пришли к фундаментальной теории.


ХАРКЕВИЧ.jpg
Александр Александрович Харкевич — советский учёный в области радиотехники, электроники, акустики и приборостроения, член-корреспондент АН УССР, действительный член АН СССР, профессор
iitp.ru

Автор теории информации — американский математик Клод Эдвуд Шеннон, который во время Второй мировой войны занимался теоретическими проблемами шифрования — криптографией. Основы теории информации он заложил в работе «Математическая теория связи», которая вышла в 1948 году. Именно Шеннон предложил бит как единицу информации, применил понятие энтропии (мера неупорядоченности в термодинамике) к проблеме передачи информации и сформулировал целый ряд теорем новой теории. Так из прикладных задач возникла фундаментальная наука, которая потом привела к технологическому рывку.


ШЕННОН.jpg
Клод Элвуд Шеннон — американский инженер, криптоаналитик и математик. Считается «отцом информационного века». Является основателем теории информации, нашедшей применение в современных высокотехнологических системах связи
Wikipedia

«И Харкевич понимал, — говорит директор ИППИ РАН Андрей Соболевский. — что проблемы, которые стоят перед связью в контексте передачи информации, не только инженерные, но и научные. Вот почему он считал, что этот институт должен стать центром фундаментальных исследований по тематике передачи информации, и понимал, что кроме передачи информации здесь должны заниматься и ее обработкой. Поэтому с момента создания института помимо тематики связи здесь было и то, что называлось распознаванием образов».

А вот задача распознавания образов — это уже сфера применения искусственного интеллекта. Конечно, задачу различения на картинке любой кошки и любой собаки можно решить разными способами, например собирая статистические данные или пытаясь найти принципиальные отличия между ними. Но собаки и кошки бывают разные, а их изображения там более, так что, скорее всего, задача будет решаться со многими ошибками. При этом любой трехлетний ребенок решит задачу распознавания кошки и собаки безошибочно. Ученые еще в 1940-х поняли, что для определенных задач, таких как распознавание образов, можно попробовать создать машины, в чем-то подражающие принципам работы мозга животных, искусственные нейросети.

В 1958 году Фрэнк Розенблатт опубликовал статью о перцептроне — машине, которая устроена как элементарная модель мозга. В ней есть разные слои нейронов: слой, отвечающий за восприятие информации; слой, отвечающий за ее обработку и память; и слой, отвечающий за вывод информации. Перцептрон умеет учиться: в ответ на сигналы одобрения или неодобрения он перестраивает связи между нейронами. Перцептрон стал не только моделью изучения законов работы мозга, но и инструментом решения технических задач, хотя до компьютерной эры он разрабатывался больше учеными, чем инженерами. Вычислительные мощности и обилие данных сделали нейросети по-настоящему эффективными.

Большинство современных нейросетей — наследники перцептрона, но усовершенствованные. Под разные задачи создаются сети с разным количеством слоев нейронов, с разной математикой формирования связей между нейронами и слоями — с разной «архитектурой».

magnifier.png В нашем институте тоже были работы по распознаванию речи. Во-первых, стояла задача создания «фонетической пишущей машинки»: человек говорит — машина переводит речь в текст. Во-вторых, это создание системы голосового распознавания команд

Биология и математика были рядом и при создании ИППИ. К отделениям математики, связи и распознавания образов быстро добавилась физиология процессов передачи и обработки информации в живом. Хотя есть легенда, что Харкевич якобы поражался перспективой появления биологической лаборатории в составе технического института: «Я бы не пошел работать в такой институт даже уборщицей!» Так или иначе, Харкевич, как рассказывает Соболевский, обладал хорошим чувством юмора и очень современно на тот момент спроектировал институт, который занимался искусственными интеллектом уже с момента своего основания.

ИППИ был на передовой искусственного интеллекта на протяжении шестидесяти лет, да и сейчас создает новые востребованные мировым рынком разработки. Поэтому именно здесь лучше всего говорить о связи научных и прикладных задач в этой сфере.

В нашей беседе, которая состоялась в институте, приняли участие Андрей Соболевский — директор ИППИ РАН, доктор физико-математических наук, профессор РАН, заведующий кафедрой технологий моделирования сложных систем факультета компьютерных наук НИУ ВШЭ; Андрей Большаков — заместитель директора по инновационной деятельности, генеральный директор малых инновационных предприятий ИППИ РАН «Визиллект-сервис» и «Эвокарго», и Егор Ершов — старший научный сотрудник, руководитель сектора репродукции и синтеза цвета, кандидат физико-математических наук, доцент, заместитель заведующего кафедрой технологий моделирования сложных систем факультета компьютерных наук НИУ ВШЭ.

На заре искусственного интеллекта

— Что именно в начале 1960-х понималось под распознаванием образов?

Андрей Соболевский: Под распознаванием образов тогда понималось, например, распознавание каких-то объектов или структур, скажем, на аэрофотоснимках. Тогда, безусловно, уже стояла задача распознавания и синтеза речи. В нашем институте тоже были работы по распознаванию речи. Во-первых, стояла задача создания «фонетической пишущей машинки»: человек говорит — машина переводит речь в текст. Во-вторых, это создание системы голосового распознавания команд. Например, на центральном диспетчерском пункте управления Минэнерго СССР использовали систему, разработанную в нашем институте, для дистанционного управления объектами посредством голосовых команд. Помимо этого решались задачи оценки речевого тона (различение женских и мужских голосов), а также разрабатывались методы распознавания речи независимо от диктора. Технически это выглядело примерно так же, как и сегодня: создавалась большая библиотека обучающих образцов, содержащих амплитудно-частотные характеристики слов, частей слов, слогов, букв, а потом проводилось сравнение.

В физиологической лаборатории института, которую создал Николай Дмитриевич Нюберг, работал и Михаил Моисеевич Бонгард — один из основоположников теории распознавания образов, автор классической монографии «Проблема узнавания».

— Бонгард понимал распознавание как математическую задачу?

А. С.: Это понималось как задача, требующая математизации, математического подхода. Бонгард этого прямо не пишет, но кажется, что вдохновлялся он при этом Шенноном. Потому что работы Шеннона были примером того, что правильная математизация области, которая вроде бы совершенно безнадежно инженерная, многое в ней проясняет и оказывается очень полезной для инженеров же.

magnifier.png Фактически Бонгард сформулировал программу математизации хотя бы простейших интеллектуальных функций человека и высших животных. Чтобы смоделировать их и тем самым сделать возможным математическое исследование их границ. И эта программа была в значительной степени осуществлена

Фактически Бонгард сформулировал программу математизации хотя бы простейших интеллектуальных функций человека и высших животных. Чтобы смоделировать их и тем самым сделать возможным математическое исследование их границ. И эта программа была в значительной степени осуществлена.

Можно сказать, что 1960-е годы были периодом натиска искусственного интеллекта, а потом воцарилось некоторое затишье. В середине двадцатого века и в моей «родной» дисциплине, математике, и во многих других науках было впервые предложено много такого, что затем оказалось идейно и концептуально весьма плодотворным. Это было очень творческое время, облик которого определяло поколение тех, кому сейчас за восемьдесят.

— Но распознавание образов уже тогда понималось как искусственный интеллект?

А. С.: Безусловно, это понималось как искусственный интеллект.

Но продолжу рассказ о том, как формировался наш институт. Лаборатория психофизиологии зрения попала сюда из физиологических лабораторий первой, затем по проторенному пути в ИППИ перешел созданный по инициативе Израиля Моисеевича Гельфанда отдел теоретической биологии, который ранее существовал при Институте биофизики. И в это же время сюда перешла лаборатория физиологии движения. Таким образом, у нас образовался биологический отдел из трех лабораторий: передачи и обработки информации в органах чувств, регуляции движений и других физиологических систем, математических методов в биологии. А на рубеже 2000-х годов отдельно появились лаборатории, занимающиеся биоинформатикой и геномикой.


ДОБРУШИН.jpg
Роланд Львович Добрушин — советский учёный-математик, доктор физико-математических наук, специалист в области математической физики, теории вероятностей и теории информации. Специализировался на изучении цепей Маркова и теорем Шеннона
iitp.ru

Параллельно в институте развивалась математика. Свою роль в этом сыграли бурные политические события второй половины 1960-х, когда циркулировали разные коллективные письма, которые могли серьезно изменить жизнь своих подписантов. Один из них — Роланд Львович Добрушин, профессор мехмата МГУ, был вынужден оттуда уйти. Будучи по специальности вероятностником и интересуясь теорией информации, он пришел в ИППИ и создал математическую лабораторию сложных информационных систем (кстати, он тем самым лет на десять-пятнадцать предвосхитил мировую научную моду на сложные системы). Под его влиянием в институте возник очень сильный коллектив математиков, трое из которых получили медаль Филдса: Григорий Маргулис в 1978 году, Максим Концевич в 1998-м и Андрей Окуньков, который сейчас в Сколтехе, в 2006 году — все они были сотрудниками добрушинской лаборатории.

Так что в настоящее время в институте развивается несколько направлений: физиология, математика, телекоммуникационная техника (это сейчас Wi-Fi, сети 5G и помехоустойчивое кодирование), распознавание образов, в котором центр тяжести в настоящее время на компьютерном зрении. Сюда же относится анализ медицинских изображений методами нейросетей. Вот эти направления и относятся к искусственному интеллекту.

— И как вы теперь отвечаете себе на вопрос, заданный Харкевичем: как можно руководить институтом, в котором есть и инженеры, и биологи?

А. С.: Во-первых, конечно, за эти годы у нас появилась внутренняя культура нетривиального содержательного сотрудничества разных научных направлений. Хотя нельзя сказать, что это происходит у нас все время, но все радуются, когда это получается. Во-вторых, в институте сформировался некий набор общих для всех ценностных установок. И в-третьих, математики, будучи, казалось бы, самой обособленной и достаточно изолированной частью института, потому что они занимаются своими собственными исследованиями в своей логике, стали для института «водонапорной башней». Ведь это наука с очень высокими стандартами качества. И математическое сообщество, пожалуй, наименее подвержено всяким социальным болезням. И то, что такое сообщество есть внутри института, что это наши непосредственные соседи и коллеги, очень помогает и остальным тоже.


МАРГУЛИС.jpg
В институте возник очень сильный коллектив математиков, трое из которых получили медаль Филдса: Григорий Маргулис в 1978 году, Максим Концевич в 1998-м и Андрей Окуньков в 2006 году
iitp.ru

А идеал, к которому мы все время стремимся, — это объединение разных наших коллективов для решения конкретных научных задач. Например, таких, которыми занимается Егор Ершов.

Откуда цвет в смартфоне и на сетчатке

Егор Ершов: А занимаюсь я проблемой репродукции и синтеза цвета.

— И что это такое?

Е. Е.: Скажем, вы наблюдаете за какой-то сценой (сцена — обозначение того, что располагается в зоне кадра. — «Эксперт») и сделали снимок на ваше устройство — планшет, гаджет. Существует проблема, насколько хорошо ваше устройство повторяет на экране то, что вы видите глазами, насколько оно хорошо позволяет репродуцировать наблюдаемое вами. Или, например, какую-то фотографию. Вы, как человек, связанный с печатным изданием, понимаете наверняка, что такое плохие результаты печати или хорошие результаты печати. Эти результаты связаны с тем, какие используются принтеры, как они откалиброваны, какие там цветовые профили и так далее. Это тоже часть световой репродукции. Часть задач цветовой репродукции — это задачи цветового менеджмента, которые проще объяснить на примере.

Допустим, у вас есть фотография и вам нужно в идеале добиться, чтобы независимо от того, какое устройства вывода вы используете (принтер, проектор, монитор), максимально одинаково и правдоподобно ее репродуцировать. Или синтезировать, если это изображение было ненастоящим. Например, если речь идет о дополненной виртуальной реальности, где вы хотите несуществующий объект вписать в реальную сцену так, чтобы это было незаметно, что это несуществующий объект. Чтобы он так же отбрасывал тени, чтобы он переотражал цвет и так далее.

magnifier.png У математики цвета очень серьезные основания. Их разработали Герман Грассман — создатель внешней дифференциальной алгебры, Герман Гельмгольц — знаменитый физиолог, психолог и акустик и Эрвин Шредингер — один из создателей квантовой механики

Это определяется тем, насколько адекватна оценка параметров сцены, проводимая вашим устройством. Для того чтобы все это делать хорошо, необходимо проводить некий набор процедур по нормализации зафиксированного изображения. То, что упало на матрицу камеры, нужно так преобразовать, чтобы изображение показалось человеку похожим на натуру. Но, с точки зрения биолога и физиолога зрения, это, скорее, необходимость повторить некоторые процедуры, которые происходят в глазу.

Например, есть такая характеристика зрения — константность, которая характеризует вашу способность, наблюдая белый лист при любом освещении — и на улице, и ночью, — достоверно утверждать, что он в любых условиях все еще белый. Это, на самом деле, уникальное свойство зрительной системы, которое еще не до конца изучено. Телефон сам так не может. Его нужно научить этому. Как и любую камеру. Для этого нужно в вашем устройстве повторить те же механизмы, которые происходят в человеке.

В частности, одна из задач, которыми мы занимаемся, — оценка параметров освещения сцены. Конкретнее, требуется определить параметры освещения, скажем цвет источника освещения. Зная цвет, можно выполнить ту самую нормализацию.

— Как здесь работает искусственный интеллект?

— Строго говоря, задача оценки освещения некорректна. Невозможно, наблюдая произвольную сцену, гарантированно точно определить параметры освещения. Глядя на равномерно красное изображение, вы уже не сможете понять, какой это был случай: белая бумага, освещенная красной лампой, или наоборот. В меньшем масштабе, но эта проблема преследует исследователей почти во всех сценах. Наблюдая, скажем, за желтоватыми стенами в нашем кабинете, можно спутать и решить, что стены белые, а источник делал их более желтым. Тут человеческой системе зрения на помощь зачастую приходят механизмы той самой цветовой константности, в то время как телефону на помощь приходят технологии искусственного интеллекта.

— В вашем случае это находит какое-то практическое применение? Или это пока на уровне фундаментальных исследований?

Е. Е.: Это абсолютно практические вещи. Хотя у нас есть и фундаментальное направление — мы также занимаемся математической теорией цвета. Есть такая наука колориметрия — это наука о восприятии цвета человеком. В этой науке конечным измерительным устройством является человек, потому что измеряются свойства зрительной системы человека. Эта наука немолода, прогресс ушел уже достаточно далеко. Не обошлось и без цветовых стандартов. Например, для того чтобы мы с вами могли обмениваться изображениями и одинаково их воспринимать, еще в первой половине прошлого столетия измерили параметры цветового зрения пары десятков британских мужчин, усреднили измерения и получили так называемого стандартного наблюдателя. Это как в физике есть система СИ, а у нас в колориметрии есть цветовое пространство стандартного наблюдателя. С использованием этого пространства и представляется большинство современных изображений.

К этому списку задач относится и уже упомянутая задача оценки освещения в сцене. В любом устройстве с камерами, которым вы пользуетесь, все эти процедуры выполняются. И вы можете всегда устроить легкую проверку, чтобы понять, хороший ли цветовой алгоритм в вашем устройстве. Просто нужно взять устройство и половину поля зрения камеры закрыть пальцем. Если цвет довольно резко поменялся, значит, алгоритм довольно глупый и не знает, что может быть такое заслонение, а на это надо уметь делать поправку.

И практический результат нашей работы — разработка алгоритма цветовой коррекции, в том числе для всяких мобильных устройств, для камер, планшетов.

И вы видите результаты применения этих алгоритмов в любом современном цифровом устройстве, где есть видоискатель, есть фото- и кинокамера. Включив камеру, вы видите, как быстро меняется картинка того, что в реальном времени происходит, сохраняя при этом «естественные» цвета. Чтобы этого достичь, все производители используют алгоритмы, формирующие такое изображение на видоискателе.

Но стоит вам произвести съемку, а потом открыть полученное изображение в галерее, то вы увидите, что изображение немного другое, потому что включаются уже другие, более сложные алгоритмы, которые не могут работать в реальном времени, зато они дают более, если хотите, правильный результат, модерируя полученное изображение.


СХЕМА 2.jpg
ИППИ, «Эксперт»

— А как здесь используется математика?

А. С.: Цветовое пространство человека трехмерно, потому что у нас на сетчатке имеются колбочки трех разных типов. Поэтому и в компьютерных мониторах используются три параметра — R, G и B, которые описывают цвет каждого пиксела монитора. Если разные цвета описываются тремя параметрами, значит, они образуют трехмерное пространство. И для решения разных колориметрических задач — например, если нужно выделить на фотографии изображение однородно окрашенного предмета, несмотря на то что разные его части освещены по-разному и поэтому цвета соответствующих пикселов разные, — нужна математика, позволяющая работать с геометрией этого пространства. Оказывается, что если вся сцена освещена единственным источником света, то при правильном выборе системы координат в цветовом пространстве цвета пикселей, изображающих по-разному освещенные точки одинаковой окраски, располагаются вдоль одной прямой. Та математика, которая нужна для алгоритмов, работающих с такими прямыми, называется проективной геометрией. Это «высокая классика» науки, и в то же время она нужна нам для создания прикладных алгоритмов.

У математики цвета очень серьезные основания. Их разработали Герман Грассман — создатель внешней дифференциальной алгебры, Герман Гельмгольц — знаменитый физиолог, психолог и акустик и Эрвин Шредингер — один из создателей квантовой механики. И, например, работы Шредингера о цвете, которые были немножко подзабыты, были нами перечитаны и теперь используются и у нас тоже.

magnifier.png Если говорить об ИППИ, то основное, что отмечают все наши заказчики: у нас есть как биологические лаборатории, то есть мы понимаем, как изображение воспринимается человеком, так и лаборатории машинного зрения, то есть мы понимаем, как можно автоматизировать обработку информации

Раз мы заговорили о фундаментальных математических основах искусственного интеллекта, я бы упомянул еще теорию Вапника—Червоненкиса. Это часть современной статистической теории обучения, совершенно полноценная область фундаментальной математики, и в то же время она полезна инженерам, потому что она правильно концептуализирует то, что они делают (похоже на то, как Шеннон концептуализировал связь).

«Искусственный интеллект» сейчас в значительной степени маркетинговое название на рынке технологий, более корректно было бы говорить о методах машинного обучения на больших данных. А фундаментальные основы машинного обучения — это математика, которая придумана, как правило, десятки лет назад.

— Учитывая, что у нас все эти гаджеты, для которых вы разрабатываете свои алгоритмы, не наши, не российские, как вы продвигаете свои результаты?

А. С.: Имеются крупные международные компании, производящие эти устройства, с некоторыми из них мы тесно сотрудничаем. К сожалению, по условиям контрактов не можем их назвать, но вы легко догадаетесь — это общеизвестные бренды. Во многих таких устройствах, которые выходят на рынок, установлены наши алгоритмы по работе с цветом или по доступу к сетям Wi-Fi.

— В чем заключается развитие этой «цветовой» тематики? Условно говоря, вы сделали алгоритм для какой-то компании. Каков будет следующий этап? Виден ли у этой последовательности шагов предел? Или в какой-то момент все скажут: лучше уже не сделаешь.

А. С.: В каждом таком контракте мы делаем исследовательскую работу: прототип технологии лучших возможных алгоритмов в заданной нам технологической рамке, но не более. Потом эта компания перейдет к новой линейке телефонов следующего года, на следующую модель микропроцессора, которая вычислительно более мощная, и то, что раньше было невозможно, становится возможно. И эта компания приходит к нам и говорит: «Мы нуждаемся в новых алгоритмах» — и цикл повторяется на новом уровне.

— В мире много людей, которые занимаются такими же задачами. Как компании, с которыми вы работаете, объясняют, чем именно ваши решения их привлекают?

Андрей Большаков: Если говорить об ИППИ, то основное, что отмечают все наши заказчики: у нас есть как биологические лаборатории, то есть мы понимаем, как изображение воспринимается человеком, так и лаборатории машинного зрения, то есть мы понимаем, как можно автоматизировать обработку информации. Эти лаборатории тесно взаимодействуют друг с другом, и в результате мы можем получить алгоритмы, повторяющие в своей работе модули зрительной системы человека, или алгоритмы, специально подготавливающие изображения для наилучшего последующего восприятия человеком.

Здесь важно отметить, что одно взаимно развивалось из другого, гармонизировалось и углублялось. В результате наши компетенции и на российском, и на мировом рынке технологий чуть ли не уникальные.

При этом, конечно, все такие компании — заказчики разработки распределяют подчас одинаковые заказы по целому ряду исполнителей. У всех у них есть большая база научно-исследовательских институтов по всему миру, с которыми они работают. И они выбирают группы, которые они считают потенциально самыми продуктивными.


РАСПОЗН.jpg
Система автоматического распознавания типа транспортного средства на платных дорогах
ИППИ

Беспилотники и видеоаналитики

— Насколько я понимаю, ваши работы в области искусственного интеллекта не ограничиваются цветом…

А. Б.: Конечно. Есть еще компания «Визиллект» — малое инновационное предприятие ИППИ, созданное его сотрудниками, которая занимается разработкой индустриальных распознающих систем на основе зрительных систем. Я являюсь ее генеральным директором. Самый массовый ее продукт — система для классификации машин для пропускных пунктов платных дорог. Когда вы проезжаете по платной трассе, нужно определить, сколько требуется заплатить. Размер оплаты зависит от типа транспортного средства: количества осей, высоты и некоторых других показателей. Для того чтобы можно было производить такую оценку автоматически, наша компания разработала соответствующую систему. Кроме того, сотрудники «Визиллекта» развивают технологии, связанные с автономными транспортными средствами и с видеоаналитикой.

В прошлом году «Визиллект» создал совместное предприятие со своими партнерами, которое называется «Эвокарго», и в нем тоже ключевую роль играют наши сотрудники. Эта компания занимается созданием и реализацией сервиса грузоперевозок на основе электрических беспилотных логистических платформ собственной разработки и производства. Насколько я знаю, вы писали о наших разработках.

— Это грузовичок такой?

А. Б.: Да, это грузовичок. Он демонстрировался на открытии ЦКАД большой правительственной делегации. И мы взаимодействуем в том числе с другими институтами Академии наук по вопросам, связанным с водородной тягой для этого грузовичка.

Мы академический институт, но буквально в пятнадцати минутах отсюда находится «гараж» — опытно-промышленное производство, где производится сборка этих автомобилей, а также цех, где готовится их серийный выпуск.

magnifier.png Пока что идет бурное технологическое развитие искусственного интеллекта, но через некоторое время, возможно, колесо повернется еще раз, и мы увидим его очередную «зиму». Во время этой «зимы» вызреет еще какая-то новая интересная математика

Еще одним направлением нашей коммерческой деятельности, развиваемым в другой нашей совместной компании — NVI Solutions — является видеоаналитика для индустриальных предприятий: стоит где-то на заводе камера и наблюдает, где находится персонал. Есть ли сотрудники в опасных зонах, надеты ли на них все необходимые средства защиты. В случае, если что-то идет не так, может отключить оборудование, оповестить какие-то службы или сделать еще что-то, требуемое внутренними регламентами предприятий. В общем, не допустить травматизма или нарушения технологических процессов, чтобы никуда ничего не упало и никто не пострадал.

В начале этого года инвестиционный фонд «Новая индустрия», участниками которого являются «Газпром нефть», Газпромбанк, ВТБ, РВК, вложились в компанию NVI Solutions. Компания уже вела коммерческую деятельность и внутренние разработки по мере возможностей, однако с привлечением венчурного капитала она сможет значительно ускорить свое развитие.

Но и это не все, чем мы занимаемся. Еще одно публичное направление деятельности — распознавание любых шаблонизированных документов, таких как паспорта, водительские права. В общем, это любой машинописный документ, у которого есть изначальный шаблон.


ГРУЗОВИК.jpg
Беспилотник Эвокарго с системой распознавания, разработанной в ИППИ РАН во время натурных испытаний на ЦКАД
ИППИ

От науки к стандартам. И обратно

— Каково соотношение фундаментальных и прикладных исследований в разработках искусственного интеллекта?

А. С.: Мое личное мнение таково, что в истории таких крупных областей науки и техники, как искусственный интеллект, есть разные периоды. Сейчас мы наблюдаем период очень бурного развития технологий, начавшийся примерно с момента разработки глубоких нейросетей. Глубокие нейросети были изобретены. Настаиваю, что не «открыты», а «изобретены»: об открытиях корректнее говорить в математике, где, наоборот, открываются какие-то идеально существующие платоновские формы.

Дело в том, что прикладные работы — это сплошной поток во времени. Например, мы знаем, что есть закон Мура, который гарантирует людям, планирующим развитие микроэлектроники, ее достаточно плавное развитие. И это дает бизнесу определенный горизонт планирования. И в нашей, например, области бизнес понимает, что в этом году на такие-то мощности процессоров нужны такие алгоритмы. Через пять лет будут другие мощности и будут нужны другие алгоритмы. Это постоянный и достаточно плавный поток обновления.

При этом те фундаментальные знания, которые вы используете в своих разработках, возрастают дискретно. И к вам время от времени из фундаментальной науки приходит какое-то новое знание, которое дает вам возможность создавать качественно новые решения. Пока что идет бурное технологическое развитие искусственного интеллекта, но через некоторое время, возможно, колесо повернется еще раз, и мы увидим его очередную «зиму». Во время этой «зимы» вызреет еще какая-то новая интересная математика.


МАКЕТ.jpg
Масштабный макет высокоавтоматизированного транспортного средства с индустриальной системой распознавания
ИППИ

В вашем вопросе как бы подразумевается, что раз мы академический институт, то мы должны заниматься фундаментальными основами искусственного интеллекта. Да, мы занимаемся фундаментальными исследованиями в нескольких науках, про которые и Харкевич понимал, и мы сейчас знаем, что они для искусственного интеллекта релевантны. Но это фундаментальные исследования в математике и, возможно, в физиологии.

А в области искусственного интеллекта сейчас можно работать не на уровне нового фундаментального знания, а на уровне его трансляции и создания основанных на нем алгоритмов. И это уже не фундаментальная наука, а прикладная. Тут работа фундаментального института, такого, как наш — если говорить не о революционных моментах открытия новых концепций, а именно о каждодневной плановой научной работе, — это как раз работа на стыке между фундаментальным и прикладным знанием, где возникает этот шлейф.

И еще поддержание творческой атмосферы, среды обмена идей, которая только и делает возможной — хотя и не гарантирует — такие идейные прорывы. Мы уже говорили про Нюберга и цвет, про Бонгарда и проблемы узнавания. А еще рядом с ними работал Альфред Ярбус, наш выдающийся ученый-физиолог, автор первой экспериментальной методики записи движения глаза и книжки про когнитивную психологию зрения. Они работали в соседних комнатах и семинары вели на одной и той же доске, а значит, наверняка как-то стимулировали друг друга.

Так что мы занимаемся фундаментальными исследованиями в одних областях и одновременно прикладными исследованиями в области ИИ. То, что это в одном доме происходит, — это хорошо.

magnifier.png В начале этого года инвестиционный фонд «Новая индустрия», участниками которого являются «Газпром нефть», Газпромбанк, ВТБ, РВК, вложились в компанию NVI Solutions. Компания уже вела коммерческую деятельность и внутренние разработки по мере возможностей, однако с привлечением венчурного капитала она сможет значительно ускорить свое развитие

А инженерный мир — это, во-первых, мир стандартов. Любой сложный технологический продукт — это результат большой производственной цепочки. И для того, чтобы вы могли использовать железные или софтверные компоненты, произведенные другими людьми, и для того, чтобы то, что вы делаете, тоже, в свою очередь, можно было использовать, все должно соответствовать определенным стандартам. И все технологические цепочки этими стандартами «склеиваются».

Но когда свое слово говорит наука, топология этих цепочек где-то разрывается благодаря тому, что появляется что-то совершенно новое, чего раньше не было. Это приводит к изменению топологии технологических цепочек, это то место, где наука вмешивается в инженерию. Причем наука, которая вмешивается, — прикладная, потому что ученые, которые ею занимаются, должны обсудить свои новшества с инженерами и дать им прототип технологий.

А фундаментальная наука — это понимание окружающего мира, которого раньше не было, на котором эта технология вырастает. И фундаментальная наука движется дискретно, и в этом движении довольно непредсказуемым образом всплывают какие-то новые идеи, новые куски знаний.

 

Еще по теме:
01.11.2024
30 октября 1906 года родился выдающийся советский и российский математик Андрей Николаевич Тихонов, рассчитавший взрывы ...
28.10.2024
Джеймс Кук, родившийся 27 октября 1728 года, вошел в историю как первый исследователь южных полярных морей, открывший ев...
25.10.2024
Двадцать пятого октября 1914 года родился изобретатель первого в мире электронного синтезатора Евгений Александрович Мур...
21.10.2024
Атомные подводные газовозы, обитаемые и необитаемые глубоководные аппараты, атомные станции малой мощности, ветровые эле...
Наверх