Наука и технологии 19 января 2022

Школа Журавлева

14 января 2022 года скончался Юрий Иванович Журавлев, выдающийся ученый в области математики, прикладной математики и информатики, автор основополагающих научных работ в области булевой алгебры, исследования операций, методов оптимизации, теории алгоритмов и распознавания образов. О своем учителе и об особенностях созданной им школы рассказывает доктор физико-математических наук Константин Воронцов
Школа Журавлева
Юрий Иванович Журавлев, выдающийся ученый в области математики, прикладной математики и информатики, автор основополагающих работ в области булевой алгебры, исследования операций, методов оптимизации, теории алгоритмов и распознавания образов
Wikipedia

Юрий Иванович Журавлев родился 14 января 1935 года. В 1957 году окончил механико-математический факультет МГУ, в 1959-м, там же, аспирантуру. В 1959‒1969 годах работал в Институте математики Сибирского отделения АН СССР в Новосибирске. С 1969-го — в Вычислительном центре АН СССР (в настоящее время — ВЦ РАН ФИЦ ИУ РАН): завлабораторией, завотделом, заместителем директора по научной работе.

В 1966 году Юрию Ивановичу была присуждена Ленинская премия в области науки за цикл работ по решению задач алгебры и математической логики. Полученные им результаты применялись для создания эффективных программ для ЭВМ, конструирования схем и сетей для обработки информации. Ему удалось создать и обосновать новое направление — теорию локальных алгоритмов.

С 1964 года он занимался разработкой методов принятия решений на основе неполной, противоречивой, разнородной информации. Им и его учениками решено более сотни прикладных задач, в том числе прогнозирования и распознавания в экономике, политике, надзоре за финансами, технике, медицине, социологии, химии и других областях.

В 1976‒1978 годах Юрий Журавлев опубликовал цикл работ по ставшему вскоре знаменитым алгебраическому подходу к проблеме синтеза корректных алгоритмов. Эти пионерские работы породили целый поток исследований, надолго определивших мировое лидерство научной школы Журавлева в области математических методов распознавания.

Юрий Иванович создал всемирно известную научную школу в области распознавания и прогнозирования. Среди его учеников более 120 кандидатов и 30 докторов наук, в том числе четыре академика РАН (В. Л. Матросов, А. Л. Семенов, В. А. Сойфер, К. В. Рудаков).

Мы попросили поделиться воспоминаниями о Юрии Ивановиче одного из его учеников — доктора физико-математических наук, профессора кафедры математических методов прогнозирования факультета вычислительной математики и кибернетики МГУ Константина Вячеславовича Воронцова.

— Когда я поступил на Физтех в 1988 году, Юрий Иванович читал нам, первокурсникам факультета управления и прикладной математики, лекции по дискретному анализу. Сам по себе курс был необычен тем, что погружал нас в области математики, о которых мы почти ничего не знали, в отличие от более классических курсов математического анализа или аналитической геометрии. Самым поразительным был лекторский стиль Юрия Ивановича. Он говорил медленно и очень четко, делая большие почти театральные паузы, чтобы мы успевали осмыслить сказанное. Он не торопился и не говорил ни слова лишнего. Но уже через полчаса мозг начинал закипать от интенсивности потока идей. Это был восхитительный стиль мышления настоящего математика. Когда он собирался начать какой-то действительно сложный кусок, он хитро прищуривался и, улыбаясь, говорил: «Ну смотрите, ребята, дальше все совсем просто». Это была одна из его любимых фраз, она действовала почти гипнотически. Он умел разложить трудный насыщенный материал в такую цепочку рассуждений, где каждый шаг был совершенно естественным. Но стоило на минуту отвлечься и упустить какой-то переход, как вся конструкция переставала укладываться в голову. Поэтому слушали затаив дыхание.

magnifier.png Юрий Иванович неоднократно нам говорил, что, по всей видимости, общепринятая теория сложности слишком груба, она не вполне удачно формализует само понятие сложности. За бортом остается тот факт, что задачи, реально встречающиеся на практике, на самом деле намного проще, чем они могли бы быть в худшем случае

Позже, уже на научных семинарах отдела в Вычислительном центре РАН, когда кто-то говорил: «Ну… это очень сложно», — он оптимистично замечал: «Сложность — понятие субъективное, что одному сложно, то другому легко». Удивительным образом эта простая мысль для нас, студентов и аспирантов, оказывалась великолепным мотиватором: а вдруг именно для меня эта задача окажется легкой — надо попробовать!
Формализация понятия сложности в теоретической информатике всегда оставалась одним из главнейших научных интересов Юрия Ивановича. Создав теорию локальных алгоритмов вычисления информации в первой половине шестидесятых годов, он постоянно возвращался к проблематике теории сложности как в своих научных работах, так и в неформальном общении на конференциях и семинарах. Существует устоявшееся деление задач и алгоритмов по их сложности на полиномиальные и экспоненциальные. Но почему-то на практике случается так, что для многих задач, про которые математически доказано, что они являются экспоненциально сложными, удается изобретать алгоритмы, которые решают их намного быстрее, притом с приемлемой точностью. Часто это какие-то эвристики, догадки, приемы, опирающиеся на частные свойства конкретной задачи, не всегда поддающиеся строгому обоснованию. Юрий Иванович неоднократно нам говорил, что, по всей видимости, общепринятая теория сложности слишком груба, она не вполне удачно формализует само понятие сложности. За бортом остается тот факт, что задачи, реально встречающиеся на практике, на самом деле намного проще, чем они могли бы быть в худшем случае. Но ухватить это постоянно ускользающее интуитивное понимание, некую тонкую грань между простотой и сложностью реального мира, так и не удалось ни Юрию Ивановичу, ни его ученикам. Это одна из наиболее интригующих открытых проблем теоретической информатики.

— Как бы вы охарактеризовали основные научные достижения Юрия Ивановича, его место в мировой научной иерархии в науке об искусственном интеллекте? Если только можно говорить об искусственном интеллекте. Насколько я знаю, он эти слова не очень любил.

— Действительно, двадцать-тридцать лет назад искусственный интеллект и нейронные сети временно вышли из научной моды; этот период принято называть «зимой искусственного интеллекта». Были перегретые ожидания от этих технологий, за которыми последовало определенное разочарование. В то время все старались от этого дистанцироваться. Отдел Юрия Ивановича в Вычислительном центре РАН занимался распознаванием образов и машинным обучением, создавались новые математические теории и вычислительные методы, решались практические задачи.

magnifier.png Цикл работ был опубликован им в 1976‒1978 годах, но только в середине девяностых это направление стало основным мировым трендом в области машинного обучения и продержалось на этой позиции более десяти лет. То есть работы Юрия Ивановича опередили свое время примерно на полтора десятилетия

Научная школа Юрия Ивановича стала формироваться в конце шестидесятых годов. Тогда в мире еще мало кто этим занимался. Начиналось все с задач медицинской диагностики и разведки полезных ископаемых. Одна из историй, которую Юрий Иванович часто рассказывал в своих научно-популярных лекциях, связана с поиском на территории СССР месторождений золота редкого южноафриканского типа. Было шесть известных примеров таких месторождений и около десятка похожих мест, где золота не нашли. Каждое место характеризовалось более чем сотней числовых признаков, полученных в результате геологических наблюдений и измерений. Сейчас мы такие задачи называем классификацией по малой обучающей выборке. Но тогда подходов к таким задачам просто не существовало. Коллеги Юрия Ивановича по математическому цеху советовали отказаться от проекта. С точки зрения классической математики тех лет, статистики и теории аппроксимации функций задача была абсолютно гиблой, нерешаемой в принципе. Слишком мало точек по сравнению с высокой размерностью пространства признаков.

Тогда Юрию Ивановичу удалось изобрести алгоритм, основанный на попарном сравнении объектов, переборе признаковых подпространств низкой размерности и принципе голосования. Эти три эвристики были позже им объединены, обобщены и названы алгоритмами вычисления оценок, АВО. С помощью АВО позже были решены сотни задач в самых разных областях. История с поиском золота имела один очень поучительный методологический урок, о котором Юрий Иванович редко рассказывал в широкой аудитории, но делился с нами в личных беседах и на семинарах отдела. Сам факт того, что геологическая информация была преобразована к бинарному виду и сведена в одну единую таблицу всех признаков для всех объектов, сильно помог геологам заметить первые закономерности практически вручную, а затем обобщить эти наблюдения с помощью довольно простых эвристических алгоритмов. На этом этапе крайне важным был междисциплинарный диалог геологов, которые хорошо понимали природу данных, и математика, который вносил четкую структурированность в процесс анализа данных. Кстати, золото тогда действительно нашли, в двух местах на территории СССР, тех самых, которые предсказал алгоритм Журавлева.


ЮР ЖУРАВ.jpg
Юрий Иванович Журавлев
Wikipedia

Но самым важным открытием Юрия Ивановича в теории распознавания образов является, конечно, алгебраический подход к построению корректных алгоритмов. По сути, это теория композиций алгоритмов машинного обучения. Цикл работ был опубликован им в 1976‒1978 годах, но только в середине девяностых это направление стало основным мировым трендом в области машинного обучения и продержалось на этой позиции более десяти лет. То есть работы Юрия Ивановича опередили свое время примерно на полтора десятилетия. По другую сторону «железного занавеса» вопрос о возможности синтеза корректных алгоритмов обработки данных из некорректных базовых классификаторов был поставлен Кернсом и Валиантом лишь в 1988 году и положительно решен Фройндом и Шапиром в серии работ с 1990 по 1995 год.

— Я так понимаю, это был прорыв мирового уровня…

— Безусловно. Но здесь произошла интересная история. Алгебраический подход — это середина семидесятых годов. В те годы достижения советских ученых быстро переводились на английский язык, иногда воспроизводились, но широко писать о них на Западе было не принято. Мы даже знаем случаи явного плагиата, когда переводы наших работ выдавались за собственные. Затем, в середине девяностых, появились знаменитые методы — бустинг, бэггинг, стэкинг и другие техники ансамблирования. Тут как раз и надо было бы заняться международным научным пиаром и маркетингом, но у российской науки в те годы были совсем другие проблемы. С моего курса в науке осталось только несколько человек, все ушли создавать молодой российский бизнес, самые талантливые уехали за границу. Мое поколение было практически выбито из науки, нас меньше примерно раз в двадцать, чем могло бы быть.

magnifier.png Новые дочерние компании создаются под каждый успешный продукт, который выводится на рынок. Дочерних компаний уже пять на данный момент. Например, компания «Гудфокаст» занимается прогнозированием продаж и оптимизацией логистики для ритейла, компания «Антирутина» — подготовкой документов и анализом добросовестности госзакупок

— А все-таки в последние годы мир как-то обратил внимание на нашу школу, на личный вклад Юрия Ивановича?

— К сожалению, уже поздно. Наука анализа данных, машинного обучения, искусственного интеллекта очень быстро меняется. То, что в семидесятые и восьмидесятые делали Юрий Иванович и его ученики, оказалось на пике научной моды в девяностые и двухтысячные. Сейчас этим технологиям пришли на смену глубокие нейронные сети, которые способны решать задачи со сложно структурированными входными данными. Имеются в виду изображения, видео, сигналы, тексты, графы. Это совершенно другие технологии и полная смена парадигмы. Тот поезд уже ушел.

— Мы в этой новой парадигме заметны как наука и как практика?

— Да, стараемся. Но надо понимать, что у российской науки всего очень мало — людей, ресурсов, финансирования, заказов на исследования и разработки от государства и бизнеса. Только в последние годы ситуация стала выправляться, но эти процессы идут не быстро. Разреженность российской науки становится очевидна, когда приезжаешь на хорошую, хотя и не самую топовую международную научную конференцию вроде Multiple Classifier Systems — как раз по композиционным методам машинного обучения. Там примерно двести участников, которые давно друг друга знают и занимаются очень похожими исследованиями — узкой областью, составляющей не более пяти процентов от всего машинного обучения. По уровню и числу участников эта конференция примерно соответствует нашей всероссийской конференции «Математические методы распознавания образов», которую с 1983 года организовывал Юрий Иванович Журавлев и его ученики. На ней представлено практически все научное сообщество машинного обучения в России, мы тоже давно друг друга знаем, но занимаемся совершенно разными исследованиями. В то же время топовые международные конференции типа NIPS или ICML — это огромные сообщества, тысячи ученых со всего мира, которые в основном друг друга не знают. Но на этих конференциях нашу страну представляют считанные единицы.

magnifier.png Он много раз повторял: «Я за свою жизнь никогда никого не подвел». И требовал того же от каждого. Точнее, у каждого было что-то вроде «шагреневой кожи»: право на ошибку есть, но с каждым следующим разом задачи будут становиться менее значимыми, менее интересными, пока роль в коллективе не уравновесится с объемом принимаемой ответственности

— Вы уже сказали, что теория, разработанная Юрием Ивановичем, давала большие практические результаты. И он же уже в девяностые годы и сам занялся практической, даже коммерческой деятельностью. С его участием создано несколько компаний.

— Для внедрения технологических разработок научной школы Юрий Иванович, его ученик Константин Владимирович Рудаков и его ученики в 2000 году создали компанию «Форексис». Название расшифровывается как FORecasting and RECognition SYStems — системы распознавания и прогнозирования. Теперь «Форексис» — это группа компаний, самая известная из которых — «Антиплагиат». Новые дочерние компании создаются под каждый успешный продукт, который выводится на рынок. Дочерних компаний уже пять на данный момент. Например, компания «Гудфокаст» занимается прогнозированием продаж и оптимизацией логистики для ритейла, компания «Антирутина» — подготовкой документов и анализом добросовестности госзакупок.

— А исходная компания «Форексис» чем занимается?

— Определяет приоритетные прикладные задачи, ищет заказчиков, создает новые информационно-аналитические системы. За двадцать лет было много работ с банками по кредитному скорингу, с операторами сотовой связи по предсказанию оттока клиентов, с Московской биржей решали задачи финансового мониторинга торгов. Очень много проектов. Сейчас я иногда выступаю в роли консультанта и даже не обо всех проектах знаю.


ВОРОНЦОВ.jpg
Доктор физико-математических наук, профессор кафедры математических методов прогнозирования факультета вычислительной математики и кибернетики МГУ Константин Вячеславович Воронцов
ds.misis.ru

— Вы уже сказали о школе Журавлева. Это просто набор учеников или это все-таки, что называется, коллектив соратников?

— Пытаясь разгадать секрет организаторского таланта Юрия Ивановича, я сделал несколько наблюдений. Довольно разрозненных, ведь я не был непосредственным его учеником и мы не так уж много общались. Во-первых, это его удивительная способность концентрировать вокруг себя талантливых людей. Очень многих он поддерживал, кому-то помогал с работой в Москве, кому-то — защитить диссертацию, получить интересную работу, завести связи, начать карьеру. Есть десятки людей, а может быть, и сотни, благодарных Юрию Ивановичу за ту роль, которую он сыграл в их судьбе. Я неоднократно слышал от него высказывания вроде «Он очень талантливый математик, но, к сожалению, живет в какой-то дыре, его непременно надо пригласить к нам». Ничего общего с кумовством, он ценил в людях именно талант и помогал своим административным ресурсом. Кажется, что он не подбирал людей специально под себя или друг под друга. Это был коллектив ярких индивидуальностей, со своими достоинствами и недостатками, каждый с какой-то своей «суперзадачей» и «суперспособностью». Всегда была здоровая рабочая атмосфера, без дрязг, обид, выяснения отношений. Но при этом приоритеты и обязанности устанавливались довольно жестко. Он много раз повторял: «Я за свою жизнь никогда никого не подвел». И требовал того же от каждого. Точнее, у каждого было что-то вроде «шагреневой кожи»: право на ошибку есть, но с каждым следующим разом задачи будут становиться менее значимыми, менее интересными, пока роль в коллективе не уравновесится с объемом принимаемой ответственности.
Еще по теме:
27.09.2022
В Москве прошел ежегодный международный форум ЦОД-2022 — главное событие года для тех, кто проектирует, строит и эксплуа...
13.09.2022
Сотрудники биологического факультета МГУ создали первую полную электростатическую карту поверхности SARS-CoV-2. Она пока...
12.09.2022
Российские ученые работают над отечественной платформенной технологией для комбинированной радиотерапии онкологических з...
06.09.2022
Ледостойкая самоходная платформа «Северный полюс» пришла на смену дрейфующим полярным станциям. Задачи у полярников оста...
Наверх