Наука и технологии 9 августа 2019

Обучаться на прецедентах

Академик Константин Рудаков уверен, что в области искусственного интеллекта Россия находится на вполне конкурентных позициях, прежде всего благодаря сильной математической школе. Нужно только правильно использовать этот задел

Академик РАН, заместитель директора Федерального исследовательского центра «Информатика и управление» РАН, заведующий кафедрой «Интеллектуальные системы» Московского физико-технического института Константин Рудаков

Дмитрий Лыков

Тема искусственного интеллекта (ИИ), и без того популярная, приобрела в России государственное значение после выступления президента на совещании по стратегии развития технологий в области ИИ, которая разрабатывалась Сбербанком при участии правительства. Именно тогда Владимир Путин сказал: тот, кто сможет обеспечить монополию в сфере искусственного интеллекта, станет властелином мира.

Наш журнал уже откликался на эту тему публикацией статьи известного историка науки и техники Николая Симонова «Три волны ИИ» и многочисленными сообщениями о достижениях российских и мировых компаний в этой области. Мы продолжаем публикации на эту тему.

Надо отметить, что среди специалистов тот факт, что заниматься искусственным интеллектом в стране поручили Сбербанку, вызвал некоторое недоумение, поскольку и в СССР, и в России проблемами ИИ на высоком теоретическом уровне занимается большая группа выдающихся математиков, не пренебрегающих к тому же получением серьезных практических результатов. Один из них — академик РАН, заместитель директора Федерального исследовательского центра «Информатика и управление» РАН, заведующий кафедрой «Интеллектуальные системы» Московского физико-технического института Константин Рудаков, который известен не только своими высокими математическими достижениями, но и практическими разработками — в частности, он один из авторов известной программы «Антиплагиат».

Беседу с Константином Владимировичем мы начали с вопроса: что такое искусственный интеллект с точки зрения математика?

— Человек, любое животное, кто угодно постоянно решают задачи. Скажем, я смотрю на вас и сразу делаю вывод: вы мужчина. Я решил задачу классификации. И мы их решаем все время. Как? Я что, делал модель мужчины в явном виде? Нет, конечно. Это результат обучения на прецедентах.

И искусственный интеллект — это машинное решение подобных задач. Это высокое начальство можно обманывать и говорить, что искусственный интеллект — это главное, что теперь определяет прогресс человечества на все грядущие времена. А искусственный интеллект — это просто обучение на прецедентах. А прецедент — это когда есть вход и правильный выход. Я называю это «неклассические задачи экстраполяции». Именно этой областью я всю жизнь занимаюсь как математик.

Искусственный интеллект — это просто обучение на прецедентах. А прецедент — когда есть вход и правильный выход. Я называю это «неклассические задачи экстраполяции». Именно этой областью я всю жизнь занимаюсь как математик

И в том, чем мы занимаемся, огромное количество вещей сводится к задачам классификации и кластеризации. Кластеризация — это разбиение множества на подмножества, классификация — это тот случай кластеризации, когда вы знаете «названия» или содержательную интерпретацию подмножеств.

Когда приходится говорить популярно, я спрашиваю: что такое болезнь с нашей точки зрения, в нашей школе единомышленников? Болезнь — это дихотомия человечества. Все человечество делится на два подмножества: у одних есть эта болезнь, у других — нет. Вот это и есть болезнь. А дальше смотрим, что мы знаем об объектах и чем они различаются. То есть потом диагностика: определяем, в каком из подмножеств находится данный объект. Вот что такое задача классификации.

Классификация — это обучение, когда есть прецеденты, когда есть некий набор объектов, про которые известно: эти принадлежат к классу, эти не принадлежат. Постановка примитивная, но далее, естественно, возникает очень много интереснейших и во многом сложных постановок. Собственно говоря, это то, что теперь модно называть machine learning.

Задачи кластеризации несколько иные. Теперь они называются, скорее, data mining. Понятие это появилось не так давно. Это можно перевести как «раскапывание данных». Красиво звучит, но что это значит? Это значит попробовать найти в данных что-нибудь, что не случайно. Или найти, придумать приличную метрику. Например, есть ли там закономерности: в каком смысле то, что мы наблюдаем, неслучайно или имеет отношение к тому, что нас интересует.

Отдельно — исследование причинно-следственных связей. Это очень хорошо у нас представлено в Федеральном исследовательском центре «Информатика и управление» Российской академии наук школой Виктора Финна. Это различного рода импликации, которые можно наблюдать. То есть речь идет о тех же самых задачах установления зависимости, но в виде интерпретируемых логических закономерностей.

В 1973–1974 году Журавлев сказал мне: «Костя, а вы знаете, надо бы позаниматься распознаванием образов. Не берите в голову, что название паршивое»

Дмитрий Лыков

— А какие области чистой математики здесь используются?

— Вы знаете, многие. Даже теория категорий. Теория функций. Естественно, дискретный анализ, математическая логика. Вероятность и статистика.

Я еще с 1971 года занимался у моего учителя Юрия Ивановича Журавлева дискретной математикой: это проблема Дедекинда, подсчет количества монотонных функций алгебры логики — чистая дискретная математика, интересные красивые задачи. Но уже где-то, наверное, в 1973–1974 году Журавлев сказал мне: «Костя, а вы знаете, надо бы позаниматься распознаванием образов. Не берите в голову, что название паршивое». И уже были книжки про искусственный интеллект и обучение машин нескольких иностранных авторов. Хотя все это на фоне фактически классической комбинаторной математики смотрелось как какое-то занятие второго сорта. Но потом выяснилось, что, в принципе, это все интересно и за этим может стоять довольно приличная математика. Та самая теория категорий, на которой описываются дополнительные к прецедентным ограничения наших задач. Ничего особенного в этом нет, вполне себе понятные штуки.

Если не с 1950-х, то с годов с 1970-х точно распознавание образов и обучение машин — это вещи достаточно понятные и известные. За этим стоит иногда хорошая, иногда довольно примитивная математика, но ничего таинственного в этом нет

А ведь на самом деле то, что сегодня слышно везде: искусственный интеллект, machine learning, — известно довольно давно.

И действительно, если не с 1950-х, то с годов с 1970-х точно распознавание образов и обучение машин — вещи достаточно понятные и известные. За этим стоит иногда хорошая, иногда довольно примитивная математика, но ничего таинственного в этом нет.

Почему мне интересна та математика, которой приходится заниматься, решая проблемы искусственного интеллекта? У нас в РАН есть Отделение математических наук. Там две части: прикладная математика и информатика — и чистая математика. А в чем отличие? Я бы сказал, в мотивах постановки задач.

Это легко понять на таком примере. В чистой математике триста лет стояла задача доказать теорему Ферма. Доказали. Великий результат.

Прикладная математика — это когда вы, ставя задачу, по крайней мере на уровне мысленного эксперимента, как у Эйнштейна, говорите: «А это наверняка будет нужно во внешнем по отношению к математике мире». И это мне интересно.

Внутри прикладной математики есть, опять-таки, то, что называется «системное программирование», то есть комплекс программ, которые обеспечивают управление компонентами компьютерной системы. Без этого ничего работать не будет.

А есть еще матмоделирование. Именно оно стимулировало развитие всей математики. Но сделать хорошую работающую модель очень трудно. Например, уравнения Навье—Стокса — это, если хотите, модель, описывающая движение тел в вязкой среде. Это пятнадцать уравнений, очень трудно считается.

Или простейший пример. Ответьте на вопрос: как зависит тормозной путь от скорости автомобиля? Если, скажем, скорость возросла на десять процентов, насколько возрастет тормозной путь?

— На 21 процент?

— Правильно. 11² = 121. Потому что тормозной путь зависит от набранной автомобилем кинетической энергии, а она зависит от квадрата скорости: mv²/2. Но, если вы начнете проводить эксперименты, результаты будут другие. Возникают эффекты второго порядка. Например, влияние сцепления.

То есть простейшая модель дает качественную картину, но возникают поправки. А если их учесть, потребуется написать уже дикую систему уравнений, которую вы не сможете решить.

Но меня так учили, что математика пытается максимально упростить то явление, с которым мы имеем дело. Не усложнять его, а, чтобы понять, упрощать.

Но что мне дико не нравится сейчас…

— Использование математических терминов не по делу?

— Это само собой. Но, конечно, то, что сейчас каждый день по любому каналу, из любого утюга слышно: «Искусственный интеллект, большие данные». К сожалению, очень многое в наше время опошляется. Я недавно видел книжку некоего Родригеса про «верховный алгоритм». Какое счастье, что она не была написана в 1970-е годы! Если бы я ее тогда прочитал, я бы ни за что не стал этим заниматься. Просто неприлично заниматься «верховными алгоритмами» как панацеей для решения всех задач. Как только говорят, что есть нечто, что решает все задачи, дальше можно не слушать. Это к Господу Богу — это, пожалуйста, но это уже не ко мне.

Но самое главное, что мне не нравится, — дикая востребованность тех, кто еще ничему не научился, но уже считает себя специалистом.

Я недавно видел книжку некоего Родригеса про «верховный алгоритм». Какое счастье, что она не была написана в 1970-е годы! Если бы я ее тогда прочитал, я бы ни за что не стал этим заниматься. Просто неприлично заниматься «верховными алгоритмами» как панацеей для решения всех задач

И это не только у нас. Один из моих учеников — Денис Зорин, декан факультета прикладной математики и информатики в Нью-Йоркском университете при Институте Куранта. Он один из лучших математиков Штатов. Для справки: Институт Куранта — это аналог МИАНа (Математический институт имени В. А. Стеклова РАН. — «Стимул»), он выше, чем MIT, в математике. Он рассказывает, что у него проблема: студенты слишком рано и слишком много могут зарабатывать. Как недоучившиеся математики. И в этом вся беда. А они говорят: «Я специалист по анализу данных».

Сейчас много бегает людей, я их называю продавцами пылесосов, которые знают Python (высокоуровневый язык программирования общего назначения, ориентированный на повышение производительности разработчика и читаемости кода. — «Стимул»), в котором есть отдельные программные блоки, они их компонуют и пытаются эти самоделки выдать за искусственный интеллект. Они не понимают, как устроены эти блоки, они не понимает, что за этим стоит. И называют это искусственным интеллектом.

В искусственном интеллекте действительно важнейшая вещь — большие данные, но для реальных задач нужно минимальное, но достаточное количество информации. Это я как руководитель центра по большим данным говорю: вы сначала поставьте задачу, потом определите, сколько вам нужно данных для надлежащего качества и надежности, и ни одного байта больше не пишите. Я в свое время, будучи за границей, сказал, что за каждый байт, который записан, но никогда не использован, надо вычитать из зарплаты.

— И как там к этому отнеслись?

— Да там тоже полно продавцов пылесосов.

— А какова цель науки анализа данных?

— Это построение алгоритмов, реализующих машинный анализ данных. И это в сто раз важнее, чем просто программирование, потому что программирование — это уже реализация алгоритмов на каком-то формальном языке.

А еще более важная вещь, на самом деле сейчас самая главная, — это даже не написание алгоритма, это искусство увидеть и правильно поставить прикладную задачу. Вот это гораздо важнее, вот чего не хватает, и вот где мы можем реально быть впереди.

— А есть понимание, что может искусственный интеллект и чего не может? Например, сможет доказать теорему Пуанкаре, над которой бились поколения математиков, или какую-то другую? Или это ни о чем не говорит?

— Думаю, что ни о чем особенно не говорит. Кстати, с этого искусственный интеллект начинался уже лет шестьдесят назад.

Как доказывается теорема? Очень просто: вы доказываете, что верно A и что из А следует В и, значит, доказано В. Утверждение А называется аксиомой.

Я «детей» шокирую, когда говорю: «Система аксиом — это эвристика». Вы же их принимаете на веру. Это эвристика. Их можно проверить — это уже из разряда математической логики — на непротиворечивость и полноту.

Понимаете, доказательство теорем — это лучшая в мире игрушка. Скажем, поиском по дереву с помощью modus ponens можно набрести на результат. Это можно назвать отдельным видом спорта…

— То есть это не говорит о силе искусственного интеллекта?

— Игра в шахматы — высокоинтеллектуальное занятие или нет? В некотором смысле — да. Но это просто переборная задача. Там чудовищный перебор. Не надо только врать, что там полный перебор, этого не бывает. Здесь идет перебор очень формальных, легко описываемых вариантов. Врач, решая задачу диагностики в сложном случае, решает гораздо более сложные задачи.

— А как определить уровень искусственного интеллекта?

— Для меня уровень интеллекта — это там, где задача не совсем просто решается. И не очень понятно, как устроен алгоритм, связь между входом и выходом — нетривиальная.

«Я сейчас звонил в Сбербанк, отвечает говорилка. По-моему, неплохо работает. Какие тут задачки надо решить? Одна задача — перевести то, что я говорю вслух, звук, в текст. Называйте это искусственным интеллектом, если хотите»

Дмитрий Лыков

— А роботы, которые отвечают на вопросы и вроде бы понимают смысл сказанного, — это…

— Слово «смысл» не очень люблю. Это говорилки. Я сейчас звонил в Сбербанк, отвечает говорилка. По-моему, неплохо работает. Какие тут задачки надо решить? Одна задача — перевести то, что я говорю вслух, звук, в текст. Называйте это искусственным интеллектом, если хотите. У нас в России существует очень хорошая команда — Центр речевых технологий. Потом нужно решить главную задачу: моей реплике сопоставить ответную реплику «робота» из имеющейся библиотеки. Потом (это сравнительно легко) нужно «озвучить» ответную реплику, скажем, приятным женским голосом. Как решать «главную задачу»? Скажем, студент моей кафедры проанализировал где-то 200 тысяч бесед в реальном колл-центре одного из крупных банков. Была поставлена задача разбить эти разговоры на фрагменты, которые соответствуют тому, что можно понимать как «темы». Выяснилось, что там 99 процентов фрагментов — это всего около сорока тем. Так что в этом случае «смысл», или «тема», — это подмножество фрагментов разговоров. Если они адекватно определены, значит, мы можем сузить поиск правильных ответных реплик. При этом мы знаем реальные ответные реплики «живых операторов», так что возникает обучение на прецедентах.

Смысл вообще вещь таинственная. Для меня все делится либо на кластеры, либо на классы. Так работает математика. У нее же только нули и единицы.

— А то, что в Москве будто бы с помощью искусственного интеллекта тридцать преступников задержали?

— Может быть. Благодаря чему, не знаю, но, может быть, тридцать и задержали. Притом что их мимо прошло три тысячи, а арестовано было пять тысяч. Да, верю. Но вам же не скажут, сколько было ложных тревог. Не скажут, сколько пропусков цели, этого вообще никто не знает. А сколько у вас полицейский с хорошей памятью задерживает? И сколько это стоит по сравнению с миллиардами, которые вложены в эту систему?

Amazon — солидная компания. Сделали распознавалку лиц, но, когда они запустили ее в американском Конгрессе, у них треть темнокожих конгрессменов была записана в преступники.

Еще более важная вещь, на самом деле сейчас самая главная, — это даже не написание алгоритма, это искусство увидеть и правильно поставить прикладную задачу. Вот это гораздо важнее, вот чего не хватает, и вот где мы можем реально быть впереди

— Как бы вы определили место России в пространстве мирового искусственного интеллекта?

— Часто звучит такой бред: «Мы отстали на десять или двадцать лет». При этом те же люди говорят: «Каждые три года в этой области происходят существенные изменения». Это означает, что больше, чем на три года, нельзя отстать, если вы не идиоты. Ведь если я начну этим заниматься, то я буду начинать с того уровня, который есть сегодня, а не со вчерашнего. Это принципиальная вещь, тем более что все время идет обмен знаниями. Так что общий уровень работ в мире примерно одинаковый.

У нас, кроме того, принимаются специальные меры по развитию этого направления: в НТИ — Национальной технологической инициативе — создано два центра компетенций: искусственного интеллекта на Физтехе и больших данных в МГУ. Я сделал общий координационный совет, потому что я научный руководитель в университете и на Физтехе —Александр Повалко, который руководит РВК, отвечающей за НТИ, и Михаил Котюков, который отвечает за науку, подходят к искусственному интеллекту как к коммерческому проекту и от НИРов требуют быстрой «коммерциализации». А я говорю: «Тогда давайте называйте “Национальная коммерческая инициатива”, а не технологическая».

А недавно подписали какие-то соглашения, что у нас главный по искусственному интеллекту — Сбербанк. Так вот можете меня цитировать: я считаю, что если главный по искусственному интеллекту — Сбербанк, то главной по кредитам должна быть Академия наук.

Я бы, напротив, обязал хотя бы наши компании с государственным участием, которые занимаются внедрением искусственного интеллекта, на хорошей платной основе проходить экспертизу в институтах Академии наук, в ведущих вузах.

— Сейчас вроде бы Академия наук стала главным экспертным органом страны…

— Так надо это реализовывать. Греф — прекрасный менеджер, но при чем тут искусственный интеллект? Или почему РЖД отвечает за квантовые коммуникации? Они-то здесь при чем?

Но если отвечать на ваш вопрос, то в плане бизнеса, на мой взгляд, у нас есть отставание, а в плане науки абсолютно мировой уровень с предпосылками к очень хорошему опережению, если растить людей, которые будут правильно видеть задачи, понимать, какой алгоритмический инструментарий под них есть и какой новый можно и нужно сделать.

В плане бизнеса, на мой взгляд, у нас есть отставание, а в плане науки абсолютно мировой уровень с предпосылками к очень хорошему опережению, если растить людей, которые будут правильно видеть задачи, понимать, какой алгоритмический инструментарий под них есть и какой новый можно и нужно сделать

На мой взгляд, чтобы у нас было конкурентное преимущество, нужно в первую очередь поддерживать классическое математическое образование.

А в области образования сейчас идет давление внешней среды — очень серьезное и в очень плохую сторону, о котором я уже сказал. В области математики было бы гораздо лучше, если бы бизнес не сманивал людей из математики со страшной силой. Главный наш задел в том, что уже есть люди, и могут быть выращены новые, и они предрасположены к этому. Не надо их соблазнами увлекать: «Сразу идите работать».

Я говорю своим студентам: «Поймите, если вы за полгода чему-то научились и пошли на этом деньги зарабатывать, вы рискуете, во-первых, остаться на этом уровне, а во-вторых, учтите, что через полгода появится другой мальчик, который будет просто в два раза дешевле на рынке труда, чем вы. И всё. В конкурентной среде вы не выживете с тем, что вы легко сделали общеизвестным способом. А дальше вы стоить будете те же самые 26 копеек. Решающая вещь и для страны, и для каждого студента — фундаментальное образование, научная школа.

На Западе искусственным интеллектом занимаются в основном инженеры. Там математиков в этой области почти не было. Поэтому у них гораздо слабее понимание этого. Инженеры — полезные люди, но в этом деле они должны идти после математиков.

Темы: Наука и технологии