Наука и технологии 16 Сентября 2019

Чертова дюжина идеального интеллекта. Беседа вторая

Искусственный интеллект может обеспечить новое качество интеллектуальной работы и дать реальные практические результаты, только опираясь одновременно на фундаментальные исследования, которые позволяют развивать основания ИИ, и на глубокие знания в предметных областях
Чертова дюжина идеального интеллекта. Беседа вторая
Заведующий отделом интеллектуального анализа данных и автоматизированной поддержки научных исследований ФИЦ «Информатика и управление» РАН, доктор физико-математических наук Михаил Забежайло (слева) и В.Финн
Дмитрий Лыков

Первую часть нашей беседы Виктор Финн, главный научный сотрудник ФИЦ «Информатика и управление» РАН, доктор технических наук, закончил следующим соображением: «Прежде чем применять те или иные методы и, соответственно, реализующие их компьютерные системы, вы должны понять, с какими предметными областями вы имеете дело, какова особенность предметной области. Их три. Во-первых, это может быть мир случайных событий. Тогда вы применяете методы теории вероятностей и математическую статистику… Второй тип предметной области — это наличие детерминации, наличие отношений причинности среди событий… И третья — это комбинация первых двух, когда есть одновременно и детерминация, и случайные флуктуации. Понятно, что это более общая область, ее тоже надо развивать, без ее развития мы многие задачи просто не сможем решить».

Во второй части нашего разговора принял участие заведующий отделом интеллектуального анализа данных и автоматизированной поддержки научных исследований ФИЦ «Информатика и управление» РАН, доктор физико-математических наук Михаил Забежайло.

 

Михаил Забежайло: По каждому из обстоятельств, которые сформулированы, можно перекинуть мостики к современным технологиям и технологическим решениям. И тогда ясен целый ряд проблем, которые там возникают. Например, Deep learning где-то работает (давая приемлемые прикладные результаты), а где-то не пойми как работает. А имея дело с применением методов и систем искусственного интеллекта, вы обратите внимание на то, какой язык использовался, на метод, который выражается в языке, описывает ли он все возможности предметной области, есть ли аргументационные возможности у метода, чтобы отделить то, что верно, от того, что неверно. И именно из такого подхода можно получить не догму, а «руководство к действию», как учили нас в свое время.

Михаил Забежайло окончил МФТИ (факультет управления и прикладной математики, диплом с отличием) и очную аспирантуру МФТИ. Область интересов — искусственный интеллект, интеллектуальный анализ данных и машинное обучение, компьютерные модели рассуждений в анализе данных и принятии решений, приложения интеллектуального анализа данных в индустрии и научных исследованиях.

Работал в ВИНИТИ РАН, Siemens AG, Газпромбанке, SAP AG. В настоящее время работает в ФИЦ «Информатика и управление» РАН.

Преподает в МФТИ и МГИМО.

Виктор Финн: Михаил Иванович это хорошо объяснил. Мы приходим к одному важному практическому выводу, который прямо противоположен тому, что сейчас провозглашается в виде догмата: если мы хотим получить новое знание, то мы не можем ограничиться имеющимся у нас наличным массивом, мы должны иметь возможность его расширять.

— То есть возможность получения дополнительных данных?

В. Ф.: Возможность расширять, причем не всегда случайно. В этом постулате нам важно то, что мы в состоянии порождать устойчивое знание, то есть раскрывать эмпирические закономерности в данных. Это важно и для предсказаний, это важно и для анализа ситуаций. Если вы не можете обнаружить эмпирические закономерности, ваши знания сомнительны.

Важное качество, которое характеризует как раз уже искусственный интеллект, — несингулярная оценка наших высказываний. Нельзя считать, что мы можем одним числом или просто утверждением истинности и ложности оценить наши результаты. Результаты нашего исследования оцениваются некоторой шкалой. В этой шкале есть оценка типа рассуждения, наличие закономерностей, в которые входит ваше высказывание, и еще ряд характеристик.

И наконец, проблематика искусственного интеллекта напрямую связана с решением нескольких проблем — это так называемые проблемы индукции. Это фундаментальная проблема научного познания: на основании чего мы принимаем наши результаты? Ведь повторение, как говорил Юм и потом развил Поппер, не может служить основанием для принятия высказывания: а вдруг при следующем эксперименте будет не так? Поэтому на основании этого скептического отношения некоторые люди потом считали, что индукция не может быть принципом принятия высказывания. И тогда возникает вопрос: как обосновать наши знания?

— И каков будет ответ?

В. Ф.: Мы должны иметь такой инструмент наблюдения за расширением нашего знания, что при каждом новом расширении параметры оценивания результата не должны ухудшаться. После всего сказанного ясно, что проблематика искусственного интеллекта не может развиваться как технология без учета и решения этих проблем.

Это, собственно, то, что мы пытались делать в течение долгого времени в нашем подразделении. Мы создали метод, который, как нам кажется, решает вопросы индукции — получение на основе распознавания сходств, предсказание с помощью аналогий, принятие высказываний с помощью объяснения исходных данных. Мы назвали это ДСМ-метод автоматизированной поддержки исследований, поскольку проблема индукции была сформулирована в некотором четком виде Джоном Стюартом Миллем — ДСМ. И так называемые правила Милля мы превратили в компьютерные программы и решали разные задачи, относящиеся к медицине, социологии и прочему.

magnifier.png Если мы хотим получить новое знание, то мы не можем ограничиться имеющимся у нас наличным массивом, мы должны иметь возможность его расширять

И, в частности, одним из следствий развития искусственного интеллекта является решение проблемы Генриха Риккерта — представителя неокантианцев, последователей Канта. Его основная идея состояла в том, что знание в науках о культуре, куда относятся все гуманитарные и социальные науки, индивидуально, он называл его «идеографическое знание», а знание в науках о природе — номотетическое, там можно сформулировать законы. А в гуманитарной и социальной области законы сформулировать нельзя, потому что они сугубо индивидуальны. Это заблуждение Риккерта было связано с тем, что тогда не было понятно, что такое логика: аристотелевская логика была очень простой, и не было возможностей для обработки больших массивов данных, которые возникли сейчас. Поэтому проблема Риккерта о непроходимой границе между гуманитарным, социальным знанием и знанием о природе сейчас решается в положительном смысле. Действительно, логика современных рассуждений, компьютерные программы и известные методы искусственного интеллекта, например деревья решений, дают возможность решать конкретные задачи из области гуманитарных и социальных наук.

— А не могли бы вы привести пример такого решения?

В.Ф.: Да, конечно. Был такой замечательный социолог Владимир Александрович Ядов — один из создателей отечественной социологии. Мы работали вместе с ним, и у нас было две системы, использующие синтез познавательных процедур (индукция, аналогия, абдукция). Первая наша работа была связана с предсказанием забастовок на промышленных предприятиях. На основании наших методов мы это сделали на двух промышленных предприятиях — одно в Ельце, другое в Санкт-Петербурге. И потом, когда верифицировали наши результаты, оказалось, что это были разумные предсказания. Потом была работа по анализу трудовых отношений на промышленных предприятиях в авиационной промышленности. Использовали наши методы и для предсказания электорального поведения студентов Российского государственного гуманитарного университета.

magnifier.png Проблематика искусственного интеллекта напрямую связана с решением нескольких проблем — это так называемые проблемы индукции. Это фундаментальная проблема научного познания: на основании чего мы принимаем наши результаты? Ведь повторение, как говорил Юм и потом развил Поппер, не может служить основанием для принятия высказывания: а вдруг при следующем эксперименте будет не так? И тогда возникает вопрос: как обосновать наши знания?

И в медицине тоже у нас много было результатов. Есть такое заболевание поджелудочной железы — хронический панкреатит, и он иногда провоцирует сахарный диабет. Требуется на основании имеющихся медицинских знаний и данных предсказать, когда будет развиваться сахарный диабет, а когда не будет. Такую систему мы сделали. Более того, ее модифицировали, и теперь она в состоянии предсказывать, будет ли у больных хроническим панкреатитом развиваться рак поджелудочной железы.

А наша сотрудница Светлана Гусакова с помощью нашего подхода к интеллектуальному анализу данных воспроизвела часть результатов академиков Андрея Анатольевичв Зализняка и Валентина Лаврентьевича Янина по датировке новгородских грамот на основании их базы фактов, и это продемонстрировало, что система может делать то же, что делает весьма квалифицированный человек.

М. З.: И интересно, что, если бы современным нейронным сеткам предложили сделать эту датировку, они бы не сделали это. Потому, в частности, что они не умеют надежно работать с ограниченными данными.

В. Ф.: Это очень важно, потому что человек принимает решение часто на основании небольшого набора данных.

ЗАБЕЖАЙЛО1.png
Михаил Забежайло
Дмитрий Лыков

М. З.: Хочу сделать акцент на том, что одно дело стратегии, дорожные карты и другое, а совершенно другое — то, о чем только что сказал Виктор Константинович. Есть такое уникальное место — НИИ имени Бурденко. Ведущий национальный центр, гениальные люди, фантастическая аппаратура. Тем не менее при внимательном анализе оказывается, что их сегодняшнюю жизнь можно было бы существенно облегчить, если бы они могли собирать базы опытных данных, этот опыт аккумулировать, соединять эти данные с исследовательским анализом. Так, к примеру, по псевдопрогрессии опухоли мозга за пятнадцать лет у них прошло чуть больше 400 пациентов, у которых примерно по 200 признакам собирались данные (значения соответствующих показателей). Но если там нет, например, генных данных, нет данных о белковой структуре крови и так далее, то провести полноценный причинный анализ возникновения псевдопрогрессии, к сожалению, невозможно. А ведь такие данные можно было бы сегодня уже включить в исследования (в компьютерную обработку средствами интеллектуальных систем) и сделать более точным прогноз в каждом конкретном случае: это псевдопрогрессия или же это действительно опухоль и надо оперативно вмешиваться. Если псевдопрогрессия — не трогай, а если требует вмешательства, то вмешивайся на ранних стадиях. И это давало бы сегодня, завтра, послезавтра еще более значимый реальный результат.

А сожаление по поводу программы Сбербанка (см. первую часть беседы. — «Стимул») такого характера: серьезные люди стояли у основания, им нужно управлять финансовыми потоками (генерируемыми уже сегодня в рассматриваемой области исследований и разработок), но, стремясь к обобщению, они, к сожалению, выплеснули решения значительного числа тех конкретных задач, которые можно решить уже сегодня, если соединить то оригинальное и перспективное, что есть в исследованиях, с потребностями реальной практики. Полагаю, что более надежный путь — не стремиться сделать обобщение сразу же, а опираться на существующие юзкейсы и развивать то, что получается, и тогда многое можно было бы сделать быстро.

— И какие выводы мы можем сделать на основании сказанного?

В. Ф.: Первый вывод: искусственный интеллект — это реализация идей и методов точной эпистемологии, получение новых знаний из данных, и это технологическая реализация, которая напрямую зависит от системы понятий, методов и идей получения новых знаний. Это надо развивать, поэтому разговоры о том, что мы будем развивать технологии и между прочим фундаментальные исследования, — это большое заблуждение. И это вводит в заблуждение государственных деятелей, которые хотят развивать искусственный интеллект. Так он не будет развиваться. Развития не может быть за счет усовершенствования технологий, развитие может быть за счет усовершенствования методов. Академик Ландау когда-то сформулировал замечательную мысль, он говорил: метод важнее результата. Если у вас есть правильный метод, вы результат точно получите, а если вы будете технологически что-то делать и только усовершенствовать, новых методов и новых результатов у вас не будет.

magnifier.png Искусственный интеллект — это реализация идей и методов точной эпистемологии, получение новых знаний из данных, и это технологическая реализация, которая напрямую зависит от системы понятий, методов и идей получения новых знаний. Это надо развивать, поэтому разговоры о том, что мы будем развивать технологии и между прочим фундаментальные исследования, — это большое заблуждение

Надо понять, что есть два принципа: «знание — выгода» и «знание — сила». Если «знание — сила» — это одно, «знание — выгода» — другое. Если мы сразу хотим коммерциализировать что-то и сразу иметь приложение, развития не будет.

Поэтому вывод очень простой: не считайте, что можно по остаточному принципу поддерживать научные исследования. Это научные исследования должны вам говорить: ваши практические задачи можно решать такими методами, и для того, чтобы решать еще более сложные задачи, надо развивать эти методы в дальнейшем. Это не означает, что практические приложения сами не становятся в некотором смысле инициативой и предметом для развития, эта обратная связь тоже имеет место. Но, таким образом, это некое взаимодействие: с одной стороны, теория, которая идет впереди, затем практика, которая дает новые проблемы и новые задачи, и тогда за счет этого взаимодействия происходит развитие этой области.

— Если говорить о программе Грефа, то, с одной стороны, ей не хватает высоты полета, то есть теоретической основательности, а с другой — не хватает и приземленности?

В. Ф.: Конечно, и того и другого. Совершенно точно вы сказали.

М. З.: Судя по всему, ее целеполаганием было построить некоторый механизм управления складывающимися в этой области финансовыми потоками. Да, он построен. А что будет в качестве реально осязаемого «выхлопа», еще нужно выяснять.

И в ней, к сожалению, присутствует явный логический порочный круг. При оценке направлений перспективные исследования объявляются не очень интересными с точки зрения коммерции, потому что они не развиты, но в них не нужно давать денег, потому что они не развиты.

Кроме того, когда мы обсуждаем ситуацию в этой области внутри страны, то полезно не только соотнестись с тем, что есть у других, но еще и полезно заняться уточнением: а наше-то позиционирование в чем?

— Я, кстати, тоже хотел спросить, где мы находимся.

М. З.: Хороший вопрос, но я сейчас немножко не про него. Посмотрите, Соединенные Штаты, Китай и Европа. Европу мы уже перестали видеть в этой области. За исключением англичан. Кстати, у англичан, если вам интересна в целом эта проблема, конфигурация, очень похожая на нашу. Там во главе серьезного исследовательского сообщества стоит банк Barclays, но вокруг него есть экосистема — так называемые Eagle Labs — примерно четыре тысячи маленьких и средних исследовательских лабораторий, а Barclays выступает в качестве модератора этого сообщества: ставит цели, собирает участников экосистемы несколько раз в год, поддерживает их взаимодействие между собой так, чтобы обеспечить научную коммуникацию, чтобы большое сообщество, с разных сторон глядя на эту проблему, маленькими, гибкими группками могло наметить пути и определить, что проходимо, что непроходимо, какие ресурсы необходимы и так далее.

Китай же, рассматривая все технологические и даже политические цели в рассматриваемой области, при этом везде говорит о базовых теориях, фундаментальных исследованиях, ведущих к существенным сдвигам, смене парадигмы в развитии. То есть о развитии фундаментальных исследований, ориентированных на практически значимые разработки. У нас же, например, на обсуждении в Сбере в конце июня, которое проводил президент страны, говорилось о некоторых конкретных вещах, но непонятно: а почему мы думаем, что именно эти технологические разработки будут чемпионскими? Мы ведь хотим, чтобы они были конкурентоспособными на мировом уровне, и не только в смысле обороны (мы от этого зависим просто), но и в той же самой медицине, создании новых материалов и многом другом. Если мы хотим, чтобы эти технологии были конкурентоспособными, возникает вопрос: а какие ноу-хау в их основе лежат? Как мы собираемся формировать и развивать эти ноу-хау?

— И каков ваш вывод?

М. З.: Мои прогнозы в значительной мере неоптимистичны: если сейчас сильные мира сего не поймут, за счет чего на самом деле можно развиваться в обсуждаемой области, ничего действительно прорывного не будет. А будет неэффективная трата денег, а потом, наверное, кому-то придется за это отвечать (хотели как лучше, а получилось…).

Тем не менее многое полезное все-таки можно сделать, потому что ни про американцев, ни про китайцев нельзя сказать, что они находятся на абсолютно правильном пути. Их тоже захлестнули успехи технологий. И поэтому нам надо развивать то главное, о чем мы говорили, — то, в чем мы на данный момент имеем конкурентные преимущества (в том числе это интеллектуальные системы, о которых говорил Виктор Константинович, а не системы, применяющие отдельные методы). И, соответственно, важные приложения будут и в медицине, и в социальной сфере. И в управлении. И вот на этом надо было бы сосредоточиться.

magnifier.png Если поддерживать своих специалистов в части возможностей, которые уже есть, состыковать их с системой образования, для которой примером может быть система Физтеха, когда студенты могут принимать участие в реальной исследовательской работе, мы можем достичь серьезных результатов, по крайней мере в ряде конкретных значимых задач

Поэтому не следует плестись в хвосте у западных людей, потому что, хотя сейчас они за счет технологического рывка находятся впереди, но не за счет идей. Вот тут-то и надо действовать. Причем я, например, думаю, что на первых порах, для того чтобы в этой конкурентной деятельности не проиграть, может быть, даже особо и не надо об этом разглагольствовать, а что-то такое создавать, делать и потом уже сообщать об этом миру. Потому что иначе быстренько это перехватят и оформят все гораздо лучше, потому что они богатые, имеют в своем распоряжении существенно большие бюджеты. Китайцы 60 миллиардов долларов тратят, а у нас сокращают людей, которые этим занимаются.

Если поддерживать своих специалистов в части возможностей, которые уже есть, состыковать их с системой образования, для которой примером может быть система Физтеха, когда студенты могут принимать участие в реальной исследовательской работе, мы можем достичь серьезных результатов, по крайней мере в ряде конкретных значимых задач. Не требуется все сразу, такого не бывает. А вот в некоторых востребованных задачах, в чемпионских направлениях это вполне возможно.

— А люди, которых надо готовить, — это в первую очередь математики?

В. Ф.: Действительно, без математического основания ничего нельзя сделать. Это люди, которые будут владеть математической логикой. Это люди, которые занимаются программированием, с естественным языком, поэтому компьютерные лингвисты должны быть. Это сообщество, состоящее из разных людей, но при этом, разумеется, это те люди, которые занимаются искусственным интеллектом профессионально. Их очень немного. Опасность в том, что сейчас все будут говорить, что они специалисты в этой области. Надо понимать природу этого дела. Это интеллектуальные системы. А это не только математики, это и эксперты из области конкретного знания. Поэтому междисциплинарность — одна из главных особенностей создания интеллектуальных систем. Это большая коллективная работа. И в каждой области надо разрабатывать свою методологию.

magnifier.png Если вы хотите достигнуть развития искусственного интеллекта, не сосредотачивайтесь на имеющихся технологиях, а думайте о том, как развивать основания, с тем чтобы расширять возможности этих технологий. Поэтому когда создается программа развития, которая начинается с компьютерного зрения, — это антипрофессиональный подход

Поэтому главное, на мой взгляд, сейчас — создать инфраструктуру для развития этой области. С этого надо начинать, а не с предложения ее развития. Создайте инфраструктуру и поймите, в каком направлении надо развиваться, а потом будете детальные планы писать. Сейчас писать детальные планы — это быть в хвосте у технологий, в чем мы убедились.

М. З.: Крупные современные банки, теперь не только «Тинькофф», но и Сбер, говорят: мы не банк, мы IT-компания. Это означает, что вместе работают айтишники и специалисты в предметной области, например в конкретном кредитовании. А это нюансы управления рисками, баланс рисков между сторонами договора и так далее. И если стоит задача построить соответствующую информационную систему, то помимо собственно ноу-хау нужно понять, где границы корректности применяемых методов, описать это, переложить в некоторый формальный язык, в формальном языке доказать то, что требуется, про корректность. А это тоже люди, специально образованные, которые могут не только понять экономику явления, но и с моделями поработать. Дальше эти модели нужно привести к разрешимости. Значит, должны быть алгоритмисты, которые приведут это к возможности быть переложенным в инструменты. Следующий шаг, если по жизненному циклу идти, — это софты: сперва софты общего характера: для начала упакую предложенную алгоритмику в Python, например, а убедившись, что у меня в Python работает, я буду смотреть, переписать мне ее (оптимизируя код) в среде Oracle или в Assembler. А к этому еще должна быть добавлена и система технической архитектуры — это не просто железки, а оптимизация софтов с железками, для того чтобы это эффективно работало и было осмысленным с точки зрения экономической целесообразности. Но это еще тоже не конец, там же еще есть и безопасность. Именно поэтому критически важна междисциплинарность.

В. Ф.: В общем, надо создавать инфраструктуру для развития области. И это надо делать последовательно и не строя таких воздушных замков. И не считая, что если что-то работает, то в этом истина. Оно работает, и хорошо, но что-то может работать еще и более интересно.

И если вы хотите достигнуть развития искусственного интеллекта, не сосредотачивайтесь на имеющихся технологиях, а думайте о том, как развивать основания, с тем чтобы расширять возможности этих технологий. Поэтому когда создается программа развития, которая начинается с компьютерного зрения, — это антипрофессиональный подход.

Необходимым условием создания инфраструктуры для развития искусственного интеллекта является становление системы образования, что мы пытаемся сделать в Российском государственном гуманитарном университете посредством направления подготовки «Интеллектуальные системы в гуманитарной сфере» (бакалавриат) и «Когнитивное и программное обеспечение интеллектуальных роботов и программирование интеллектуальных систем (магистратура). Ряд российских университетов реализует эти направления подготовки, продолжая начатое нами.

Еще по теме:
04.12.2019
Пятого декабря 1901 года родился великий физик Вернер Гейзенберг, жизнь которого отразила все перипетии науки и политики...
03.12.2019
Сразу пять национальных чемпионов стали обладателями Национальной премии в области импортозамещения и трансфера технолог...
02.12.2019
Утверждение, что искусственный интеллект — это сумма технологий, глубоко ошибочно: да, в конце концов мы приходим к техн...
29.11.2019
Первого декабря 1792 года в Нижнем Новгороде родился великий русский математик Николай Иванович Лобачевский, создатель п...
Наверх