Интервью 17 июля 2017

Столпотворение как точная наука

Как возбудить толпу или, наоборот, погасить ее активность, не допустить толчеи и оценить влияние рефлексии людей в толпе? Оказывается, это предмет серьезных математических исследований. Об этом рассказывает директор Института проблем управления РАН, член-корреспондент РАН Дмитрий Новиков
Столпотворение как точная наука
Фотография: gettyimages.ru

Формы социальной организации очень разнообразны: от упорядоченного государства до толпы, которую словари определяют как неорганизованное скопление людей. Способы управления государством кажутся более или менее рациональными и поддающимися анализу, о них писали еще Платон и Аристотель, Конфуций и Лао-цзы, Гоббс и Макиавелли, хотя далеко не всегда их рецепты удавалось реализовать на практике. Но вот управление толпой сразу было зачислено в разряд искусства, не поддающегося рациональному осмыслению. Математическая теория управления «подбиралась» к толпе постепенно.

Как отмечает директор Института проблем управления РАН, член-корреспондент РАН Дмитрий Новиков, где-то с конца сороковых годов XX века в фокусе внимания теории управления оказались общество и человек. Вспомним Норберта Винера, отца кибернетики, одна книга которого называлась «Кибернетика, или Управление и связь в животном и машине», а другая — «Кибернетика и общество». С тех пор интенсивно начало развиваться направление прикладной математики, связанное с моделированием поведения человека.

В 1943 году появилась книга фон Неймана и Моргенштерна «Теория игр и экономическое поведение», которая описывает принятие решений людьми. Это было рождение теории игр. А в 1951 году издана книга Кеннета Эрроу про парадоксы коллективного выбора. Дальше развитие этого направления теории управления шло по экспоненте и сейчас тоже продолжает развиваться достаточно бурно.

Недавно Дмитрий Александрович в соавторстве со своими сотрудниками Владимиром Бреером и Андреем Рогаткиным выпустил монографию «Управление толпой: математически модели порогового коллективного поведения». Известна мысль Юджина Вигнера о «непостижимой эффективности математики в естественных науках», но какова связь математики и «иррациональной» толпы? Мы встретились с Дмитрием Новиковым, чтобы понять, как и чем математика может оказаться полезной в управлении столь нерациональным объектом.

 

— Под управлением толпой понимается целенаправленное воздействие, как правило информационное, на нее в целом или на отдельных агентов, осуществляемое с целью обеспечения требуемого их поведения. А теория управления толпой в научной литературе имеет два устойчивых и распространенных направления исследования.

Директор Института проблем управления РАН, член-корреспондент РАН Дмитрий Новиков
Директор Института проблем управления РАН, член-корреспондент РАН Дмитрий Новиков    
Фотография: Дмитрий Лыков

Первое — это управление движением агентов: достижение цели, избежание столкновений, обход препятствий, сохранение формации и так далее. Такое управление требует моделирования движения толпы, в которой люди рассматриваются как физические объекты с координатами и скоростью, того, как они движутся в зависимости от плотности толпы, как преодолевают препятствие, например какое-то сужение.

Самый известный пример такого управления — модели эвакуации из помещений. Отдельный аспект — определение набора мероприятий по «физическим» мерам воздействия на толпу в целях предотвращения давки, массовых беспорядков.

Второе направление исследований — управление поведением толпы, принятием решений. Здесь можно выделить два больших направления — гуманитарное в рамках социальной психологии, точнее, психологии толпы как ее раздела, и математическое моделирование. Математическая теория управления — это моделирование толпы, описывающее поведение людей в толпе, и управление этим поведением. В последнем, в свою очередь, можно также выделить два основных направления.

Первое — модели команд, то есть совместного адаптивного принятия решений группами людей на основе информации о неопределенных факторах.

Второе направление, которому принадлежит и наша работа, — это математическое моделирование так называемого конформного, порогового поведения, то есть принятия агентами решений в зависимости от того, какая доля или число агентов из их окружения уже приняла соответствующее решение.

— Что значит конформное поведение в контексте вашего подхода?

— Если иметь в виду поведение в толпе, то человека можно считать конформным, если, увидев, что хоть кто-то активен, он следует его примеру и, скажем, вступает в драку. Если человек полностью антиконформен, то независимо от того, что все вокруг вступили в драку, начали устраивать погромы и так далее, он все равно ведет себя как добропорядочный гражданин. У каждого человека внутри существует определенный порог конформности, который определяет, какая доля окружающих его людей должна возбудиться, чтобы он тоже возбудился.

magnifier.png Толпа — это граф, вершины которого соответствуют людям, а ребра — связям между людьми. Например, граф является полным, когда каждый «видит» каждого в этой толпе. Состояние вершины описывается ноликом или единичкой, возбужден человек или нет

Не подумайте, что наша теория изучает только драки и погромы. Можно привести и другие примеры порогового поведения толпы: например, мы пришли в кино, сидим и смотрим фильм, очень скучный и неинтересный, но, как воспитанные люди, стесняемся уйти. Но когда мы видим, что один поднялся и ушел, другой поднялся и ушел, нам легче и самим встать и уйти. И это проявление конформизма. Другой классический пример из научно-популярной литературы: мы пришли в кафе в незнакомом городе. Если в этом кафе никого нет, это может вызвать у нас подозрение, что это плохое кафе. Если кафе переполнено, то, может, оно и хорошее, но народу слишком много. Мы в нем останемся, если в нем будет, с одной стороны, достаточное количество людей, свидетельствующее, что кафе неплохое, но в то же время нам там будет не тесно. Такие эффекты социального поведения описываются моделями порогового поведения, и задача описания поведения толпы — один из частных случаев приложения пороговых моделей. Разработка таких моделей началась с классических экспериментов психолога Соломона Аша о конформном поведении и математических моделей социального поведения Марка Грановеттера.

— Мы говорим об управлении толпой, но еще не определили, что такое толпа с точки зрения математики, раз уж мы говорим о математической теории управления…

— В контексте исследования того, как человек в толпе принимает решения, толпу можно рассматривать как частный случай так называемой активной сетевой структуры (АСС). Другими частными случаями АСС являются разного рода социальные группы, онлайновые социальные сети и так далее.

А с точки зрения математики в этом случае толпа — это граф, вершины которого соответствуют людям, а ребра — связям между людьми, например, кто кого видит. Например, граф является полным, когда каждый «видит» каждого в этой толпе. Состояние вершины описывается ноликом или единичкой, возбужден человек или нет. И задано правило принятия им решений в зависимости от состояния соседей.

magnifier.png Есть институциональное управление — когда мы что-то запрещаем или разрешаем. Есть мотивационное управление — когда мы побуждаем, стимулируем людей предпринимать действия в наших интересах. А есть управление информированностью людей, когда за счет того, что меняется информированность, они принимают нужные нам решения. Это самый красивый вид управления

Именно такое представление подсказывает нам формы управления толпой в разных обстоятельствах. Скажем, есть некоторая толпа, которую можно представить графом и которая способна возбуждаться. Спрашивается, если мы потихонечку начнем рвать связи, фрагментировать граф, в какой момент ее равновесным состоянием станет невозбужденное состояние? В теории случайных графов существуют методы оценки того, как можно трансформировать граф, какую долю связей надо удалить, может быть, даже случайным образом, чтобы перевести его в другое состояние. Это могут быть достаточно жесткие методы управления — выделение лидеров, разрыв связей, условно, физическая сегментация толпы. В терминах модели толпы в теории графов последнее значит, что вы должны видеть минимум соседей вокруг себя. Тогда ею проще управлять. Хотя, вообще говоря, задача управления состоит в том, чтобы научиться работать с коллективами, не только с толпой, но и вообще с сетевыми структурами, более тонкими методами, например информационными — через побуждение и убеждение.

Один из важных результатов, представленных в нашей книге, — демонстрация возможностей перехода от микромоделей, оперирующих теоретико-графовыми моделями толпы, когда мы описываем модель принятия решений отдельным человеком, к макроописанию толпы в целом, когда она характеризуется единственной скалярной величиной, числом от нуля до единицы, а динамика этой величины описывается дифференциальным или разностным уравнением. Например, долей возбужденных агентов в толпе. И оказывается, что есть функция распределения порогов агентов в этой толпе, которая описывает толпу в целом. Если мы знаем начальное состояние толпы и эту функцию распределения, то можем предсказать, как толпа будет вести себя дальше. Предположим, нас интересует, как достичь какого-то равновесного состояния этой толпы. То есть если сейчас она находится в таком-то состоянии, в какое из равновесий она перейдет? И если то равновесие, в которое она переходит, нас не очень устраивает, то надо ставить и решать задачу управления, чтобы обеспечить переход в необходимое состояние.

— То есть думать о воздействии?

— Да, думать об управлении как целенаправленном воздействии на эту толпу, которое привело бы ее в то равновесие, которое для нас наиболее благоприятно. Что может быть примером таких воздействий? Это зависит от наших целей. Если мы хотим, как нехорошие люди, чтобы все приняли участие в каких-то погромах или драках, то есть наша задача — возбудить толпу, нам, соответственно, нужно понижать пороги возбудимости людей. Что можно делать? Например, подвергать толпу информационному управлению, говоря: «Вам за это ничего не будет, не бойтесь, в прошлый раз все было нормально, никто наказания не понес».

Второй способ — внедрение в толпу провокаторов. Способ известен на протяжении столетий. Вводим какую-то критическую массу провокаторов, тем самым понижая относительный порог, и эти провокаторы толпу возбуждают и раскачивают.

Директор Института проблем управления РАН, член-корреспондент РАН Дмитрий Новиков
Фотография: Дмитрий Лыков

Посмотрим на эту ситуацию с другой стороны. Все-таки мы либо как добропорядочные люди не заинтересованы в возбуждении всей толпы, либо как люди, отвечающие за безопасность или решающие задачу обеспечения общественной безопасности, заинтересованы в том, чтобы толпа вела себя спокойно, чтобы все спокойно прогуливались и не принимали участия в драках и погромах. С точки зрения информационного управления нужно повышать порог возбудимости, то есть говорить, например, что наказание неотвратимо, чтобы люди ощущали опасность перехода в активное состояние. Либо вводить, условно говоря, иммунизаторов в эту толпу: людей, которые никогда и ни за что не будут вести себя агрессивно и активно. Они повышают относительный порог возбудимости, стремясь перевести толпу в нулевое состояние, то есть когда все пассивны, спокойны, добропорядочны.

Если есть два субъекта, каждый из которых преследует собственные цели: один хочет возбудить, а другой, наоборот, нейтрализовать это возбуждение, — то мы получаем уже модель информационного противоборства между этими двумя субъектами. Каждый из которых пытается воздействовать на толпу, чтобы сдвинуть ее равновесное состояние в требуемую ему сторону. Тут уже работает теория игр, соответствующие модели тоже рассмотрены в нашей книге, по-моему, с красивыми содержательными интерпретациями. Например, для толпы можно ввести такую характеристику, как «инерция», и если ресурсов управления субъекта, воздействующего на толпу, хватает для преодоления этой инерции, то он возбудит всю толпу в случае, если у его оппонента недостаточно ресурсов управления для нейтрализации возбуждения.

— В ваших работах проблемы управления толпой увязаны с проблемами рефлексии, или, как ее определяют философы, деятельностью самопознания. То есть рефлексия — это, скорее, психолого-философское понятие…

— Есть два вида рефлексии: авторефлексия, когда человек рассуждает о себе, о том, как он действует и мыслит, — и рефлексия второго рода, когда человек рассуждает о том, как рассуждают или действуют другие люди. Раз мы занимаемся управлением социальными системами, значит, нам нужно иметь модель принятия решения человеком. Человек — существо рефлексивное. Например, принимая решение о своем поведении в толпе, я могу вести себя не просто конформно: «Все вокруг возбудились, и я тоже» — я же могу и порефлексировать. То есть если я увижу, что мой сосед перешел в возбужденное состояние, я могу подумать: «Если сейчас и я возбужусь, то тогда все вокруг возбудятся, а я этого не хочу, я знаю, что у этого будут плохие последствия». Это значит, что я отрефлексировал поведение других, предсказал их реакцию на изменение своего поведения. Такое поведение тоже надо уметь моделировать.

magnifier.png Было бы хорошо уметь описывать поведение каждого человека в отдельности, иметь точные модели принятия им решений и на основании этой информации делать какие-то выводы о поведении толпы. Но если толпа достаточно большая, а люди разные, то появляется возможность сделать предельный переход, как от термодинамики к статистической физике

Это отдельный класс моделей, моделей рефлексивного принятия решений, мы в институте этим давно занимаемся, по крайней мере, последние пятнадцать лет.

Вот вам пример рефлексивного управления: я могу сообщить, что, например, завтра цены на нефть упадут. А могу сообщить, что все остальные считают, что цены на нефть упадут. Это разные сообщения, и для разных людей разные по убедительности. А можно сообщить, что все остальные считают, что цены на нефть упадут, но они знают, что вы уверены, что они останутся такими же, и так далее. На каждое такое сообщение следует разная рефлексивная реакция. Есть очень красивый математический аппарат, который описывает подобные ситуации.

Это, наверное, самый тонкий вид управления людьми. Действительно, есть институциональное управление — когда мы что-то запрещаем или разрешаем, это управление ограничениями и нормами деятельности. Есть мотивационное управление — когда мы побуждаем, стимулируем людей, в основном экономическими факторами, предпринимать действия в наших интересах. А есть управление информированностью людей, когда за счет того, что меняется информированность, они принимают нужные нам решения. Это самый красивый вид управления, основанный на рефлексии. Конечно, рефлексия выросла из философии — ей много внимания уделяли еще Джон Локк и Давид Юм, но сейчас есть много разных математических теорий, позволяющих описывать это явление.

— Это как-то связано с логикой как математической наукой?

— Одно из направлений описания рефлексии — это направление в математической логике (epistemic logic), очень активно развиваемое, в основном на Западе. Мы у себя больше развиваем подходы на основе теории игр. В этом у нашей страны приоритет благодаря работам Владимира Александровича Лефевра, чей восьмидесятилетний юбилей мы недавно отмечали. Это выдающийся мыслитель, который в своей книге «Конфликтующие структуры» 1973 года и в статье «Исходные идеи логики рефлексивных игр» 1965 года заложил теорию рефлексии и ввел рефлексивные модели в обиход российской научной мысли — и гуманитарной, и математической. У него был свой аппарат, свой подход, и он его развивает последние пятьдесят лет. И мы его тоже развиваем.

magnifier.png На поведение людей накладываются эмоциональные и культурные традиции, специфика менталитета. Пока мы не умеем их отлавливать. А описывать их количественно математики пока даже и не пытались

— Можно ли сказать, что математическая теория управления толпой дает математические зависимости, которые связывают характеристики отдельных людей в толпе с характеристиками поведения толпы в целом?

— Вы произнесли ключевые слова: характеристики отдельных людей и характеристики толпы в целом. Конечно, в идеале было бы хорошо уметь описывать поведение каждого человека в отдельности, иметь точные модели принятия им решений и на основании этой информации делать какие-то выводы о поведении толпы. Но если толпа достаточно большая, а люди разные, то появляется возможность сделать предельный переход, как от термодинамики к статистической физике, и перейти к каким-то усредненным характеристикам толпы, которые характеризовали бы ее свойства в зависимости от начального состояния и описывали ее динамику. И описывали бы достаточно просто, чтобы не нужно было вникать в индивидуальные характеристики каждого из людей, находящихся в толпе. И при этом чтобы можно было делать какие-то выводы о динамике толпы в целом.

В термодинамике и статистической физике переходят от описания отдельных молекул к макрохарактеристикам газа, таким, например, как температура и давление. В нашем случае осуществляется переход от моделей индивидуального принятия решений большим числом людей к дифференциальному или разностному уравнению, описывающему состояние толпы в целом. Это уже динамическая система, к которой можно применять методы оптимального управления, исследовать ее устойчивость и так далее. Все эти задачи давно описаны и успешно решаются методами классической теории управления, ведь математикам неважно, что описывают дифференциальные уравнения: молекулы, самолет, подводную лодку, толпу или какой-нибудь другой объект. Мы всю мощь математического аппарата, который для этого класса объектов развит, можем применять, получать результаты, а потом интерпретировать их в терминах исследуемого объекта.

Директор Института проблем управления РАН, член-корреспондент РАН Дмитрий Новиков
Фотография: Дмитрий Лыков

И так же, как в термодинамике, мы можем в толпе наблюдать эффект фазовых переходов, то есть переход скачком из одного состояния в другое. Оказывается, существуют значения параметров толпы, при которых происходит резкое переключение равновесия, например из нуля в единицу. То есть если параметр имеет одно значение, то толпа, стартуя из некоторой точки, скатывается в состояние покоя. А чуть-чуть параметр изменился, и равновесием уже становится полностью возбужденная толпа. Можно даже в определенном смысле говорить о «температуре» толпы, например, насколько она «разогрета». В формуле, описывающий состояние толпы, есть параметр, который можно условно интерпретировать как температуру. Но, конечно, прямо в лоб переносить модель термодинамики на описание толпы нельзя. Все-таки люди не молекулы.

— А как ваши исследования стыкуются с классическими социологией и психологией? Они ведь тоже занимаются, только описательно, теми же проблемами: и проблемами возбуждения толпы, и оценками поведения людей в разных ситуациях.

— В современной социальной психологии нет количественных закономерностей поведения людей, есть только некоторые качественные эффекты, которые общепризнаны, например те же эксперименты Аша, которые описаны в любом учебнике по социальной психологии. Выводы, которые получаем мы в результате математического моделирования, должны не противоречить, а объяснять результаты наблюдений в области социальной психологии. К сожалению, количественных зависимостей там пока нет.

— Казалось бы, проблема управления людьми, как вы сами сказали, уже изучается много лет, даже десятилетий. И никто не ставил перед собой задачу накопления такого материала?

— Понимаете, объект слишком сложный. Одно из требований к любому эксперименту — контролируемость условий его проведения. Если бы мы с вами имели возможность взять какую-то организацию и в ней, не меняя ничего, «пошевелить» один параметр, собрать статистику, потом «пошевелить» другой параметр… Но даже если предположить, что мы такую организацию нашли, эксперименты провели… Что дальше? Можно ли переносить эти результаты на другие организации? Там другие люди. Человек слишком сложен для того, чтобы, сделав какие-то выводы о поведении одного человека в одной ситуации, даже детально измеренные, педантично, скрупулезно и грамотно с точки зрения постановки эксперимента, можно было эти результаты перенести на другого человека и на другую организацию.

magnifier.png Существуют значения параметров толпы, при которых происходит резкое переключение равновесия, например из нуля в единицу. То есть если параметр имеет одно значение, то толпа, стартуя из некоторой точки, скатывается в состояние покоя. А чуть-чуть параметр изменился, и равновесием уже становится полностью возбужденная толпа

На поведение людей накладываются эмоциональные и культурные традиции, специфика менталитета. Пока мы не умеем их отлавливать. А описывать их количественно математики пока даже и не пытались. И это не их дело. Если бы нам психологи дали результаты экспериментов, грамотно поставленных, проведенных в разных странах, это было бы безумно интересно.

— Сейчас появилось новое направление в робототехнике — управление коллективами роботов. Самый известный пример — когда нужно управлять большими эскадрильями дронов, чтобы они все вместе решали общую задачу…

— Конечно, мы этим занимаемся. В задачах управления групповым поведением роботов можно выделить несколько уровней их рассмотрения, или несколько уровней архитектуры агента. Первый уровень наиболее простой и понятный — это управление движением, стабилизация движения вдоль траектории отдельного робота. Второй уровень — планирование траектории отдельного робота. Следующий уровень — взаимодействие между ними, например согласованность движения какой-то формации для патрулирования определенной области пространства. Следующий уровень — планирование миссии, которую они должны реализовать. И так далее, и так далее. На одном из верхних уровней такого управления возникают проблемы рефлексии, и есть математические модели, развиваемые в нашем институте и касающиеся роли рефлексии при таком взаимодействии роботов.

— Чьей рефлексии? Роботов или людей, которые ими управляют?

— Когда сидит один оператор и рефлексирует — это уже пройденный этап, это неинтересно. Интересно автономное групповое поведение роботов, когда мы заложили в них какие-то алгоритмы, в этот рой, и отправили их куда-то, а они сами планируют миссию, распределяют цели и задачи, взаимодействуют друг с другом.

Мы можем заложить в «мозги» роботов различные алгоритмы, в том числе рефлексивного поведения. Например, предположим, что у одного робота не хватает какой-то информации о внешней среде. Наблюдая за поведением своего соседа-робота, он может делать какие-то выводы о свойствах среды, в которой он оказался. Например, если один робот увидел, что другой резко изменил траекторию своего движения, значит, возможно, его обнаружила система обороны или он попал в какую-то неблагоприятную ситуацию — это рефлексия, это дополнительная информация, она повышает эффективность действия группы роботов.

magnifier.png Выводы, которые получаем мы в результате математического моделирования, должны не противоречить, а объяснять результаты наблюдений в области социальной психологии. К сожалению, количественных зависимостей там пока нет

Сейчас наблюдается активный перенос таких антропоморфных свойств, которые раньше, казалось, были свойственны только человеку, как возможность целеполагания, возможность рефлексии, на технические системы, в первую очередь на мультиагентные. Это сейчас глобальный тренд, и этим нельзя не заниматься.

— Естественно возникает вопрос: что практически полезного, могут извлечь из этой науки те, кто управляет людьми, толпой? Может быть, не напрямую из ваших книг, поскольку они очень сложные, но, скажем, из общения с вами, с учеными?

— Ценность математических результатов заключается не в точных количественных закономерностях, а в тех качественных содержательных выводах, которые можно сделать на основе этих формул. Потому что если логика построения вывода правильная и исходный посыл правильный, то можно быть уверенным, что и результат правильный. И полученная закономерность основана не только на здравом смысле, но и является следствием каких-то базовых вещей. Например, тот факт, что при определенных обстоятельствах возможно возникновение ситуации, при которой малое изменение параметра может привести к катастрофическому изменению состояния системы, сам по себе гораздо более ценен, чем какая-то конкретная формула, описывающая зависимость состояния от информации.

Какой вывод можно сделать из этого? Если вы знаете, что существует малая, но чувствительная для вас вероятность самовозбуждения толпы, вроде бы пока находящейся в состоянии спокойствия (такой эффект тоже имеет место и описан в нашей работе), то в этой ситуации, хотя вроде бы все спокойно, нужно принимать какие-то предупредительные меры по «успокоению» толпы. Кто предупрежден, тот вооружен.

Темы: Интервью

Еще по теме:
05.11.2024
Ведущий разработчик БПЛА, национальный чемпион группа компаний «Геоскан» начала развивать собственное производство спутн...
08.10.2024
Разговор с Маратом Юсуповым, человеком, разгадавшим рибосому, о том, как это произошло и какое отношение к этому имеют Н...
08.07.2024
Глава Ассоциации российских разработчиков и производителей электроники Иван Покровский рассказывает, как российская микр...
03.06.2024
Как связаны кибернетика и математическая теория управления? Что нового в сегодняшнем ажиотаже вокруг искусственного инте...
Наверх