П ятьдесят лет назад в СССР была создана компьютерная шахматная программа, которой было суждено занять первое место на первом чемпионате мира по компьютерным шахматам. Одним из ее создателей был математик Владимир Львович Арлазаров. В 1960-е он входил в число ученых, которые начали изучать проблематику искусственного интеллекта. Программа «Каисса» оказалась одной из производных их деятельности. Сейчас заведующий отделением ФИЦ «Информатика и управление» РАН, член-корреспондент РАН Владимир Арлазаров среди прочего занимает должность директора по науке компании Smart Engines, которая разрабатывает технологии искусственного интеллекта для распознавания документов. Возглавляет компанию его внук, кандидат технических наук Владимир Викторович Арлазаров. По случаю юбилея «Каиссы» мы поговорили со старшим и младшим Арлазаровыми о днях, когда искусственный интеллект был юным, об обстоятельствах работы над шахматными программами и о современных задачах искусственного интеллекта.
— Сейчас, когда желающие могут открыть на своем компьютере или скачать самые разнообразные шахматные программы, их назначение более или менее понятно. А что заставляло обращаться ученых к компьютерным шахматам в годы вашей молодости, во времена громоздких и маломощных вычислительных машин? Насколько практическим был этот интерес?
Владимир Львович: Разумеется, никто не дал бы нам заниматься обучением машин шахматам просто из чистого любопытства. Однако следует понимать и дух времени. Писать первые шахматные программы мы стали еще в начале шестидесятых — наверное, в самое оптимистичное время нашей истории. Когда война уже относительно давно закончилась, но выжившие на ней были еще молоды, все ожидали, что вот-вот, в самом недалеком будущем произойдет что-то очень хорошее. Подъем был заметен в культуре, но поддерживался и наукой. Физики чуть ли не каждую неделю открывали новую частицу. Деталью этого нового оптимистического мира были и компьютеры, вычислительные машины — информатика тоже была молодой наукой, где все росло, развивалось и было очень интересно. К началу шестидесятых уже появилось оформленное представление, что машины могут не только считать, но и, что называется, «думать», то есть заниматься определенными классами задач, справиться с которыми, как до того представлялось, мог лишь человеческий мозг. Слова «искусственный интеллект» у нас не были распространены. В СССР это называлось «эвристическим программированием», но термин не так уж важен. Важно то, что руководство Института теоретической и экспериментальной физики, ИТЭФ, заинтересовалось этой проблематикой, а одним из важных направлений, которое развивалось в рамках эвристического программирования, как раз и была область игр.
В Институте теоретической и экспериментальной физики заинтересовалось этой проблематикой, а одним из важных направлений, которое развивалось в рамках эвристического программирования, как раз и была область игр
— ИТЭФ был довольно закрытой структурой, связанной с военным атомом. Чем объяснялся этот интерес?
— ИТЭФ был пусть и закрытым, но все же одним из крупнейших в СССР физических институтов, где работали сильные ученые. Руководитель института академик Абрам Алиханов сам был человеком широких интересов и поощрял это в сотрудниках. Мы были математиками, которые должны были помогать физикам в их вычислениях. А нашей математической лабораторией заведовал Александр Кронрод — крупный математик, фронтовик, лауреат Сталинской премии, человек известный. В какой-то момент он забросил все свои математические изыскания и твердо решил, что будущее только за вычислительными машинами. Чистой математикой он больше не занимался. Зато он создал семинар — потрясающий совершенно семинар, который, как сегодня бы сказали, был настоящей лабораторией искусственного интеллекта. Спектр вопросов, который там обсуждался, был выдающийся по своему разнообразию. Занимались там и, скажем так, обычной информатикой, то есть разработкой алгоритмов, а с другой стороны — многими вопросами, которые и сейчас являются основными для искусственного интеллекта. Игры были лишь одним из направлений. Кстати, «играми» больше занимался другой руководитель семинара — Александр Брудно. Занимались мы там разным, задачами на графах, решали и проблему компьютерного распознавания — тем, что мы сейчас развиваем в Smart Engines.
— Что можно было распознать на ЭВМ того времени? Шла ли речь о текстах или об образах?
— Это отдельная песня. Дело в том, что тогда просто не существовало устройства ввода изображений. Поэтому картинки рисовались на растре. Так мы изображали кошек и собак и учили машину отличать одних от других. Упомянутыми кошками и собаками занимался достаточно известный биолог Бонгард. Он очень увлекался этой проблематикой и в конце концов написал книгу «Проблема узнавания».
— И вы в рамках семинара занимались шахматами?
— Мы занимались проблематикой игр вообще. Но шахматы нам нравились тем, что люди серьезно играют в эту игру и научились оценивать силу игроков. Я знаю много задач, которые с теоретической точки зрения ничем не хуже шахмат, но с шахматами, если ты сделал программу, всегда можно сказать: она играет в силу третьего разряда, лучше мастера спорта, лучше чемпиона мира.
— Было ли у вас представление, что вы собираетесь делать после того, как обучите машину прилично играть в шахматы? Предполагалось ли применять эти навыки в каких-то других сферах?
— Мы интересовались прежде всего научными вопросами. О том, как будут использовать алгоритмы шахматных программ, мы не думали. Или думали, что бы такое сказать начальству, чтобы нам выделили ресурсы на разработку темы. Мы хотели научить машину решать все задачи, какие умеет человек. Но у нас было твердое понимание, что в шахматной игре человек использует механизм перебора ходов. А этот механизм применяется в подходе ко многим другим проблемам. Поэтому умение правильно использовать перебор откроет путь к машинному решению многих невычислительных задач — тут, конечно, у нас сомнений не было никаких. Поэтому шахматы никогда не были самоцелью.
— Что можно было позволить себе с точки зрения шахматных алгоритмов на машинах того времени?
— Знаете, я начал заниматься компьютерными шахматами еще когда учился на мехмате МГУ. У меня в дипломной работе была смешная задача — сделать эндшпиль: король с пешкой против короля. Но сделать корректно, чтобы во всех случаях машина играла правильно: ничья так ничья, выигрыш так выигрыш, если выигрыш, то она находила бы правильный путь, а если ничья, чтоб она умела эту ничью сделать. Задача простейшая. Сейчас любой студент может решить ее если не за субботу, то за субботу-воскресенье. Но, заметьте себе, в машине M-2, на которой мы начинали работать, запоминающее устройство было на 16 килобайт. А позиций шахматных, заметьте себе, на круг — 64 в кубе. Это 2 в 18-й. То есть позиции все разместить в машине нельзя было. Поэтому приходилось придумывать алгоритмы — в этом смысле многие задачи, которые мы решали внутри шахмат, не относились лишь к игровым программам. Если у вас 16 килобайт на все про все, включая место для размещения программы, приходилось вертеться. Так вот, на семинаре, организованном Кронродом, обсуждались все задумки для эвристического программирования. В том числе наши идеи вокруг шахмат. Кронрод был все-таки исключительно мощный и целеустремленный человек. И он поставил нам задачу: ребят, вам шахматы нравятся? Нравятся. Давайте сделаем программу.
— Можете ли вы примерно рассказать, как распределялась эта работа?
— Как я уже говорил, там было поколение крепких сорокалетних — к нему, например, принадлежал Адельсон-Вельский. А дальше они набрали нас, салаг, то есть ребят от двадцати пяти и младше. У Кронрода был принцип: если мы что-то делаем, то должно быть сделано именно то, что мы хотим. Кстати, и у математиков, и у поэтов это совсем не так. С чего-то начинаем и к чему-то приходим. Собственно, благодаря целеустремленности Конрода мы довели нашу работу до конца. Ведь шахматные программы пытались создавать и без нас — многие остановились на полдороге.
— Созданная вами программа в 1967 году была проверена в соревновании с программой, разработанной в США…
— Действительно, был такой очень известный ученый Джон Маккарти — создатель языка программирования LISP, первого языка, созданного для решения задач искусственного интеллекта, — и, кстати, один из авторов самого этого термина. Он был просто суперизвестный, мировая величина — и он немножко тоже занимался проблемой шахматных игр в Стэнфорде. Он часто приезжал к нам в гости. И мы с ним довольно много обсуждали шахматные программы. Кстати, обсуждали совершенно открыто. Это вообще была замечательная атмосфера научного общения, когда никто ничего не скрывал. Тогда мы и решили организовать матч нашей программы с программой Стэнфордского университета.
Тогда просто не существовало устройства ввода изображений. Поэтому картинки рисовались на растре. Так мы изображали кошек и собак и учили машину отличать одних от других
— Как технически был организован подобный матч в ту технологическую эпоху — без нынешних вычислительных скоростей, интернета, вообще с принципиально другой связью?
— Играли программы, работавшие на двух вычислительных машинах — машине ИТЭФа и Стэнфордского университета. Все программы, как раньше, так и сейчас, зависят от времени, которое потрачено на ход. Когда мы играли с Маккарти, у нас было два варианта программы. Один — коротенький, который давал ответ, грубо говоря, как положено в шахматах, в течение нескольких минут. А в другом варианте ход длился пару часов. Мы работали в Физическом институте, в котором машинное время было довольно-таки загружено. Поэтому, если ты хочешь сделать два хода — это четыре часа, а никто четыре часа тебе сразу на блюдечке с золотой каемочкой не дает. Поэтому мы с Маккарти играли даже не по телефону, а по телеграфу. И делали ход в неделю. А играли мы четыре партии, две из них — легкой программой, и обе закончились вничью. А две мы играли с более развитой программой, и вот их-то мы обе выиграли.
— Представляете ли вы, какие преимущества советской программы позволили выиграть этот турнир?
— Сложно описать все находки. Но, например, мы придумали тогда понятие «форсированный вариант» — это вариант, когда каждый ход должен давать либо шах, либо быть взятием. И не просто взятием, а взятием с перекрытием, так, чтобы противник не мог остановиться. Такие ходы мы просматривали на очень большую глубину, и это было огромное продвижение. Мы тоже перебирали не слишком глубоко, но у нас на хвосте любого перебора стоял форсированный вариант.
— Какой была реакция на это советско-американское шахматное соревнование?
— Надо понимать, что, когда мы с Маккарти затевали это соревнование, мы ставили чисто научные цели. Но, разумеется, мы все живем на Земле. Если мы выиграли матч у американцев, было бы смешно, если бы мы это дело правильно не представили. Американцы это, кстати, тоже, представили. И, возможно, в десять раз сильнее. Мы читали тогда, как они били в набат: русские не только опережают нас космосе, но и превосходят в программировании, куда это годится? Благодаря этому ученым удалось выбить на свои работы прекрасное финансирование. Мы им даже сильно завидовали потом. Хотя тоже сумели подать достижение в нужным нам целях.
— Все, что вы пока рассказываете, лишь подход к истории собственно «Каиссы».
— В 1968 году наша команда ушла из ИТЭФа. Если точнее, то «ушли» нас, когда Кронрод и Адельсон-Вельский подписали открытое письмо в поддержку математика-диссидента Есенина-Вольпина. И обосновались мы в Институте автоматики и телемеханики — сейчас он называется Институтом проблем управления. К сожалению, при этом мы растеряли весь старший состав лаборатории ИТЭФа, кроме ушедшего вместе с нами Адельсона-Вельского. Кронрода, как мы ни хотели, взять туда не удалось. Фактически ушли в свободное плавание. Правда, нам самим в 1968 году было около тридцати лет, и мы были готовы к самостоятельности. Кроме того, у нас появилась подмога. Среди прочей своей деятельности Кронрод в 1960-е организовал математические тренинги для школьников, разработал программу занятий математикой для московской Седьмой школы. Я и вся наша команда там тоже немного преподавали. К 1968-му выпускники этой школы как раз стали заканчивать институты. Это тоже было очень сильное поколение, которое нам удалось частично подтащить к себе и заразить идеей работы над шахматной программой, например Мишу Донского. Мы потеряли старших, зато приобрели шикарную молодежь. И вот там мы уже разработали программу, которую затем назвали «Каисса».
— В каком «родстве» она состояла со старой программой ИТЭФа?
— Мы, разумеется, отталкивались от нее, но фактически переписали все заново. Прежде всего, в Институте автоматики и телемеханики была уже другая вычислительная машина. Аналог IBM-360. Тогда машины этого типа были самыми распространенными в мире и фактически стояли везде. Не могу сказать, что она была особо мощной, но, во всяком случае, намного мощнее той, на которой мы работали в ИТЭФе. И, переписывая наши шахматные наработки с учетом новых возможностей, мы фактически написали новую программу. Главным действующим лицом этого процесса стал Миша Донской, поскольку он был моложе. Я-то к этому времени уже выдвинулся в начальники и очень много писать был не в состоянии. Работа была закончена в 1971 году. Затем мы обкатывали программу, играя матчи с читателями газет. Сначала с «Уральским рабочим», потом с «Комсомольской правдой». Был такой формат матча по переписке. Тогда программе и дали имя «Каиссы».
Мы с Маккарти играли даже не по телефону, а по телеграфу. И делали ход в неделю. А играли мы четыре партии, две из них — легкой программой, и обе закончились вничью. А две мы играли с более развитой программой, и вот их-то мы обе выиграли
— Но все-таки звездный час «Каиссы» связан с чемпионатом мира среди шахматных программ.
— Да. В 1970-е проектов, связанных с компьютерными шахматами, было уже довольно много. И тогда ИФИП — международная федерация информатики — решила впервые провести соревнование таких программ. Чемпионат был назначен на 1974 год, и мы, конечно, начали к нему усиленно готовиться. Было жутко интересно. Состоялся он в Стокгольме, куда поехал Донской, а играли мы из Москвы на своей институтской машине.
— А как передавались ходы?
— Ходы передавались обыкновенно — по телефону. А условия чемпионата — два часа на сорок ходов. Возможностей машины для этого уже хватало. Тем более что мы подготовили «Каиссу» и добавили программе одну особенность, которой не было у ее конкурентов. Мы могли работать за время противника. То есть, сделав ход, мы прогнозировали, как программа-соперник может ответить, и начинали обдумывать свои ходы. Поскольку люди тоже могут так делать, комиссары не стали возражать против этой практики. Так что программа была довольно гибкая и удачная. С ней мы заняли первое место.
— Какова была дальнейшая судьба «Каиссы»?
— Ну, мы участвовали еще в нескольких чемпионатах. В 1977 году разделили второе и третье место. Потом сыграли в 1980-м, и там уже довольно далеко откатились от тройки призеров. я не помню, какое…
Тут сыграло свою роль, что году к 1978-му мы просто потеряли интерес к компьютерным шахматам. Начали разработку программы мы, напомню, в 1968-м. Десять лет — это достаточный срок, который можно уделить какой-то одной задаче.
— Повлияло ли что-то на утрату интереса, помимо усталости?
— Да как вам сказать… Отчасти это произошло из-за изменения атмосферы на этих чемпионатах. Соревнование с программой Маккарти было чистым научным состязанием. Мы соревновались, мы обсуждали, что сделали, как каждый из нас добился того или другого результата. И первый чемпионат мира тоже был очень открытым по своему духу. Это был полноценный форум ученых-информатиков. И вдруг спустя какое-то время мы обнаруживаем, что ничего этого нет, каждый сидит за своим столиком, никто ни с кем не разговаривает.
Маккарти, с которым мы много раз обсуждали разные вопросы, довольно откровенно это признавал. Я спрашивал его: «Часто вы с коллегами совместные проблемы обсуждаете?» Он говорит: «Да нет, не часто». — «А почему не часто?» — «Пока еще не доказал теорему, начнешь обсуждать — у тебя стащат. А когда ты уже доказал и опубликовал, то что тут обсуждать?» Я понимаю, что он нарочно утрировал проблему, сводил ее к анекдоту. Но это не значит, что он говорил о чем-то не существующем в реальности.
Мы подготовили «Каиссу» и добавили программе одну особенность, которой не было у ее конкурентов. Мы могли работать за время противника. То есть, сделав ход, мы прогнозировали, как программа-соперник может ответить, и начинали обдумывать свои ходы
— А в советской науке нельзя было представить проблему плагиата или воровства идей?
— Представить-то можно. Не вспомню прецедента с советскими учеными, но, скажем, один югослав, то есть представитель социалистической науки, однажды откровенно украл нашу статью, которая была опубликована на русском языке, и выставил ее перевод от своего имени на какой-то конференции, снабдив один в один картинками из советского журнала. Да, ну и что? Корову мы, что ли, проиграли, если научный мошенник сделал один доклад? Все это, по-моему, ерунда. Жульничество может присутствовать в науке, как и в любой сфере человеческой деятельности. Но дело ведь не в этом. Главное, какую цель ты в этой деятельности ставишь. Мы когда-то могли поставить себе цель развития науки как таковой. Тогда еще наукометрия не стояла впереди науки. То есть, разумеется, никто не хотел, чтобы его вклад был забыт, но цель двигать науку вперед все-таки стояла на первом месте. Как только она ушла из сферы компьютерных шахмат, мы просто перестали этим заниматься. Стало неинтересно.
— Времена, когда можно было заботиться лишь о том, как двигать вперед науку, закончились вместе с 1980-ми. Вы успешно пережили экономические трансформации и сейчас работаете директором по науке в компании Smart Engines. Вы занимаетесь технологиями распознавания документов. Чем объяснялся выбор?
— Решение проблемы распознавания разных носимых людьми документов — это передний край технологий искусственного интеллекта. Именно здесь пробуются разные перспективные наработки. Когда-то в 1990-е компания Cognitive Technologies, которую я тогда возглавлял, начинала с технологий распознавания текстов. Сейчас проблема эта в целом решена. Чем там заниматься? Сунул текст в устройство — он и распознается. Но документ — это совсем другое. Его надо распознавать при конкретных обстоятельствах — там, где в обычной жизни вам нужно показывать этот документ. То есть вы должны достать паспорт, предъявить его компьютеру либо камере на вашем смартфоне, сделать это на фоне всей той околесицы, которая ежесекундно вас окружает. А это совсем не похоже на ситуацию, когда взяли книжку и начали ее сканировать, страницу за страницей. А при такой постановке задачи, собственно угадывание символов, которое было основным процессом при распознавании текстов, становится лишь элементом среди многих других условий, необходимых для ее решения. Когда вы «шлепнете» свой документ для распознавания, программа должна его структурировать. Вы снимаете его как придется, под самым произвольным углом, в любом ракурсе. И это не сканер. Обычно при такой съемке оказывается куча визуальной грязи, блики и так далее. И все это надо делать быстро, на ходу, к тому же программа должна уметь так же быстро отличить подлинный документ от фальшивого. Не переклеена ли фотография, не показывается ли вместо оригинала ксерокопия. Без этого, с точки зрения наших заказчиков, не стоит и огород городить.
— Не так давно вы объявили о достижении, которым, как я понимаю, особенно довольны: ваши технологические продукты научились распознавать «в полевых условиях», на ходу, российский паспорт, в котором необходимо структурировать данные с двух страниц, расположенных «книжкой». Может быть, в цифровую эпоху проще поменять формат документа?
— Здесь я запросто могу привести пример. Около тридцати пяти лет назад, когда впервые встал вопрос о необходимости машинного распознавания текста, были придуманы два удобных для распознавания шрифта — OCR-1 и OCR-2. Тогда предполагалось, что в будущем все тексты будут печататься именно этими шрифтами, поэтому компьютеры надо обучить распознаванию только этих шрифтов. Получалось бы, что документы будут печататься шрифтами, которые могут распознавать все компьютеры. А что мы видим сегодня? Пошла ли технология по этому пути? Это ответ на вопрос, нужно ли менять документ под нынешние возможности машины.
— Тогда вопрос можно поставить радикальнее. Если люди не всегда рациональны и не вполне предсказуемы, математики должны помочь «подогнать» привычки людей под потребности машин, в том числе в части того, когда, как и какие документы показывать.
К разговору присоединяется генеральный директор компании Smart Engines, кандидат технических наук Владимир Викторович Арлазаров.
— Позвольте задать вопрос: а зачем?
— Мало ли. Придумали же когда-то банковскую карточку и приучили людей расплачиваться именно ею, поскольку это технологически удобно.
Владимир Викторович: О нет! Современные банковские карты очень «человечны». Машина, конечно, считывает чип. Но внешний вид, оформление этих карточек определенно делаются так, чтобы привлечь внимание людей, а не облегчить распознавание машинам. В этом смысле Smart Engines решает задачи, которые очень похожи на те, что стояли перед программистами в 1960-е годы. У нас есть очень ограниченный вычислительный ресурс для тех задач, которые мы себе поставили. Тогда ученые развивали искусственный интеллект на машинах со смешной по нынешним временам мощностью. Сейчас мы должны научить мгновенно распознавать документы, используя ограниченную вычислительную мощность смартфона. И дело ученых — решить эту задачу, а не сказать человеку: «Обучись и действуй, как удобно для машины». Это, в конце концов, вопрос этики. Мы решаем задачи для человека. И паспорт-книжечка придумана, потому что человеку так удобнее.
— Если говорить об этике, надо задать и другой вопрос: Одним из следствий улучшения распознавания документов может стать повышение контроля над обществом. Думаете ли вы о таких последствиях ваших технологий?
В. В.: Мы разрабатываем такие решения, которые позволят распознать паспорт средствами одного смартфона, не передавая эту информацию на внешний ресурс. И это тоже вопрос принципиальный и этический, по крайней мере для нас. Мы ведь специально ломали голову над тем, как все ужать, чтобы обработка документов для распознавания не передавалась в облако. Благодаря этому не только резко уменьшается риск утечки приватной информации, но и риски создания малоконтролируемых баз персональных данных. Поэтому мы и считаем наш подход этическим.
Бумага — это по-прежнему простой ответ на весь этот запутанный клубок проблем. Даже если отключат свет и газ, вы покажете паспорт и подтвердите, что вы — это вы
— Возможно ли, что со временем этические вопросы вокруг вашей технологии отпадут просто из-за сужения потребности в ее применении? Что показывает ваш опыт: увеличивается или уменьшается со временем количество физических документов, которые надо распознавать? Можно ли предполагать, что спустя сколько лет все уйдет в «цифру»?
В. Л.: Тут я тоже могу ответить. В 1990 году мы пытались с переменным успехом внедрить во Франции созданную тогда нами систему распознавания символов. Вокруг нас крутились некоторое количество людей — половина из них были чиновники, половина, наоборот, инженеры, которые говорили: «Нафига все это нужно, уже через пять лет все будет машинизировано, никаких бумажных документов не будет. Всё будут вводить и передавать электронно, и кому тогда сдастся ваше распознавание?». Это был 1990 год. Позвольте спросить, какой год на дворе сейчас?
— Но, возможно, со временем создать электронный аналог всем документам удастся?
В. В.: Не думаю. Прежде всего, мы еще далеко не готовы к этому технически. Надо учитывать и простые бытовые вопросы, упирающиеся в очень фундаментальные проблемы. Скажем, на смартфоне, где хранятся ваши электронные удостоверения личности, кончилась батарейка. Значит ли это, что вы уже не гражданин? Или батарейка села в устройстве у полицейского — у вас проблема? Или по какой-то причине сломался чип: человек поднес карточку к устройству — она не считалась. Кто виноват? Значит ли это, что она поддельная? Вопросов здесь много, и на них нужно ответить. К тому же люди не очень любят, чтобы за каждым их шагом следили. Поэтому, в частности, они так яростно сопротивляются полной отмене наличных денег. А бумага — это по-прежнему простой ответ на весь этот запутанный клубок проблем. Даже если отключат свет и газ, вы покажете паспорт и подтвердите, что вы — это вы.
Темы: Интервью