Тема взаимодействия робота и человека прочно вошла в центр и общественного интереса, и научного поиска. Еженедельно в мире выходит от 100 до 200 научных публикаций, посвященных проблематике распознавания роботами движений, жестов и даже эмоций человека. В 2016 году пройден важнейший порог — число ошибок при распознавании объектов роботами и системами искусственного интеллекта стало ниже, чем у человека: 4% против 7%. Почему не стоит преувеличивать значение этих цифр, как выглядят российские исследователи на общем фоне, возможен ли новый рывок в совершенствовании технологий взаимодействия человека и роботов? Об этом «Стимулу» рассказал Вячеслав Воронин, заместитель директора научного центра «Когнитивные технологии и машинное зрение» Московского государственного технологического университета «Станкин». Здесь развернута работа по гранту Российского научного фонда, направленная на создание и распространение на промышленных предприятиях России технологий распознавания промышленными роботами предметов, а также жестов, речи и состояния людей.
Грант РНФ на три года (2021‒2023) с финансированием по шесть миллионов рублей в год и возможным продлением еще на два года предполагает «фундаментальные исследования по разработке новых методов создания математических моделей, исследования процессов взаимодействия робота и человека», — отмечает Вячеслав Воронин, — но не только это. В ходе исследований будет появляться большое количество прикладных разработок, причем для конкретных предприятий промышленности.
«Мы занимаемся разработкой новых методов распознавания объектов и способов анализа действий человека с использованием искусственного интеллекта и нейронных сетей, — рассказывает Вячеслав Воронин. — Сейчас исследования в области искусственного интеллекта — это мейнстрим, существует большая конкуренция в этой сфере. По данной тематике выходит порядка 100‒200 научных статей в неделю. Сейчас бум разработок по различному применению нейронных сетей. Все, кто работает в этом направлении, пытаются что-то автоматизировать, получить экономический эффект — и это удается. В результате растет эффективность производства и безопасность человека.
«Большинство экономистов старой закалки слишком много внимания уделяют теории, но в наши дни заметный объем экономических исследований на самом деле связан с анализом очень простых вещей»
Мы — скажу без ложной скромности — идем на острие науки в своей области. То, что РНФ выдал грант именно нам, тоже говорит об этом. Наши статьи публикуются в высокорейтинговых журналах: Neurocomputing, IEEE Access, Pattern Recognition, IEEE Transactions on Multimedia. Сейчас именно публикации в международных научных журналах свидетельствуют об актуальности работы научных групп. Наши доклады на международных конференциях SPIE Defense + Commercial Sensing и 12th International Conference on Machine Vision» признаны лучшими.
Наша особенность в том, что мы оперируем данными, которые получены в условиях реального производства. А это условия плохой видимости, работа с объектами сложной конфигурации. Например, на рабочем столе лежат заготовки детали. Робот, манипулятор, роборука должны распознать эти детали, даже если они лежат неупорядоченно, взять, расставить определенным образом. В некоторых случаях задача робота состоит и в том, чтобы предугадать действия человека и вовремя подать нужную деталь».
Математическая основа теоретических разработок — это «преобразование визуальной информации в пространстве гиперкомплексных чисел» и «использование теории кватернионов и октанионов (кватернионы используются для работы с четырехмерными пространствами, октанионы — с восьмимерными. — “Стимул”) для разработки новых нейросетей». «Мы обрабатываем визуальную информацию, сохраняя корреляцию между несколькими каналами данных с различных сенсоров. В качестве таких каналов могут выступать цвет, глубина, инфракрасный, ультразвуковой», — говорит Вячеслав Воронин. После того как эти цели будут достигнуты, исследователи модифицируют нейронные сети для обобщения на многоканальные сигналы. В итоге точность распознавания объекта роботом можно будет увеличить на 2‒4%.
Распознавание объектов в этом проекте — главная системная цель. На ней ученые сконцентрируются в первый год работы по гранту. Кроме того, для повышения эффективности распознавания будет решаться задача достраивания невидимых или чем-то перекрытых частей объектов с помощью генеративных нейронных сетей.
На базе распознавания действий человека строится модель управления роботами при организации совместной работы человека и робота в одном рабочем пространстве с целью повышения безопасности и уменьшения вероятности травматизма.
Дальше — на третий-четвертый годы работы — дело дойдет до распознавания роботом эмоционального состояния человека, степени его усталости, правильности выполнения действий, готовности к работе — создания психофизиологического портрета человека. И эти данные можно будет использовать на любом производстве и даже в медицине.
По словам Вячеслава Воронина, научная группа параллельно с теоретическими исследованиями в области анализа и улучшения изображений приоткрыла и некоторые прикладные области. «На данных плохого качества с помощью предложенного математического аппарата мы научились выявлять с высокой вероятностью пневмонию, вызванную новой коронавирусной инфекцией, при анализе данных компьютерной томографии на основе глубинного обучения», — рассказал он и отметил, что прикладных областей очень много. Над прикладными задачами ученые будут работать вместе с конкретными заказчиками: набирать базу данных и адаптировать взаимодействие человека и робота под конкретные задачи.
«В 2011 году ошибка нейронных сетей по распознаванию объектов была 30 процентов. Человек допускает в среднем ошибку около шести-семи процентов. В 2016 году был переломный момент, когда искусственный интеллект стал ошибаться уже меньше, чем человек. Ошибка распознавания была снижена до четырех процентов, машины превзошли человека»
«Уже сейчас к разработке большой интерес проявляют производственные предприятия машиностроительной, обрабатывающей промышленности, медицинские учреждения и организации, — продолжает Вячеслав Воронин. — Среди них НПО “Андроидная техника”, которое специализируется на разработке, производстве и обслуживании робототехнических комплексов, и АО АВК, крупный поставщик химической продукции промышленного назначения.
Например, АВК хочет получить робототехническую установку, которая будет заниматься покраской крупногабаритных судов. Им нужно заменить человека при анализе и обработке поверхности — очистке, шлифовке, покраске. Моя задача сводится к разработке системы технического зрения для такого робота, чтобы он точно анализировал качество поверхности, стоил оптимальную траекторию движения для объезда всех препятствий. Робототехническая платформа для этих задач может быть выбрана любая — шагающая, тросовая и так далее. Это уже вопрос разработчиков механизмов».
Наш собеседник обрисовал работу разных научных групп, занятых улучшением качества распознавания объектов, как забег по плато. Нейронные сети известны давно, уже несколько десятилетий, но бум развития искусственного интеллекта пришелся на последнее из них. Потому что именно в последние десять лет вычислительные мощности подняли до уровня, позволяющего реализовать сложные ресурсозатратные нейронные сети. Но время, когда развитие технологий искусственного интеллекта шло семимильными шагами, осталось в прошлом.
«В 2011 году ошибка нейронных сетей по распознаванию объектов была 30 процентов. Человек допускает в среднем ошибку около шести-семи процентов. В 2016 году был переломный момент, когда искусственный интеллект стал ошибаться уже меньше, чем человек. Ошибка распознавания была снижена до четырех процентов, машины превзошли человека», — комментирует Вячеслав Воронин. И дальше скорость улучшений стала снижаться. Удается добиться еще полупроцента — хорошо. Еще 0,2 процента — тоже хорошо. И чем ближе к ста процентам, тем шаг погрешности обработки уменьшается.
Но сто процентов в сфере искусственного интеллекта очень далеки от реальности. «На самом деле сложно создать что-то универсальное, что будет подходить для решения любой задачи, например распознавания образов. Разработки делаются с использованием конкретных баз данных, и если метод работает на какой-то базе данных, это не значит, что он будет работать на любых данных так же эффективно. Когда говорят, что искусственный интеллект заменил человека, всегда нужно оговариваться, на какой конкретной задаче и при каких входных данных. Если мы хотим, чтобы робот распознал какую-то группу действий, мы должны вначале показать ему эти действия: рука вверх, рука вниз, движение по кругу, движение пальцами и так далее», — пояснил Вячеслав Воронин.
К 1991 году директор ЦНИИ РТК Евгений Юревич добился выделения робототехники в особую отрасль промышленности. Это решение было сформулировано и согласовано на самом высоком уровне буквально в последние дни существования СССР и оказалось отсроченным на 30 лет
Исследовательскую работу, имеющую своей целью обучение роботов различным задачам, он сравнил с пазлами, элементы которых, соединяясь друг с другом, формируют целостную систему. Один из них — это работа с данными сенсоров, которые действуют в разных диапазонах. То есть направление развития в этой области связано со сбором данных и методами их комбинирования с целью поиска скрытых закономерностей в информации. Второй пазл — это предварительная обработка данных. «Здесь решается проблема повышения качества данных, например уменьшения шума, повышения контрастности, повышения разрешения, детализации объектов и уменьшения размерности», — пояснил наш собеседник. Третий пазл — это выделение информативных признаков для распознавания объекта. Например, человек изображается в виде особых точек, соединенных линиями. Чем-то эта схема напоминает скелет или каркас. Четвертый пазл — разработка архитектуры нейронных сетей для принятия ими решений. «Отбор правильных признаков представляет собой глобальную проблему. Ведь не всегда нужно иметь много данных, чтобы правильно обучить нейронную сеть.
Разные научные группы занимаются либо отдельными пазлами/блоками этой системы, либо всеми вместе. Мы пытаемся работать во всех этих блоках», — говорит Вячеслав Воронин.
Какие бы пути и пазлы ни выбирали исследователи, ожидать чего-то прорывного, по мнению Воронина, в ближайшее время не приходится. Ограничивающим фактором он считает фон-неймановскую (Принстонскую) архитектуру (принцип совместного хранения команд и данных в памяти компьютера). Структура нейронных сетей подчинена чисто математическим правилам: состоит из сверток, умножения, суммирования — «обычная математика, ничего запредельно сложного». Сейчас в этом направлении в основном работают над автоматизацией определенных действий, то есть над созданием алгоритмов, способных обучаться, но это, по мнению Воронина, пока не позволяет получить искусственный интеллект, способный синтезировать новые знания. Поэтому так велико количество исследований — все пытаются что-то определенное автоматизировать, используя локальные базы данных. Один из возможных вариантов получения новых результатов в этой области Воронин видит в использовании квантовых вычислений: «Квантовый компьютер позволит использовать совершенно новый принцип построения вычислений, новый подход к представлению информации и ее обработке. Тема квантовых вычислений мне интересна. Буду двигаться в этом направлении».
Более близкая цель — заменить пульты управления роботами, которые представляют собой крупные панели с большим количеством кнопок, на человеко-машинный интерфейс. Когда-то подобное произошло с компьютерами. В результате работа с ними стала доступна практически любому, а не только специалистам, прошедшим специальную подготовку.
Проблему слабого внедрения промышленных роботов многие эксперты считают одним из самых узких мест отечественной промышленности. В 1980-е годы развитие этого направления шло быстро, вровень с мировыми лидерами, иногда и с опережением. Авария в Чернобыле показала, что отечественные роботы превзошли иностранных. В зоне аварии работали тяжелые радиоуправляемые роботы производства Западной Германии и три вида отечественных роботов — производства ВНИИтрансмаша, «Атомэнергоремонта» и МВТУ-2. У роботов из ФРГ под действием ионизирующих излучений сразу же отказала электроника. Отечественные роботы проработали чуть дольше, но тоже не выполнили возложенные на них задачи. И тогда в ленинградском ЦНИИ робототехники и технической кибернетики за два месяца, работая круглосуточно в четыре смены, разработали и изготовили роботов специально для Чернобыля. Они существенно сократили затраты человеческих ресурсов при ликвидации последствий аварии. Этот опыт был обобщен, и к 1991 году директор ЦНИИ РТК Евгений Юревич добился выделения робототехники в особую отрасль промышленности. Это решение было сформулировано и согласовано на самом высоком уровне буквально в последние дни существования СССР и оказалось отсроченным на 30 лет.
Еще несколько лет тому назад эксперты в один голос говорили о сложности внедрения инноваций в производство из-за отсутствия целевого финансирования и финансовых рисков: а вдруг не будет должного эффекта от новинки? По наблюдениям Вячеслава Воронина, и эти проблемы сегодня в прошлом. «Сейчас примерно 80 процентов различных проектов финансируют кооперацию между вузами, где создаются новые технологии, и предприятиями, для которых они предназначены. Мне кажется такой подход очень правильным, потому что в этом случае создаются наукоемкие прикладные продукты и технологии, необходимость появления которых продиктована текущим уровнем экономического развития и перспективой развития предприятий. При этом предприятия, внедряя новые технологии и продукты, возвращают затраченные деньги на разработку в бюджет через налоговые отчисления, — комментирует Вячеслав Воронин. — На мой взгляд, благодаря таким программам поддержки произошли значительные изменения, возможно даже прорывные, во взаимодействии науки и производства».
«По многим направлениям наша страна уже рассталась с ролью отстающей, в том числе в сфере развития искусственного интеллекта я не скажу, что мы отстающие. У нас в стране очень много успешных проектов, связанных с нейро- и гетерогенными природоподобными технологиями»
Опыт общения с зарубежными коллегами убедил нашего собеседника в том, что финансирование научных проектов сейчас в России идет не хуже, чем на Западе, а иногда и лучше. «Я считаю, что сейчас в нашей стране очень неплохо финансируются и теоретические, и прикладные исследования. У молодежи есть возможность получить финансирование исследований, достойную зарплату, купить все необходимые материалы и оборудование, съездить в командировки за границу, чтобы представить свои результаты, ведь без коммуникаций с зарубежными учеными наука развиваться не будет. Важно, что различные программы — финансирование фундаментальных исследований, стажировки за рубежом, гранты на кооперацию с промышленностью, с зарубежными учеными — работают комплексно, формируя политику нашего государства. Эти усилия задали устойчивый вектор развития, дали результаты в виде прорывных исследований и публикаций в высокорейтинговых международных научных журналах. По многим направлениям наша страна уже рассталась с ролью отстающей, в том числе в сфере развития искусственного интеллекта я не скажу, что мы отстающие. У нас в стране очень много успешных проектов, связанных с нейро- и гетерогенными природоподобными технологиями».
На примере МГТУ «Станкин» Вячеслав Воронин рассказал о комфортных условиях, созданных в России для молодых ученых. Ежегодно до ста человек из числа студентов и аспирантов вуза выезжают на стажировки за границу за счет стипендии президента РФ для обучения за рубежом. «И все возвращаются! Это самое главное. А почему возвращаются? На самом деле сейчас в России созданы очень неплохие условия работы для молодых ученых. Есть реальные практические проекты, есть финансирование для проведения исследований. Что еще нужно ученому? Надеюсь, что такие комфортные условия, как сейчас, будут долго. Чем больше денег вливается в отрасль, тем больше лучших умов она способна привлечь», — заключил Вячеслав Воронин.
Темы: Наука и технологии