Компания 7 Августа 2019

Искусство интеллекта от ABBYY

Компания — национальный чемпион ABBYY наращивает выручку и продажи. В этом году аналитики Everest Group признали ее мировым лидером в области Intelligent Document Processing, а оборот всей группы по итогам 2020 года может достигнуть двух миллиардов долларов
Искусство интеллекта от ABBYY
Головной офис ABBYY
ABBYY

В уже далеком 1989 году студент МФТИ Давид Ян, закончивший четвертый курс, решил подзаработать во время летних каникул и поправить свое материальное положение. После долгих раздумий он решил создать электронный словарь, с помощью которого все желающие могли бы быстро и легко переводить различные иностранные слова и тексты. Он нашел деньги, людей, взявшихся за перевод на машинные носители словарных баз, и человека, ответственного за создание программной оболочки. «Показал им распечатку на матричном принтере. В левой колонке было написано Lingvo 1.0, в правой — Lingvo 2.0. Lingvo 1.0. — электронный словарь, Lingvo 2.0. — автоматический переводчик. В левой колонке было написано: “Вводишь слово — переводишь слово”. В правой — “Вводишь предложение — переводит как человек”», — вспоминал позднее Ян. Себе же он отвел роль генератора идей и координатора всего процесса. К этому делу был привлечен и программист Александр Москалев, впоследствии ставший одним из руководителей и крупнейшим акционером ABBYY. В итоге после полугода напряженной работы на свет появился электронный словарь Lingvo, которым пользуется уже не одно поколение. Продажи были очень маленькими, но это не расстроило Давида и его друзей, которые поняли, что идут в правильном направлении. В том же году была основана компания BIT Software, позднее переименованная в ABBYY.

АБИ ЯН.png
Основатель и Председатель совета директоров группы компаний ABBYY Давид Ян
ABBYY

Спустя два года, уже после распада СССР, в страну из-за рубежа хлынул огромный поток самой разнообразной техники: компьютеры, факсы, ксероксы, принтеры, сканеры — с документацией на иностранных языках, которую нужно было переводить. И тогда Ян с товарищами решили реализовать концепцию «От листа на одном языке до листа на другом языке». Они придумали и разработали продукт, автоматизирующий весь цикл перевода документа — от сканирования, распознавания и коррекции до перевода. «Мы решили совершенствовать программы, входящие в комплект: систему оптического распознавания текста (OCR, Optical Character Recognition), электронный переводчик, системы коррекции орфографии и электронный словарь (Lingvo), — рассказывает Александр Москалев. Но тут же наткнулись на препятствие: оказалось, что развивать продукт, который тебе не принадлежит, очень трудно. Разработчики не воспринимали наши идеи, а продавать исходные тексты своих программ они не хотели, и тогда мы решили действовать сами».

magnifier (1).png Основным преимуществом FineReader стали ее мультиязычность и омнифонтовость — она могла сразу узнавать символы любых размеров и начертаний, ее не нужно было настраивать заново для распознавания каждого нового шрифта

И не прогадали. Основным преимуществом FineReader — так называлась разработанная Bit Software программа оптического распознавания — стали ее мультиязычность и омнифонтовость: она могла сразу узнавать символы любых размеров и начертаний, ее не нужно было настраивать заново для распознавания каждого нового шрифта. Это был первый большой успех молодых разработчиков — в первый же месяц было продано около сотни копий. С тех пор FineReader претерпел много изменений, сегодня его используют уже более 20 млн человек по всему миру, а технологии распознавания текстов, лежащие в ее основе, лицензируют крупнейшие мировые компании — Fujitsu, Epson, Hewlett Packard Enterprise, RICOH, Xerox и многие другие.

 

От распознавания к пониманию

Сегодня технологии компании используются во многих бизнес-процессах, связанных с информацией. Это распознавание и извлечение данных, определение типа документов, ввод в информационные системы, анализ содержания и поиск данных. Начав с технологий для обработки текстов, документов и потоковых данных, ABBYY постепенно переходит к программам, способным понимать их смысл.

Например, к первым можно отнести решение ABBYY Recognition Server. Оно предназначено для обработки любого объема документов на 190 языках, полученных со сканера, МФУ или по факсу и их конвертацию в файловые форматы PDF, HTML, MS Word. Кроме того, оно способно обеспечить их хранение по единому стандарту. Для мобильных приложений есть решение ABBYY Real-Time Recognition SDK. Оно предназначено для распознавания документов с помощью мобильного приложения. В основе технологии заложен уникальный алгоритм, объединяющий результаты обработки нескольких кадров из видеопотока. Благодаря этому качество распознавания увеличивается в несколько раз. Обычно оно применяется для быстрого оформления клиентов в банках, отелях, страховых, телекоммуникационных компаниях и других организациях.

magnifier (1).png «В конце прошлого года Сбербанк внедрил систему мониторинга новостного потока на базе технологий ABBYY. Это решение автоматически анализирует содержание сообщений о банках-контрагентах на русском языке и находит в них разные рисковые факторы»

Для работы с официальными документами вроде паспортов, удостоверений личности, водительских удостоверений, свидетельств о рождении таких стран, как Российская Федерация, Азербайджан, Белоруссия, Казахстан, Киргизия, Таджикистан, Узбекистан и Украина, есть приложение ABBYY PassportReader SDK. Его использование позволяет сократить время на ввод паспортных данных до 30 секунд и снижает риск при вводе паспортных данных вручную.

ABBYY ScanDifFinder SDK — встраиваемое решение для сравнения документов, как бумажных и электронных копий, так и двух электронных версий одного и того же документа, которое можно легко интегрировать в любые приложения. Анализу могут быть подвергнуты документы разных форматов: сканы или фотографии документов, PDF без текстового слоя. Сравнивать документы можно на русском и английском языках. Никаких ограничений нет: можно сопоставлять договоры, прайс-листы, маркетинговые материалы, счета-фактуры, акты и т. д. С помощью программы клиент моментально выявляет различия в сравниваемых вариантах и в несколько раз сокращает риск возникновения ошибок.

Платформа ABBYY FlexiCapture разработана для обработки информации из всех типов документов: текстов писем, вложений, электронных документов, фотографий, сканов. Заложенные в ней алгоритмы, дают возможность распознать и классифицировать документы, извлечь и проверить корректность данных, передать их в корпоративную информационную систему. С использованием FlexiCapture бизнес существенно снижает издержки на обработку документов, сокращает время принятия управленческих решений и обеспечивает контроль на всех этапах движения документов. Ее продолжением стала программа ABBYY FlexiCapture Engine, встраивающаяся в платформу клиента или стороннее приложение и позволяющее практические с чистого листа создавать те или иные приложения, начиная с рабочих станций и заканчивая сложными серверными решениями. По сути дела, она помогает расширить функциональность существующих приложений. Заложенные в нее технологии позволяют дополнить рабочее место функцией сканирования счетов-фактур и автоматического ввода информации из них в систему.

АБИ ШУШКИН.png
Генеральный директор ABBYY Россия Дмитрий Шушкин
ABBYY

«В конце прошлого года Сбербанк внедрил систему мониторинга новостного потока на базе технологий ABBYY, — рассказывает Дмитрий Шушкин, генеральный директор “ABBYY Россия”. — Это решение автоматически анализирует содержание сообщений о банках-контрагентах на русском языке и находит в них разные рисковые факторы. Через модели ABBYY в реальном времени проходит весь объем новостей более чем о тысяче банков-контрагентов, а в досье автоматически попадают только релевантные данные. Другой пример — оператор Tele2, который развивает каналы самообслуживания и позволяет новым клиентам удаленно открывать SIM-карты с помощью терминалов с распознаванием лиц и документов, удостоверяющих личность. В этом решении также используются технологии ABBYY, которые автоматически извлекают паспортные данные и отправляют их на проверку оператору».

Система ABBYY Compreno — технология анализа и понимания текстов состоит из нескольких блоков — морфология, синтаксис, семантика, статистика и онтология.

Сначала осуществляется лексико-морфологический анализ исходного текста, который делится на абзацы, предложения и слова, определяет части речи и морфологические признаки слов — род, число, падеж и т. д.

Синтаксический блок анализирует роль каждого из понятий в выбранном предложении и соединяет их, создавая при этом дерево связей, с главным понятием. От него отходят атрибут, объект и субъект, с их помощью раскрывается смысл, заложенный в предложении.

magnifier (1).png «Независимому партнеру нет смысла вкладываться в развитие рынка, в рекламу. Именно поэтому мы решили сконцентрироваться на работе с двумя-тремя ключевыми партнерами и стали договариваться о создании совместных предприятий с эксклюзивными правами на продажу в каждом регионе»

После этого создается семантическая иерархия понятий, представленная в виде дерева. От него отходят общие понятия, например «лидер», представленные в виде толстых ветвей, от которых, в свою очередь, исходят более тонкие — понятия «босс», «шеф» и другие, аналогичные им. Это дает возможность избежать неоднозначных трактовок, когда нужно перевести предложение с одного языка на другой и обеспечить преемственность связей от предков к потомкам. Например, слово «управление» можно трактовать как департамент, то есть отдел той или иной организации, а можно как действие. И благодаря тому, что это слово в разных ветках представлено по-разному, как понятие и как действие, система может подобрать нужные слова в зависимости от контекста фразы.

Онтология занимается тем, что создает прагматический слой анализа текста, определяет терминологию для конкретной предметной области и правила извлечения нужных объектов. В итоге вся информация представляется в нужном заказчику виде.

Уникальные возможности системы позволяют ей выявлять омонимы, восстанавливать пропущенные слова в тексте, анализировать сложные лингвистические связи между ними.

На основе Compreno был разработан ряд других решений. Приложение ABBYY Intelligent Search применяется для поиска в корпоративных системах, учитывая при этом все возможные параметры: форму слов, их значения, связи между ними, расстояние и контекст употребления. ABBYY Intelligent Tagger выискивает в текстовых массивах так называемые сущности — даты, суммы денег, названия организаций и имена, после чего с этой информацией можно осуществлять любые операции. А ABBYY InfoExtractor SDK предназначено для извлечения нужной информации из текстов и документов.

 

На 198 языках

В январе 2019 года в корпорацию пришла хорошая новость: крупнейшая исследовательская фирма Research Market назвала ее в числе ведущих фирм на мировом рынке, производящих решения для распознавания и обработки данных. И этим лишь подтвердила уже очевидный для многих специалистов факт: лидерство ABBYY на уровне базовых технологий (OCR, или перевод бумажной копии в электронную, с сохранением исходного форматирования и возможностью свободного редактирования) уже давно признано ее конкурентами. Что касается технологий второго уровня (DataCapture, когда программа понимает, какой именно документ перед ней), то здесь ABBYY действительно одна из первых. При этом ABBYY единственная компания в мире, которая занимается лингвистикой и обладает собственными разработками как в области технологий OCR, так и Data Capture, которые в состоянии распознавать 198 различных языков — больше, чем аналогичные продукты конкурентов.

Такой успех стал возможен благодаря сочетанию нескольких факторов: хорошего финансирования исследований и разработок в сфере искусственного интеллекта, технологий распознавания и обработки текстовой информации. На них уходит около четверти всего годового дохода компании, что в полтора-два раза превышает среднее значение по отрасли.

АБИ ПРОДУКТЫ.png
Продукты компании ABBYY. Программы для ПК
ABBYY

Помогла и хорошо продуманная и грамотно реализованная стратегия выхода на международный рынок, главным образом в США и Европу. В отличие от своих конкурентов ABBYY сосредоточилась на работе с двумя-тремя основными партнерами, договорившись с ними о создании совместных предприятий с эксклюзивными правами на продажи в каждом регионе. Если брать североамериканский рынок, то там партнером ABBYY стала компания Newsoft, под ее брендом на полках магазинов появился программный продукт, функционально дублирующий решения FineReader. В результате последовавшего за этим слияния появилась компания ABBYY USA. В дальнейшем эта стратегия получила развитие: в 2012 году ABBYY приобрела американскую компанию Digital Documents, специализирующуюся на внедрении технологий распознавания документов.

«С самого начала мы делали ставку на локальных партнеров: в каждом регионе выбирали компании, которые становились центрами компетенций и отвечали за весь цикл продаж. Это было сделано не случайно, так как местные игроки лучше знают свой рынок, язык и культуру людей, покупающих решения и продукты, — объясняет Дмитрий Шушкин. — И в таком сотрудничестве была своя специфика: с одной стороны, организацией продаж на локальном рынке занимается партнер, но, с другой стороны, не всегда на партнера можно повлиять. Сейчас для него важна продукция, и он уделяет ей внимание, увеличивает продажи. А завтра у него появилось более интересное предложение, и он переключился на него. Для партнера это тоже риск. Сегодня ты работаешь с ним, а завтра найдешь других. Поэтому независимому партнеру нет смысла вкладываться в развитие рынка, в рекламу. Именно поэтому мы решили сконцентрироваться на работе с двумя-тремя ключевыми партнерами и стали договариваться о создании совместных предприятий с эксклюзивными правами на продажу в каждом регионе».

Большая часть бизнеса ABBYY за рубежом — это продажа корпоративных решений. Большой популярностью пользуются такие продукты, как например, FlexiCapture — платформа для интеллектуальной обработки информации, извлекающая данные и отправляющая их в корпоративные системы. В Европе и США, ее применяют для обработки инвойсов — платежных документов, содержащих всю необходимую информацию о транзакции: особенности товара или услуги, условия поставки, сведения для отправителя и получателя. Продолжает пользоваться спросом ABBYY FineReader, известная универсальная программа для работы с бумажными и PDF-документами. Сейчас ее используют более 50 млн человек в 200 странах мира — частные лица, малый и средний бизнес. Компания постепенно усиливает свои позиции и на рынке роботизации бизнес-процессов. Она заключила соглашения о стратегическом партнерстве с UiPath, BluePrism и NICE Systems — ведущими мировыми производителями программных роботов.

Сейчас ABBYY работает в 200 странах — США, Канаде, Европе, странах Африки, Азии, Латинской Америки, СНГ, Персидского залива, в ее послужном списке уже много реализованных там проектов. Например, во время переписи в Казахстане с помощью ее технологий было распознано и введено в информационную систему более 25 млн анкет. В Таджикистане компания помогла сократить сроки обработки информации: ее ввод и обработка заняли всего семь месяцев против 18, как раньше, когда использовался ручной труд. Государственный офис по налогам Австралии с помощью технологий ABBYY ежегодно подвергает автоматической обработке до 3,5 млн документов — писем, приказов, распоряжений, запросов. Министерство здравоохранения Бангладеш использовало программное обеспечение ABBYY для общегосударственного исследования здоровья граждан. Обычно процесс сбора и ввода нескольких десятков миллионов анкет занимал более двух лет, но благодаря ABBYY FlexiCapture все было сделано за восемь месяцев.

magnifier (1).png В 2018 году доходы группы компаний выросли на 15% в долларах, глобальная партнерская сеть расширилась более чем на 20%, а выручка от решений в области интеллектуальной обработки информации увеличилась на 34%, это в пять раз выше среднерыночного роста. Активный рост продемонстрировала «ABBYY Россия», рублевая выручка которой выросла на 47%

ABBYY уже более пятнадцати лет является лидером в разработке и продвижении решений в области искусственного интеллекта, которые используются в банках, нефтегазовых, энергетических, телекоммуникационных компаниях, государственных организациях, ритейле и других секторах экономики. В апреле 2019 года аналитики Everest Group признали ее мировым лидером в области Intelligent Document Processing — решений, которые извлекают ценную информацию с помощью технологий, таких как компьютерное зрение, оптическое распознавание символов, обработка естественного языка, машинное и глубокое машинное обучение. Это подтверждается и серьезными финансовыми показателями. В 2018 году доходы группы компаний выросли на 15% в долларах, глобальная партнерская сеть расширилась более чем на 20%, а выручка от решений в области интеллектуальной обработки информации увеличилась на 34%, что в пять раз выше среднерыночного роста. Активный рост продемонстрировала «ABBYY Россия», рублевая выручка которой выросла на 47%. Более 90% продаж компании пришлось на корпоративный сегмент. Наибольшим спросом пользовались решения в области интеллектуальной обработки информации, в том числе с использованием технологий машинного обучения. Основную часть доходов — около 60% — ABBYY принесли представительства в США и Европе. Ожидается, что по итогам 2020 года выручка по всей группе может составить около двух миллиардов долларов.


Темы: Компания

Еще по теме:
17.10.2019
Избыток инновационных решений в одном продукте, стремление инвестора идти в традиционный высококонкурентный рынок, вмест...
03.10.2019
Эмпатия, идеализм, излишняя задумчивость в критической ситуации — свойства столь же опасные для предпринимателя, сколь и...
01.10.2019
Сооснователь и глава американской компании-единорога WeWork Адам Нейманн отправлен в отставку, а Масаёси Сон пообещал ос...
26.09.2019
Как перспективный интернет-стартап, заинтересовавший первых лиц нашего государства и иностранных инвесторов, растерял ст...
Наверх