Блокчейн изначально не подходит для данного процесса, так как в нашем случае не стоит задача распределенной записи и хранения данных, а также в рамках процесса не происходит никаких транзакционных запросов. Следовательно, данная технология также не будет рассматриваться при дальнейшем анализе.
AI (искусственный интеллект) мог бы быть отличным решением текущей проблемы в совокупности с тем же ML или индивидуальной разработкой ПО. Но, во-первых, по двум важнейшим критериям выбора решения, а именно сравнительно невысокой стоимости и относительно быстрому внедрению - данная технология сильно уступает оставшимся, так как искусственный интеллект - это никогда не дешево и совсем не быстро. Во-вторых, на сегодняшний день программы BRMS успешно решают задачу возможности принятия решения системой без участия пользователя (не роботизированное, а алгоритмизированное). И, в-третьих, AI используется, как правило, для задач, связанных с неструктурированными данными без четкого алгоритма действий, в нашем же случае процесс довольно линейный и структурированный. В связи с этим технология Artificial Intelligence не пригодна для исследуемого процесса.
Как и в теоретической части данной работы (с точки зрения обобщенной выгоды для среднестатистического проекта - см. п. 1.1.), так и при анализе фактического проекта, исходя из описанных в предыдущем пункте критериев, мы приходим к выводу о том, что наиболее оптимальными вариантами (для нашего процесса) являются собственная разработка ПО, BPMS-системы, либо внедрение технологии RPA. Так как, вероятнее всего, готовые решения будут выгоднее с точки зрения данного процесса, более подробно рассмотрим их, а стоимость собственного решения рассчитаем в п. 2.3, по итогам которого сделаем выводы.
2.2.1 Сравнительный анализ BPMS-систем на мировом рынке
На сегодняшний день на рынке BPMS-систем лидируют такие решения, как Appian BPM, Pega BPM, IBM BPM, bpm'online, Tibco BPM (см. рисунок 4 - данные приведены за 2018 г.).
Рисунок 4 Рынок вендоров BPMS-решений [46]
В разное время, по оценкам консалтинговых агентств, проводящих анализ рынка, в первую тройку входили, как правило, одни из следующих компаний: IBM, Oracle, bpm'online, Pega, Appian. При этом стоимость систем практически сопоставима: в таблице 1 указаны цены за лицензии без внедрения. Далее мы рассчитаем, во сколько бы обошелся данный процесс для каждой из трех наиболее популярных на сегодняшний день систем.
Таблица 1 Стоимость основных мировых BPMS-решений [49]
|
BPMS |
Информация о стоимости |
|
|
1 |
2 |
|
|
Appian BPM |
На одного пользователя: лицензия - $2160 в год |
|
|
Pega BPM |
На одного пользователя: лицензия - $1068 (базовая)/ $2040 (стандартная)/ $3000 в год (продвинутая) |
|
|
IBM BPM |
На одного пользователя: лицензия - $1500 (базовая)/ $11500 (продвинутая) в год, техподдержка - $3696 |
|
|
Bpm'online |
На одного пользователя: лицензия - $480 в год |
|
|
Tibco Active Matrix BPM |
От $0,4 млн, стоимость техподдержки 16% от стоимости решения, т.е. от $64000 в год |
|
|
Oracle BPM Suite |
На одного пользователя: лицензия - $2900, техподдержка - $638 в год |
|
|
Bizagi BPM Suite |
На одного пользователя: лицензия - $815, техподдержка - $138 в год. Аренда лицензий за пользователя в год: $316 |
Рассчитав стоимость решений топ-3 компаний BPMS на 2018 г. с учетом лицензий с примерной стоимостью внедрения компаний-интеграторов среднего уровня и масштаба (средняя цена в РФ - 4 000 000 руб.) и технической поддержкой в течение, по меньшей мере, 3 месяцев, исходя из нашего процесса и конкретного банка, получаем следующие значения:
Стоимость Appian BPM = Стоимость лицензий (2 160 ($ на чел/год) *64,76 (курс руб.) *10 (кол-во лицензий, необходимых для процесса)) + Стоимость внедрения (4 000 000) + Стоимость технической поддержки (419 612) = 1 398 816 + 4 000 000 + 419 645 = 5 818 461 руб.
Стоимость Pega BPM = Стоимость лицензий (2 040 ($ на чел/год, стандарт) *64,76 (курс руб.) *10 (кол-во лицензий, необходимых для процесса)) + Стоимость внедрения (4 000 000) + Стоимость технической поддержки (419 612) = 1 321 104 + 4 000 000 + 396 331 = 5 717 435 руб.
Стоимость IBM BPM = Стоимость лицензий (1 500 ($ на чел/год, базовый) *64,76 (курс руб.) *10 (кол-во лицензий, необходимых для процесса)) + Стоимость внедрения (4 000 000) + Стоимость технической поддержки (239 353) = 971 400 + 4 000 000 + 239 353 = 5 210 752 руб.
Так, ценовая политика топовых BPMS-решений варьируется в пределах 608 тыс.руб., что, по меркам крупных компаний, практически не играет роли, когда речь идет о достаточно масштабном внедрении. Поэтому при выборе решения из приведенных выше BPMS-систем следует руководствоваться, в первую очередь, применимостью к исследуемому процессу. С точки зрения логики разработки процесса в BPMS, он должен состоять из следующих шагов:
Запрос из ИФНС поступает сотрудникам банка на почту. Далее документы проходят этап распознавания Flexi Capture, после чего поступают в BPMS-систему.
В IBM LotusNotes встраивается модуль, позволяющий по запуску из BPMS-системы регистрировать документы. После запуска триггера Требования и Поручения автоматически объединяются в ЭЦП по дате и номеру поручения, штампуются и запускается процесс в системе LotusNotes для регистрации входящих. Документы регистрируются и откладываются в отдельные папки с соответствующим номером ЭЦП и Требования в нем.
Автоматически в базе ExcelRep (описание в п. 2.1) данные по контрагентам сверяются с их ИНН и счетами. После чего происходит детальная проверка на возможность исполнения процесса (проверка наличия парных Требования и Поручения, проверка дат открытия и закрытия счетов в зависимости от периода запроса и т.д.) путем запуска БП карточки «Запросы от ИФНС» с подтверждением в открывшейся форме данных, которые нужно проверить. После этого из документов (их XML после распознавания), прошедших проверку на возможность исполнения, вытягиваются поля контрагентов, ИНН, счетов, документов, периодов запроса, по которым будет произведен поиск данных, после чего направляются в свои реестры записей в карточке запроса.
Перечень выбранных полей из предыдущего этапа по каждому отдельному документу (ЭЦП - пары Требования и Поручения) направляется после сохранения карточки запроса во внутренние банковские системы для поиска запрашиваемых документов (АКД, Новая Афина, Ритейл - подробнее - в п. 3.3 Таблица 14). Реакцией запуска интеграции будет кнопка «Сохранить» в карточке запроса от ИФНС.
Системы получают списки данных и производят внутренний поиск документов по встроенным в интеграцию реестрам, после чего автоматически сохраняют прикрепленные в карточках контрагентов этих систем документы в заведенные на 2 шаге папки, определенные на локальном компьютере.
После добавления данных в папку срабатывает триггер и запускает повторное открытие IBM LotusNotes для регистрации исходящих документов. Параллельно с этим автоматически собираются файлы формата PDF с заполненными по алгоритму данными по каждому Требованию. Данные документы прикрепляются к карточкам регистрации, после чего завершается регистрация и уведомляются сотрудники Операционного департамента (ОД) о необходимости проверить документы.
Сотрудники ОД проверяют данные и отправляют из в ИФНС по соответствующему адресу в электронной форме.
Данный процесс, разумеется, требует контроля хотя бы 1 сотрудника Канцелярии и хотя бы 1 сотрудника Операционного департамента. Для данного процесса, исходя из собственного аналитического опыта работы в компаниях-интеграторах из BPMS-систем наиболее всего подходит система класса bpm (не в том числе CRM, как, например, bpm'online) из разряда Pega. Данная система специализируется на решениях подобного формата.
Также при выборе системы для последующего анализа необходимо учесть, что на текущий момент (как было упомянуто в п. 2.1) документы из Инспекции Федеральной налоговой службы поступают в форматах PDF, doc/docx, JPEG, PNG. Следовательно, независимо от технологии решения, для любой автоматизации потребуется перевод документов в цифровой формат. А при том, что ни в одном из текущих BPMS-решений нет встроенных технологий OCR (Optical Character Recognition), позволяющих на должном уровне обеспечить распознавание текста, следовательно, дополнительно нужно подключать партнера/решение, позволяющего это осуществить. Из наиболее распространенных компаний, специализирующихся на оптическом (и даже интеллектуальном - ICR, позволяющим распознавать рукописный текст) распознавании символов, можно выделить российского вендора Abbyy, партнерские отношения с которым налажены не только у выбранной в итоге компании-интегратора, но и (среди компаний, предоставляющих BPMS-решения) у Pega BPM (особенности технологии распознавания Abbyy и стоимость данного решения приведены в п. 2.2.2). Так, исходя из всего вышеописанного, можно прийти к выводу, что среди BPMS-систем оптимальной с точки зрения данного процесса является Pega BPM, которая и будет рассмотрена нами в более детальном анализе в п. 2.3.
2.2.2 Технология OCR на примере Abbyy FineReader и Abbyy Flexi Capture
Как было указано в предыдущем пункте, ни одно автоматизированное решение на сегодняшний день не обладает встроенной OCR такого уровня, который позволил бы избежать интеграции с профессиональными сервисами, специализирующимися на распознавании текста.
Оптическое распознавание символов (OCR) представляет собой набор различных этапов обработки, выполняемых в случаях, когда текст должен быть распознан из изображения, фотографии или документа PDF.
Рисунок 5 Технология OCR [7]
На протяжении последних 5 лет лидером российского рынка в сегменте потокового ввода данных, по оценкам аналитиков компании IDC, является компания Abbyy. По данным исследования, рыночная доля компании в последние годы превысила 60%, а доходы ABBYY от проектов в этом сегменте выросли более чем на 30% в рублевом эквиваленте [1].
Компания имеет два основных решения, специализирующихся на распознавании символов:
FineReader Engine - это набор инструментов OCR, предназначенный для преобразования отсканированных документов и PDF-файлов в различные форматы, такие как простой текст, форматы Office, HTML, PDF с возможностью поиска или XML.
FlexiCapture Engine - это SDK для обработки форм, разделения документов, классификации и извлечения данных.
В таблице 2 представлены основные различия данных систем.
Таблица 2 Сравнение Abbyy FineReader Engine и Abbyy FlexiCapture Engine [7]
|
Сравнительный признак / Название модуля Abbyy |
FineReader Engine |
FlexiCapture Engine |
|
|
Общие |
|||
|
1 |
2 |
3 |
|
|
Использование по назначению |
Прямая классификация для интеграции и использования вместе с полнотекстовым механизмом OCR - с целью, чтобы узнать, какой тип документа обрабатывается в настоящее время, например, квитанция/ счет |
FlexiCapture Engine позволяет обнаруживать документы и отделять их от потока изображений, классифицировать документы и улучшать извлечение данных. Классификация традиционно является очень важной частью извлечения данных |
|
|
Используемые технологии классификации |
Классификация изображений и контента |
Изображение, макет и контент |
|
|
Технологии классификации |
|||
|
Классификатор изображения |
Да, шаблон изображения (расположение черных пикселей) и текстовый анализ с OCR больших текстовых элементов, таких как заголовки |
||
|
Классификатор на основе контента |
Да, статистическая классификация текстовой информации, генерируемой процессом OCR |
Да, FlexiLayouts позволяет определять пользовательский набор правил с использованием ключевых слов, поисков в базе данных и регулярных выражений |
|
|
Поддержка пользовательских правил |
Пользовательские функции из документа могут быть интегрированы, например, на основе анализа макета или текста |
Возможны пользовательские деревья решений. Шаблоны основаны на собственных правилах извлечения и содержат сценарии для управления классификацией и процессом извлечения данных |
|
|
Классификация по шаблонам |
Нет |
Да, макеты Flexi |
|
|
Диапазон классификации |
Подход на одной странице (изображения) |
Одиночные (изображения) страницы с классификацией изображений и подходом к документам, одно и несколько изображений / PDF с помощью макетов Flexi |
|
|
Обучение и настройка классификации |
|||
|
Повышение квалификации |
Классы документов создаются путем обучения предопределенных коллекций документов |
||
|
GUI для обучения |
Нет, но образец кода доступен |
Да, с FlexiLayout Studio в качестве инструмента разработки |
|
|
API для обучения |
Да, пример кода доступен |
Нет - с целью создания макета Flexi |
|
|
Создание шаблона |
Нет |
- Нет - для классификации страниц на основе предизображений - Да - для разделения и классификации документов |
|
|
Обучающий набор |
3 или более изображений каждого типа документа, чтобы автоматически обучать новый класс |
3 или более изображений каждого типа документа - автоматически обучать новый класс - ручная настройка правил классификации или дерева |
|
|
Прочие |
|||
|
Разделение документов |
Нет |
Да, на основе определений документов, макетов Flexi или шаблонов фиксированных форм |
|
|
Поддержка страниц приложения |
Нет |
Да, страницы приложения не используются для классификации, но все еще являются частью документа |
|
|
Доступность классификации |
Модуль добавлен в FineReader Engine 11 |
Функция по умолчанию в FlexiCapture Engine. Дополнительные приложения, поставляемые с SDK: FlexiCapture Standalone и FlexiLayout Studio для разработки определения документа, классификации и логики извлечения данных |
Исходя из представленной выше таблицы, отражающей основные отличительные особенности (технические и влияющие на бизнес-логику) программ, мы можем сделать вывод о том, какой модуль Abbyy оптимальнее всего подходит для нашего процесса (наиболее важные положения подчеркнуты в таблице). Итак, Flexi Capture поддерживает шаблоны классификации, благодаря которым происходит определение типа документа по заданному алгоритму (например, соответствие основных блоков текста заранее определенным координатам на странице в зависимости от типа документа) и наложение его на стандартный шаблон документа этого типа (соответствие форме по КНД: 1165013 - для Требования и 1165014 - для Поручения). Эта функция необходима для проверки того, действительно ли поступивший документ является основанием для его исполнения, поэтому по данному пункту FineReader уже не подходит. Следующим важным критерием является возможность определения диапазона документа и его распознавание по страницам: так как Требования и Поручения могу содержать в себе разное количество страниц в зависимости от количества запрашиваемых документов в них, заложить алгоритм работы с определенным количеством страниц не представляется возможным.
В связи с этим, мы приходим к выводу о том, что наиболее подходящим решением в нашем случае является программа Abbyy Flexi Capture, с которой в дальнейшем и будет выстраиваться взаимодействие выбранного решения автоматизации. Для того, чтобы в рамках итогового решения (в случае отсутствия встроенной технологии OCR) учитывать затраты на распознавание входящих документов из ИФНС, ниже в таблице 3 рассчитаем трудозатраты и стоимость решения Abbyy Flexi Capture.
Таблица 3 Расчет трудозатрат и стоимости технологии распознавания символов
|
Название ресурса |
Трудозатраты, чел.час |
Ставка руб./ч |
Затраты с НДС, руб. |
|
|
Аналитик Abbyy |
472 |
4 500,00 ? |
2 124 000,00 ? |
|
|
1.1 Этап 1. Обследование и проектирование |
200 |
4 500,00 ? |
900 000,00 ? |
|
|
1.2 Этап 2. Создание решения |
80 |
4 500,00 ? |
360 000,00 ? |
|
|
1.3 Этап 3. Приемо-сдаточные испытания |
120 |
4 500,00 ? |
540 000,00 ? |
|
|
1.4 Этап 4. Опытно-промышленная эксплуатация |
72 |
4 500,00 ? |
324 000,00 ? |
|
|
Инженер Abbyy |
392 |
5 000,00 ? |
1 960 000,00 ? |
|
|
1.1 Этап 1. Обследование и проектирование |
160 |
5 000,00 ? |
800 000,00 ? |
|
|
1.2 Этап 2. Создание решения |
120 |
5 000,00 ? |
600 000,00 ? |
|
|
1.3 Этап 3. Приемо-сдаточные испытания |
40 |
5 000,00 ? |
200 000,00 ? |
|
|
1.4 Этап 4. Опытно-промышленная эксплуатация |
72 |
5 000,00 ? |
360 000,00 ? |
|
|
РП Abbyy |
102 |
4 500,00 ? |
459 000,00 ? |
|
|
1.1 Этап 1. Обследование и проектирование |
20 |
4 500,00 ? |
90 000,00 ? |
|
|
1.2 Этап 2. Создание решения |
28 |
4 500,00 ? |
126 000,00 ? |
|
|
1.3 Этап 3. Приемо-сдаточные испытания |
10 |
4 500,00 ? |
45 000,00 ? |
|
|
1.4 Этап 4. Опытно-промышленная эксплуатация |
44 |
4 500,00 ? |
198 000,00 ? |
|
|
Итого трудозатраты и стоимость Abbyy |
966 |
4 543 000,00 ? |