Документооборотень: о чем нужно помнить, внедряя СЭД

Электронные документы - это хорошо. Это лучше, чем лоток принтера,  который нужно каждый день опустошать, чтобы писать от руки резолюции. Электронный архив - вообще отлично, можно не забивать бумажками целые комнаты.

Но что делать, если контрагенты упрямо не желают приобщаться к цивилизации и шлют бумажки заказными письмами? А менее продвинутые сотрудники считают, что электронная подпись - это, когда её фотошопишь... На помощь приходят распознавание и потоковый ввод документов.

Почерк сканера

Распознавание документов - весьма узкоспециальная задача. Искажение при печати, помарки, какая-нибудь скрепка, закрывающая часть заголовка, - всё это не замечает наш человеческий мозг, наточенный за тысячи лет на распознавание образов. Но компьютер от такого зависнет в ступоре.

Или буквы, похожие друг на друга, поменяются при распознавании местами. Или начнётся вторжение символов из другого языка, или вообще спецсимволов, потому что “так распозналось”. В общем, компьютер тут находится в сложном и печальном положении посетителя поликлиники, пытающегося разобрать рецепт от врача.

Кириллический символизм

Вдвойне сложной становится эта задача в России. Скажем откровенно - кириллица - это не самый популярный алфавит в мире. Да, по распространенности в интернете русский язык в разных исследованиях занимает то второе, то третье место (соревнуемся с немцами), но языки на основе латиницы распространены как минимум на порядок шире.

Рассчитывать на приоритетное внимание к русскому языку или хотя бы кириллице в целом не приходится. Да что уж там, даже такое модное сейчас распознавание голоса не всегда работает с русским языком - чего уж говорить про более скучные решения.

Таким образом, надеяться на доброго иностранного дядю не приходится - ему выгоднее оттачивать распознавание иных текстов. На помощь приходит отечественная компания ABBYY, занимающаяся далеко не только латиницей. ABBYY FlexiCapture и сама по себе работает неплохо, а с набором дополнительных модулей превращается в спасение для русскоязычных документов.

Не бумажка, а броня

Впрочем, документ мало "просто" (на самом деле - очень сложно) распознать. Положить результат на расшаренный диск или отправить по емейлу - слабая замена бизнес-процессам и уж точно не слишком юридически значимая. Это должно быть элементом системы документооборота или хотя бы электронного архива. Могут быть свои нюансы с финансовыми или техническими документами, но эти нюансы вполне решаемые.

Таким образом, систему ввода и хранения данных и систему распознавания надо подружить с решением от ABBYY или Преферентум. А значит, придется одновременно и хорошо знать внедрённую или внедряемую систему работы с документами и досконально разбираться в распознавании текста. Скажем прямо - вероятность существования и тех, и других специалистов в одной отдельно взятой компании стремится к нулю.

А документы, к тому же, бывают разные, поэтому для них нужны будут разные шаблоны. Можно, конечно, долго и с интересом изобретать велосипед, но долго тестировать его не получится - систему запускать надо, она бизнесу нужна. А продолжать тестировать в продакшне - лучший рецепт катастрофы.

В общем, в данном случае изобретать велосипед не стоит, а стоит искать решение уже с готовыми шаблонами хотя бы для самых основных документов. А то, чего в готовых шаблонах нет, пускай интегратор дорабатывает.

Стоимость выделки овчинки

В общем, ради чего всё затевается? Если вкратце, то документы можно обрабатывать гораздо быстрее, вероятность потери - гораздо ниже, а централизованная бухгалтерия перестаёт подсознательно ассоциироваться с подземельем Мордора: всё попадает туда достаточно быстро даже из филиалов и региональных офисов. Да и вообще, взаимодействие фронт-офиса и бэк-офиса должно быть быстрым в любой клиентоориентированной отрасли - в том же банке, например.

Автоматизация нарастает как снежный ком. Там, где реализован потоковый ввод данных, можно добавить дополнительные сценарии.

Например, приходит счёт-фактура, вводится в систему, распознаётся. Автоматика может сразу же проверить правильность расчёта НДС. Автоматика может сразу выслать документы ответственным сотрудникам. В рамках системы электронного документооборота решение может быть принято также в режиме онлайн, и сформированный электронный документ пойдёт дальше.

Прошли те времена, когда по офису нужно было носить кипы бумаг. В общем, возникает то, что называют модным словом синергия - результат совмещения отдельных элементов оказывается больше, чем их сумма.

Разумеется, если бы всё вышенаписанное было правдой, рынок бы реагировал на это закупками подобных систем. Но что же с цифрами? На 2016 год глобальный рынок распознавания файлов уже перевалил за три миллиарда долларов, а в будущем обещает расти процентов по 14 в год. Как всегда, лидер - Северная Америка, и, как всегда, Азиатский регион развивается быстрее всех. В общем, ИТ-тренды для почти любого рынка выглядят одинаково.

И всё-таки, британские учёные научили нас - даже самое очевидное надо подтверждать актуальным цифрами. Подтверждаем!


01 июля 2018г. / Индустрия 4.0
7623 | Обсудить в   
Кирилл Кожевников
Автор блога АйТи
Чек-лист настоящих облаков
Как витать в облаках и не терять на этом деньги
Сервисы современного облака
10 главных технологических трендов на 2019 год
Кибер-шериф в цифровой Америке: DMCA
Верить нельзя никому. Мне - можно.
Масштаб и экономика кибер-угрозы: можно ли верить цифрам
Электронная, цифровая, прогрессивная
Инфобезопасность в компании: виновные и ответственные
Кибервор должен сидеть в кибертюрьме
пРи|||лиТЕ БNТкоиh NЛN МbI БYDЕМ пРиCbIлАТb пО 1 БайТу Ва|||иХ ДАННЫХ
Электронные архивы: рукописи не горят, не теряются и экономят время
Где хранить электронный архив: в облаках или под подушкой?
Банкоматы ломают не только кувалдой
Киберподкоп
Интернет чужих вещей
Где самое слабое звено?
Кирку в руки и полезай в шахту: вредоносный майнинг криптовалют
Главный вирус - между стулом и клавиатурой
Свободное плавание СЭД
И дела вести, и бобра спасти
Блокчейн - цепь неслучайностей
Телефоннер, сканертрон и роутербот против офисных сотрудников
Чем свободное ПО лучше, чем проприетарное?
Всевидящее складское око
Вкалывают роботы, счастливы банкиры


Еще по теме
Чек-лист настоящих облаков

Чек-лист настоящих облаков

Что такое облака на самом деле, чем они отличаются от виртуализации, кто действительно продаёт высокие технологии, а кто просто прикрывается модным термином ― баталии на этот счёт начали греметь уже много лет назад и до сих пор не стихают.

6829
Как витать в облаках и не терять на этом деньги

Как витать в облаках и не терять на этом деньги

Человеку со стороны может показаться, что «облака» ― это такой buzzword, который используют просто потому, что это (было) модно. Как искусственный интеллект в наше время или блокчейн немного раньше.

6940
Сервисы современного облака

Сервисы современного облака

Когда-то под видом облаков нам всем продавали в целом обычную аренду оборудования. Чуть позже начали предлагать виртуализацию, но без особой автоматизации и возможностей использования ресурсов по-умному.

8014