Электронные документы - это хорошо. Это лучше, чем лоток принтера, который нужно каждый день опустошать, чтобы писать от руки резолюции. Электронный архив - вообще отлично, можно не забивать бумажками целые комнаты.
Но что делать, если контрагенты упрямо не желают приобщаться к цивилизации и шлют бумажки заказными письмами? А менее продвинутые сотрудники считают, что электронная подпись - это, когда её фотошопишь... На помощь приходят распознавание и потоковый ввод документов.
Распознавание документов - весьма узкоспециальная задача. Искажение при печати, помарки, какая-нибудь скрепка, закрывающая часть заголовка, - всё это не замечает наш человеческий мозг, наточенный за тысячи лет на распознавание образов. Но компьютер от такого зависнет в ступоре.
Или буквы, похожие друг на друга, поменяются при распознавании местами. Или начнётся вторжение символов из другого языка, или вообще спецсимволов, потому что “так распозналось”. В общем, компьютер тут находится в сложном и печальном положении посетителя поликлиники, пытающегося разобрать рецепт от врача.
Вдвойне сложной становится эта задача в России. Скажем откровенно - кириллица - это не самый популярный алфавит в мире. Да, по распространенности в интернете русский язык в разных исследованиях занимает то второе, то третье место (соревнуемся с немцами), но языки на основе латиницы распространены как минимум на порядок шире.
Рассчитывать на приоритетное внимание к русскому языку или хотя бы кириллице в целом не приходится. Да что уж там, даже такое модное сейчас распознавание голоса не всегда работает с русским языком - чего уж говорить про более скучные решения.
Таким образом, надеяться на доброго иностранного дядю не приходится - ему выгоднее оттачивать распознавание иных текстов. На помощь приходит отечественная компания ABBYY, занимающаяся далеко не только латиницей. ABBYY FlexiCapture и сама по себе работает неплохо, а с набором дополнительных модулей превращается в спасение для русскоязычных документов.
Впрочем, документ мало "просто" (на самом деле - очень сложно) распознать. Положить результат на расшаренный диск или отправить по емейлу - слабая замена бизнес-процессам и уж точно не слишком юридически значимая. Это должно быть элементом системы документооборота или хотя бы электронного архива. Могут быть свои нюансы с финансовыми или техническими документами, но эти нюансы вполне решаемые.
Таким образом, систему ввода и хранения данных и систему распознавания надо подружить с решением от ABBYY или Преферентум. А значит, придется одновременно и хорошо знать внедрённую или внедряемую систему работы с документами и досконально разбираться в распознавании текста. Скажем прямо - вероятность существования и тех, и других специалистов в одной отдельно взятой компании стремится к нулю.
А документы, к тому же, бывают разные, поэтому для них нужны будут разные шаблоны. Можно, конечно, долго и с интересом изобретать велосипед, но долго тестировать его не получится - систему запускать надо, она бизнесу нужна. А продолжать тестировать в продакшне - лучший рецепт катастрофы.
В общем, в данном случае изобретать велосипед не стоит, а стоит искать решение уже с готовыми шаблонами хотя бы для самых основных документов. А то, чего в готовых шаблонах нет, пускай интегратор дорабатывает.
В общем, ради чего всё затевается? Если вкратце, то документы можно обрабатывать гораздо быстрее, вероятность потери - гораздо ниже, а централизованная бухгалтерия перестаёт подсознательно ассоциироваться с подземельем Мордора: всё попадает туда достаточно быстро даже из филиалов и региональных офисов. Да и вообще, взаимодействие фронт-офиса и бэк-офиса должно быть быстрым в любой клиентоориентированной отрасли - в том же банке, например.
Автоматизация нарастает как снежный ком. Там, где реализован потоковый ввод данных, можно добавить дополнительные сценарии.
Например, приходит счёт-фактура, вводится в систему, распознаётся. Автоматика может сразу же проверить правильность расчёта НДС. Автоматика может сразу выслать документы ответственным сотрудникам. В рамках системы электронного документооборота решение может быть принято также в режиме онлайн, и сформированный электронный документ пойдёт дальше.
Прошли те времена, когда по офису нужно было носить кипы бумаг. В общем, возникает то, что называют модным словом синергия - результат совмещения отдельных элементов оказывается больше, чем их сумма.
Разумеется, если бы всё вышенаписанное было правдой, рынок бы реагировал на это закупками подобных систем. Но что же с цифрами? На 2016 год глобальный рынок распознавания файлов уже перевалил за три миллиарда долларов, а в будущем обещает расти процентов по 14 в год. Как всегда, лидер - Северная Америка, и, как всегда, Азиатский регион развивается быстрее всех. В общем, ИТ-тренды для почти любого рынка выглядят одинаково.
И всё-таки, британские учёные научили нас - даже самое очевидное надо подтверждать актуальным цифрами. Подтверждаем!
Что такое облака на самом деле, чем они отличаются от виртуализации, кто действительно продаёт высокие технологии, а кто просто прикрывается модным термином ― баталии на этот счёт начали греметь уже много лет назад и до сих пор не стихают.
Человеку со стороны может показаться, что «облака» ― это такой buzzword, который используют просто потому, что это (было) модно. Как искусственный интеллект в наше время или блокчейн немного раньше.
Когда-то под видом облаков нам всем продавали в целом обычную аренду оборудования. Чуть позже начали предлагать виртуализацию, но без особой автоматизации и возможностей использования ресурсов по-умному.