Сегодня мы рассказываем о технологии класса text mining — интеллектуальной обработке документов.
Эта технология включает в себя: классификацию документов на основе методов машинного обучения, выделение в документах информационных объектов и фактов, проверку документов с помощью настраиваемых лексических шаблонов и правил, анализ текста — морфологический, синтаксический и семантический — и анализ структуры и построение иерархической модели документа.
Везде, где применяется человеческий труд по чтению и пониманию неструктурированных документов или текстов, их обработке и структуризации, можно внедрить text mining в том или ином виде, будь то система «Антиплагиат» или ответы бота в чате.
Основные области применения text mining это:
Процесс закупочной деятельности компаний
Техническая поддержка
Маркетинг
Модернизация и автоматизация работы существующих ИС
Правовая экспертиза
Практическая польза
Преимущества использования технологии текстовой аналитики велики: это повышение скорости бизнес-процессов, связанных с обработкой документов,снижение нагрузки на персонал в части рутинных операций и повышение точности за счет исключения человеческого фактора.
В применении систем интеллектуальной обработки текста есть ещё один неочевидный плюс: сейчас компании стремятся к максимальной диджитализации и зачастую ставят IT-директорам отдельные KPI на внедрение интеллектуальных систем.
Сценарии использования
Сценариев использования технологии интеллектуальной обработки документов немало.
Автоматизация интеллекта информационных систем: автоматический ввод атрибутов документа в СЭД/CRM, автосогласование и маршрутизация документов в СЭД, выявление и исправление дубликации справочников и их синхронизация, нормализация данных для big data, сбор информации для аналитических отчётов.
Правовая экспертиза: автоматический анализ рисков и ошибок в договорах, конструктор доверенностей и аналитических записок, поиск по базам судебных решений и прецедентов, повышение качества документов путём выявления и исправления типовых ошибок, оформление документов в полном соответствии с требованиями.
Автоматическая обработка запросов регуляторов в организации: выделение нужных данных из общего потока входящих запросов, распознавание содержания запросов и направление их ответственным лицам, огромное увеличение скорости обработки запросов.
Обработка входящей клиентской документации в банках: автоматическое определение типа каждого документа, проверка комплектности и принадлежности, извлечение реквизитов, корректное заполнение всех форм, проведение дополнительных проверок, составление проекта письма-ответа с промежуточными и конечным результатами рассмотрения заявки.
Анализ и обработка входящих обращений граждан: присвоение обращению категории или тематики, адресная привязка, направление в профильное подразделение или ответственному сотруднику, контроль исполнительской дисциплиной при рассмотрении запросов.
Классификация обращений в Service Desk: распределение заявок на вторую линию техподдержки, интеграция сервисов текстового майнинга с Service Desk.
Автоматизация рассмотрения заявок по закупкам: автоматизация обработки пакетов документов участников тендера, типизации документов, проверки комплектности, кроссверки, проверки соответствий ТКП и ТЗ.
Наша платформа интеллектуальной обработки текстов Preferentum использует лучшие достижения в области компьютерной лингвистики и аналитики.
На базе технологии создан целый ряд прикладных решений и сервисов в области аналитики неструктурированной информации, которые сегодня успешно эксплуатируются крупными российскими заказчиками.
Как всегда, в случае внедрения инновационных решений, самое интересное ― это не общие слова, а разбор конкретных реализованных проектов. В них видны и характерные трудности, с которыми сталкивались заказчики, и практически достигнутые результаты внедрения облачных сервисов.
Время безжалостно: устаревают даже самые новые, мощные и современные сервера. Казалось бы, только что распаковывали новую коробку, а 3-4 года — и апгрейд неизбежен. Растут нагрузки, растут сами компании, усложняется бизнес, а денег на ИТ пропорционально больше владельцы тратить не хотят.
О цифровой трансформации бизнеса сегодня говорят все. Государством принята Национальная программа “Цифровая экономика”. Вместе с тем, у бизнеса пока нет четкого понимания, с какой стороны начинать “цифровизироваться”. Что такое цифровая трансформация? Это очередной, как сейчас модно говорить, “хайп”, о котором через несколько лет все забудут, или стратегическое направление развития, по которому рано или поздно должна пойти каждая компания?