Сегодня мы рассказываем о технологии класса text mining — интеллектуальной обработке документов.
Эта технология включает в себя: классификацию документов на основе методов машинного обучения, выделение в документах информационных объектов и фактов, проверку документов с помощью настраиваемых лексических шаблонов и правил, анализ текста — морфологический, синтаксический и семантический — и анализ структуры и построение иерархической модели документа.
Везде, где применяется человеческий труд по чтению и пониманию неструктурированных документов или текстов, их обработке и структуризации, можно внедрить text mining в том или ином виде, будь то система «Антиплагиат» или ответы бота в чате.
Основные области применения text mining это:
Процесс закупочной деятельности компаний
Техническая поддержка
Маркетинг
Модернизация и автоматизация работы существующих ИС
Правовая экспертиза
Практическая польза
Преимущества использования технологии текстовой аналитики велики: это повышение скорости бизнес-процессов, связанных с обработкой документов,снижение нагрузки на персонал в части рутинных операций и повышение точности за счет исключения человеческого фактора.
В применении систем интеллектуальной обработки текста есть ещё один неочевидный плюс: сейчас компании стремятся к максимальной диджитализации и зачастую ставят IT-директорам отдельные KPI на внедрение интеллектуальных систем.
Сценарии использования
Сценариев использования технологии интеллектуальной обработки документов немало.
Автоматизация интеллекта информационных систем: автоматический ввод атрибутов документа в СЭД/CRM, автосогласование и маршрутизация документов в СЭД, выявление и исправление дубликации справочников и их синхронизация, нормализация данных для big data, сбор информации для аналитических отчётов.
Правовая экспертиза: автоматический анализ рисков и ошибок в договорах, конструктор доверенностей и аналитических записок, поиск по базам судебных решений и прецедентов, повышение качества документов путём выявления и исправления типовых ошибок, оформление документов в полном соответствии с требованиями.
Автоматическая обработка запросов регуляторов в организации: выделение нужных данных из общего потока входящих запросов, распознавание содержания запросов и направление их ответственным лицам, огромное увеличение скорости обработки запросов.
Обработка входящей клиентской документации в банках: автоматическое определение типа каждого документа, проверка комплектности и принадлежности, извлечение реквизитов, корректное заполнение всех форм, проведение дополнительных проверок, составление проекта письма-ответа с промежуточными и конечным результатами рассмотрения заявки.
Анализ и обработка входящих обращений граждан: присвоение обращению категории или тематики, адресная привязка, направление в профильное подразделение или ответственному сотруднику, контроль исполнительской дисциплиной при рассмотрении запросов.
Классификация обращений в Service Desk: распределение заявок на вторую линию техподдержки, интеграция сервисов текстового майнинга с Service Desk.
Автоматизация рассмотрения заявок по закупкам: автоматизация обработки пакетов документов участников тендера, типизации документов, проверки комплектности, кроссверки, проверки соответствий ТКП и ТЗ.
Наша платформа интеллектуальной обработки текстов Preferentum использует лучшие достижения в области компьютерной лингвистики и аналитики.
На базе технологии создан целый ряд прикладных решений и сервисов в области аналитики неструктурированной информации, которые сегодня успешно эксплуатируются крупными российскими заказчиками.
Концепции облачных сервисов уже более десяти лет, и на старте остро стояли вопросы зрелости. Сначала ― самих технологий, платформ, а потом и уровня сервиса. Крупным компаниям и государственным учреждениям не нужны сырые «неограниченные возможности» сделать что угодно. Им нужен законченный продукт, который полностью решает их задачу, часто весьма специфический, нужны гарантии устойчивости и надежности работы.
Для государственных организаций и госкомпаний требования безопасности критичны при выборе облачных ИТ-решений, поэтому и «Аплана Диджитал» и «Яндекс.Облако» уделяют особое внимание их безопасности.
Многие ИТ-руководители российских коммерческих компаний на вопрос «какие сложности у вас возникли с переводом сразу многих сотрудников на удаленную работу во время пандемии?» уверенно отвечают: особых технических сложностей не было. Объясняют они это просто: многие ключевые ИТ-сервисы уже были размещены в облаках. Купить и развернуть физические сервера и системы хранения в собственной инфраструктуре в цейтноте пандемии было бы совершенно нереально.