Вы находитесь здесь:
Извлечение данных из цифровых и отсканированных документов
Извлекайте структурированные данные из счетов, заказов на покупку, форм и других неструктурированных или полуструктурированных документов посредством анализа на основе искусственного интеллекта в потоке. Автоматизируйте бизнес-процессы ввода и обработки данных, преобразовывая содержимое документа в структурированную информацию, которая может использоваться в бизнес-процессах. Используйте бизнес-правила проверки для проверки извлеченных данных и обеспечения точности важных бизнес-решений.
Требуемые версии
| Доступно в версиях: Lightning Experience |
| Просмотр поддерживаемых версий. |
| Данная функция требует MuleSoft для Flow: Дополнительная функция IDP. Версия Professional Edition требует дополнительного доступа к API. Для покупки обратитесь к менеджеру по работе с клиентами Salesforce. |
| Функции обработки документов требуют включения искусственного интеллекта Einstein в настройках и инициализации и включения Data 360 для вашей организации. |
| MuleSoft для Flow: Функции IDP, используемые с Agentforce, требуют выпуска Foundations или Agentforce 1. Чтобы приобрести эти версии, обратитесь к менеджеру по работе с клиентами Salesforce. |
Как поток извлекает данные из документов
Конвейеры обработки документов состоят из следующих этапов:
- Конфигурация: Создайте конфигурации обработки документов в приложении автоматизации, чтобы определить правила извлечения и структуру вывода для каждого типа обрабатываемого документа. Эти конфигурации определяют, какие поля извлекать, их типы данных и дополнительные инструкции, которые помогут Einstein понять структуру документа.
- Обработка: Используйте действие извлечения данных из документа в потоках для отправки документов на анализ. Действие использует указанную конфигурацию обработки документа для извлечения данных и возвращает результаты в виде структурированных сведений, которые можно использовать в последующих элементах потока. Действие возвращает динамический класс Apex, содержащий все извлеченные данные, которые потом можно использовать в последующих элементах потока или отправить на человеческую проверку при наличии инфраструктуры проверки.
- Проверка: Внедрите проверку бизнес-правил посредством потоков окон для проверки извлеченных данных и обработки обращений, где рейтинг надежности низкий или требуется ручная проверка. Это обеспечивает качество данных и обеспечивает человеческий надзор за важными бизнес-процессами.
Конфигурации обработки документов
Конфигурация обработки документов определяет определенные поля, таблицы и столбцы для извлечения из документов. Вы также можете предоставить инструкции на человеческом языке, которые помогут Einstein лучше понять структуру документа.
Например, можно определить поля, например, «Номер счета» и добавить инструкции, например, «Извлечь номер счета из поля рядом с именем поставщика в документе».
Рейтинги надежности и качество данных
Einstein назначает рейтинги надежности, чтобы указать, насколько она уверена в точности каждого извлеченного поля. Высокие рейтинги надежности обозначают надежное извлечение; более низкие рейтинги предполагают проверку вручную.
Настройте бизнес-правила проверки в потоках окон для маршрутизации документов для проверки человеком, когда рейтинги надежности падают ниже указанных порогов.
Проверка инфраструктур и человек в цикле
Просмотр бизнес-правил позволяет проверить извлеченные данные перед использованием бизнес-процессов. Используйте их, когда:
- Рейтинг надежности извлеченных данных низкий
- Бизнес-правила требуют утверждения вручную
- Вы хотите проверить точность данных перед принятием решений
- Требования к соблюдению предписывают надзор со стороны человека
Инфраструктура проверки состоит из оркестрации, которая управляет общим процессом, и потока окон, предоставляющего интерфейс для человеческой проверки.
Бизнес-правило проверки человека на основе типа потока
Структура бизнес-правил проверки зависит от используемого типа потока:
- Одинаковый путь потока: Действие «Извлечение данных из документа» и окно «Проверка извлеченных данных» расположены на одном пути потока (например, в потоке окон или автоматически запущенном потоке). Код документа содержимого и код конфигурации обработки документа заполняются автоматически, а передача переменной минимальна. Данная схема упрощается и используется в задачах и в примере, использующем единый поток с загрузкой файлов. См. «Просмотр данных контракта и обновление записей» пример.
- Разные пути (запущенные записью и утверждение): Если поток запущен записью (например, при вложении файла в запись), невозможно добавить элемент окна в этот же поток. Вы используете действие утверждения, которое вызывает оркестрацию потока, а оркестрация вызывает поток окна. Выполнение извлечения в родительском потоке; просмотр выполнения в потоке окон. Поскольку они находятся на разных путях, необходимо создать переменные на каждом этапе для передачи данных (код документа содержимого, вывод извлечения, проверенные данные) между родительским потоком, оркестрацией и потоком окон. Пользователь видит окно проверки во взаимодействии «Утверждения». См. Пример процесса и проверки вложенных документов.
Поддерживаемые типы документов
Эта возможность может обрабатывать разные типы бизнес-документов, включая:
- Счета и квитанции
- Заказ-наряды и контракты
- Формы и заявки
- Доклады и заявления
- Отсканированные документы и изображения
Модели на основе искусственного интеллекта могут извлекать текстовые поля (имена, адреса, описания), числовые значения (суммы, количества, проценты), даты и временные отметки, а также структурированные данные (таблицы, формы) из цифровых документов, сканированных изображений и текста, написанного от руки.
Ниже указаны конкретные примеры использования организациями обработки документов:
- Обработка счета: Извлеките номер счета, имя поставщика, сумму и крайний срок из PDF-счетов для автоматического создания или обновления записей счета в Salesforce.
- Управление заказом покупки: Обрабатывайте заказ-наряды для автоматического обновления систем запаса и запуска бизнес-правил переупорядочения, когда уровни запасов падают ниже пороговых значений.
- Маршрутизация приложения: Извлеките данные формы из заявок на кредит или заявок на работу, чтобы автоматически перенаправлять их соответствующим группам на основе анализа содержимого.
- Соответствие контракта: Проверьте условия контракта и автоматически запустите бизнес-правила утверждения при обнаружении определенных условий.
- Определение данных для извлечения из документов
Конфигурации обработки документов определяют структуру и правила извлечения данных из документов. Создавая эти конфигурации, вы определяете, какие сведения искать и как систематизировать извлеченные данные. Этот шаг важен перед обработкой документов в потоках или настройкой бизнес-правил. - Настройка функции извлечения документов и маршрутизации для проверки человеком
Добавьте действие «Извлечение данных из документа» в поток, настройте вводные данные документа и конфигурации, сохраните вывод и добавьте решение, перенаправляющее на проверку человека при соблюдении условий. - Создание интерфейса проверки для извлеченных данных документа
Создайте поток окон с компонентом «Проверка извлеченных данных», чтобы проверяющие могли проверить и изменить извлеченные данные до продолжения потока. - Перенаправление проверенных данных в записи и бизнес-процессы
Вызов потока окон из оркестрации, ответвление по результатам проверки и добавление действий для обновления записей, отправки уведомлений или запуска других процессов с проверенными данными. - Пример бизнес-правил обработки документов
Пройдитесь по примерам, сочетающим извлечение документов с проверкой человеком, от одного пути потока до потоков, запущенных записью, с утверждением и оркестрацией. - Ограничения и планы продаж для обработки документов
Ограничения для обработки документов в потоках соответствуют Data 360, где это применимо. Ограничения по срокам и другие планы продаж для обработки документов документируются в документации по обработке документов MuleSoft.

