Вы находитесь здесь:
Определение данных для извлечения из документов
Конфигурации обработки документов определяют структуру и правила извлечения данных из документов. Создавая эти конфигурации, вы определяете, какие сведения искать и как систематизировать извлеченные данные. Этот шаг важен перед обработкой документов в потоках или настройкой бизнес-правил.
Требуемые версии
| Доступно в версиях: Lightning Experience |
| Просмотр поддерживаемых версий. |
| Данная функция требует MuleSoft для Flow: Дополнительная функция IDP. Версия Professional Edition требует дополнительного доступа к API. Для покупки обратитесь к менеджеру по работе с клиентами Salesforce. |
| Функции обработки документов требуют включения искусственного интеллекта Einstein в настройках и инициализации и включения Data 360 для вашей организации. |
| MuleSoft для Flow: Функции IDP, используемые с Agentforce, требуют выпуска Foundations или Agentforce 1. Чтобы приобрести эти версии, обратитесь к менеджеру по работе с клиентами Salesforce. |
| Требуемые полномочия пользователя | |
|---|---|
| Для создания, чтения, редактирования и удаления конфигураций обработки документов: | Управление конфигурациями обработки документов |
Прежде чем определить данные для извлечения из документов, убедитесь в наличии:
- Образцы документов нужного типа (PDF-документы, изображения или отсканированные документы)
- Список конкретных полей данных, которые нужно извлечь из документов
- Knowledge типов данных для каждого поля (текст, число, валюта или дата)
- Понимание структуры и макета документа для обработки
- Базовое знание Flow Builder (для следующих этапов бизнес-правила)
Создайте конфигурации обработки документов в приложении автоматизации, чтобы определить инструкции и структуру вывода для каждого типа документа для обработки. При создании конфигурации обработки документов можно загрузить документы и протестировать процесс извлечения.
- В приложении «Автоматизация» выберите вкладку «Обработка документов».
- Нажмите «Создать конфигурацию обработки документов».
-
Нажмите «Загрузить файлы» и выберите образец документа для использования в качестве основы при создании конфигурации обработки документов.
По завершении загрузки нажмите кнопку «Готово».
-
Чтобы автоматически добавлять поля и таблицы на основе загруженного документа, щелкните «Использовать автоматическое извлечение».
Это рекомендуемый метод, поскольку он сканирует образец документа и автоматически определяет и извлекает все найденные поля.
- Дополнительно:
При необходимости добавьте вручную в конфигурацию дополнительные поля и таблицы.
- На панели «Выводы» нажмите «Поля» и нажмите «Добавить поле».
- Предоставьте имя, тип поля (строка, число, логическое значение) и, по желанию, инструкции-напоминания с дополнительными сведениями для Einstein, которые нужно учитывать в процессе извлечения.
- Нажмите кнопку «Добавить».
- При необходимости продолжайте добавлять поля.
- Чтобы добавить таблицы, выберите вкладку «Таблицы» на панели «Выводы».
- Нажмите «Добавить таблицу».
- Предоставьте имя, по желанию, подскажите инструкции и нажмите «Добавить».
- Нажмите на имя таблицы и выберите вкладку «Столбцы».
- Нажмите «Добавить столбец».
- Введите имя, тип поля, по желанию подсказки и нажмите «Добавить».
Чтобы добавить поля и таблицы вручную после автоматического извлечения или создать конфигурацию вручную, нажмите кнопку «Создать вручную» вместо «Использование автоматического извлечения». -
Нажмите «Тестировать», чтобы проанализировать загруженный документ и просмотреть извлеченные данные таблицы.
Результаты тестирования отображают извлеченные значения для каждого поля и таблицы, а также оценки надежности, указывающие на точность извлечения.
- После завершения создания конфигурации введите имя конфигурации обработки документов и нажмите «Сохранить».
Конфигурация обработки документов теперь сохранена и готова к использованию. Конфигурация определяет все поля и типы данных для извлечения из документов. Вы можете проверить завершение конфигурации, проверив следующее:
- Все обязательные поля определяются соответствующими типами данных
- Анализ теста показывает точные результаты извлечения
- Рейтинги надежности приемлемы для вашего сценария использования
Данная конфигурация теперь может использоваться в потоках посредством действия «Извлечение данных из документа», а также можно создать инфраструктуры проверки для проверки извлеченных данных.
Ниже указан пример конфигураций полей для обработки счетов:
| Имя поля | API-имя | Тип поля | Инструкция-напоминание |
|---|---|---|---|
| Название компании | CompanyName | Текст | Извлечение имени поставщика или компании из заголовка счета |
| Номер заказа | OrderNumber | Текст | Найдите счет или номер заказа, обычно вверху документа |
| Имя покупателя | PurchaserName | Текст | Извлечение имени клиента или покупателя из раздела выставления счета |
| Итого | TotalAmount | Валюта | Найдите общую сумму задолженности, обычно внизу счета |
| Налог | Стоимость налога | Валюта | Извлечь сумму налога, если он указан отдельно |
Этот пример показывает, как структурировать определения полей для распространенных данных счета. Оперативные инструкции помогают Einstein понять, где искать каждую часть информации в документе.
После определения данных для извлечения из документов настройте извлечение документов и маршрутизацию на проверку человеком. См. раздел «Настройка извлечения документов и маршрутизации на проверку человека».

