从数字和扫描文档提取数据
使用流中 AI 支持的分析,从发票、采购订单、表单和其他非结构化或半结构化文档中提取结构化数据。通过将文档内容转换为可在业务流程中使用的结构化信息,自动化数据输入和处理工作流。使用人工审查工作流来验证提取的数据,并确保关键业务决策的准确性。
所需的 Edition
| 适用于:Lightning Experience |
| 查看支持的版本。 |
| 此功能需要 MuleSoft for Flow:IDP 加载项。Professional Edition 需要 API 访问权限加载项。要购买,请联系您的 Salesforce 客户主管。 |
| 文档处理功能需要在“设置”中打开 Einstein 生成式 AI,并为贵组织配置和启用 Data 360。 |
| MuleSoft for Flow:Agentforce 使用的 IDP 功能需要 Foundations 或 Agentforce 1 版本。要购买这些版本,请联系您的 Salesforce 客户主管。 |
流如何从文档提取数据
文档处理漏斗包含以下步骤:
- 配置:在自动化应用程序中创建文档处理配置,以定义您想要处理的每种文档类型的提取规则和输出结构。这些配置指定了要提取哪些字段、它们的数据类型以及帮助 Einstein 理解文档结构的可选说明。
- 正在处理:在流中使用“从文档中提取数据”操作提交文档进行分析。该操作使用指定的文档处理配置来提取数据,并将结果作为结构化信息返回,您可以在后续流元素中使用。该操作返回包含所有提取数据的动态 Apex 类,然后您可以在后续流元素中使用这些数据,或者如果您有审查框架,也可以发送这些数据进行人工审查。
- 审核:使用屏幕流实施审查工作流,以验证提取的数据,并处理置信度得分低或需要手动验证的个案。这确保了数据质量,并为关键业务流程提供了人力监督。
文档处理配置
文档处理配置定义了要从文档中提取的特定字段、表格和列。您还可以提供人类语言说明,以帮助 Einstein 更好地理解文档结构。
例如,您可以定义发票编号等字段,并包含“从文档中供应商名称旁边的字段提取发票编号”等说明。
置信度得分和数据质量
Einstein 分配置信度分数,以表示对每个提取字段准确性的确定程度。置信度得分高表示提取可靠;得分低表示手动审核。
在屏幕流中配置审查工作流,以在置信度分数低于指定阈值时路由文档进行人工审查。
审查框架和在环人员
查看工作流允许您在业务流程使用之前验证提取的数据。在以下情况下使用它们:
- 提取数据的置信度得分较低
- 业务规则需要手动批准
- 您想要在决策前验证数据准确性
- 合规要求要求人力监督
审核框架由管理整个流程的编排和为人工审核提供界面的屏幕流组成。
基于流类型的人工审查工作流
审核工作流的结构因您使用的流类型而异:
- 相同的流路径:“从文档提取数据”操作和“查看提取的数据”屏幕位于相同的流路径上(例如,在屏幕流或自动启动流中)。内容文档 ID 和文档处理配置 ID 会自动填充,变量传递最少。此模式更简单,用于任务和使用单个流上传文件的示例。请参阅审查合同数据和更新记录示例。
- 不同路径(记录触发和批准):当流被记录触发时(例如,当文件被附加到记录时),您不能在同一流中添加屏幕元素。您使用调用流编配的批准操作,编配调用屏幕流。提取在父流中运行;审查在屏幕流中运行。因为它们在不同的路径上,所以您必须在每个阶段创建变量,以便在父流、编排和屏幕流之间传递数据(内容文档 ID、提取输出、审查的数据)。用户在批准体验中看到审查屏幕。请参阅处理和审查附加文档示例。
支持的文档类型
此功能可以处理各种类型的业务文档,包括:
- 发票和收据
- 采购订单和合同
- 表格和应用程序
- 报表和报表
- 扫描的文档和图像
AI 模型可以从数字文档、扫描图像和手写文本中提取文本字段(名称、地址、描述)、数值(金额、数量、百分比)、日期和时间戳以及结构化数据(表格、表单)。
- 定义要从文档提取哪些数据
文档处理配置定义了从文档提取数据的结构和规则。通过创建这些配置,您可以定义要查找的信息以及如何组织提取的数据。在流中处理文档或设置审查工作流之前,此步骤至关重要。 - 设置文档提取和路由到人工审核
将“从文档提取数据”操作添加到流,配置文档和配置输入,存储输出,并添加在满足条件时路由到人工审核的决策。 - 为提取的文档数据构建审核界面
使用“审查提取的数据”组件创建屏幕流,以便审查者可以在流继续之前验证和修改提取的数据。 - 将审核的数据路由到记录和业务流程
从编配中调用屏幕流,分支查看结果,并添加操作,以更新记录、发送通知或使用查看的数据触发其他流程。 - 文档处理工作流示例
逐步解说将文档提取与人工审核相结合的端到端示例,从单个流路径到具有批准和编排的记录触发流。 - 文档处理限制和定额
在适用的情况下,流中文档处理的限制符合 Data 360。MuleSoft 文档处理文档中记录了提示限制和其他特定于文档处理的定额。
本文章是否解决您的问题?
请与我们共享您的想法,以便我们进行改进!

