デジタルドキュメントおよびスキャン済みドキュメントからのデータの抽出
フローで AI を駆使した分析を使用して、請求書、注文書、フォーム、その他の非構造化または半構造化ドキュメントから構造化データを抽出します。ドキュメントコンテンツをビジネスプロセスで使用できる構造化情報に変換して、データ入力と処理のワークフローを自動化します。ヒューマンレビューワークフローを使用して、抽出されたデータを検証し、重要なビジネス上の意思決定の正確性を確保します。
必要なエディション
| 使用可能なインターフェース: Lightning Experience |
| サポートされているエディションを表示する。 |
| この機能を使用するには、MuleSoft for Flow: IDP アドオンが必要です。Professional Edition では、API アクセス アドオンが必要です。購入するには、Salesforce アカウントエグゼクティブにお問い合わせください。 |
| ドキュメント処理機能を使用するには、[設定] で Einstein 生成 AI を有効にし、組織で Data 360 をプロビジョニングして有効にする必要があります。 |
| MuleSoft for Flow: Agentforce で使用する IDP 機能には、Foundations Edition または Agentforce 1 Edition が必要です。これらのエディションを購入するには、Salesforce アカウントエグゼクティブにお問い合わせください。 |
フローでドキュメントからデータを抽出する方法
ドキュメント処理パイプラインは、次の手順で構成されます。
- 設定: オートメーションアプリケーションでドキュメント処理設定を作成し、処理するドキュメントの種類ごとに抽出ルールと出力構造を定義します。これらの設定では、抽出するフィールド、そのデータ型、および Einstein がドキュメント構造を理解するのに役立つ省略可能な命令を指定します。
- 処理: フローで [ドキュメントからデータを抽出] アクションを使用して、分析用のドキュメントを送信します。このアクションでは、指定されたドキュメント処理設定を使用してデータを抽出し、後続のフロー要素で使用できる構造化情報として結果を返します。このアクションは、抽出されたすべてのデータを含む動的 Apex クラスを返します。このクラスは、後続のフロー要素で使用したり、レビューフレームワークが設定されている場合は人間によるレビューに送信したりできます。
- レビュー: 画面フローを使用してレビューワークフローを実装し、抽出されたデータを検証し、信頼性スコアが低い場合や手動検証が必要な場合に対処します。これにより、データ品質を確保し、重要なビジネスプロセスを人間が監視できます。
ドキュメント処理設定
ドキュメント処理設定では、ドキュメントから抽出する特定の項目、テーブル、列を定義します。また、Einstein がドキュメント構造をより深く理解できるように、人間による指示を提供することもできます。
たとえば、[請求書番号] などの項目を定義して、[ドキュメントのベンダー名の横にある項目から請求書番号を抽出] などの指示を含めることができます。
信頼性スコアとデータ品質
Einstein は、抽出された各フィールドの精度を示す信頼性スコアを割り当てます。信頼性スコアが高いほど、信頼性の高い抽出が可能です。スコアが低いほど、手動レビューが可能です。
画面フローで、信頼性スコアが指定したしきい値を下回ったときにドキュメントを人間がレビューするようにレビューワークフローを設定します。
フレームワークと Human-in-the-Loop の確認
レビューワークフローを使用すると、抽出されたデータをビジネスプロセスで使用する前に検証できます。次の場合に使用します。
- 抽出されたデータの信頼性スコアが低い
- ビジネスルールの手動承認が必要
- 意思決定を行う前にデータの正確性を検証する
- コンプライアンス要件による人の監視
レビューフレームワークは、プロセス全体を管理するオーケストレーションと、人間がレビューするためのインターフェースを提供する画面フローで構成されます。
フロー種別に基づくヒューマンレビューワークフロー
レビューワークフローの構造は、使用するフローの種別によって異なります。
- 同じフローパス: [ドキュメントからデータを抽出] アクションと [抽出されたデータを確認] 画面が同じフローパス (画面フローや自動起動フローなど) 上にある。[コンテンツドキュメント ID] と [ドキュメント処理設定 ID] が自動入力され、変数の受け渡しが最小限に抑えられます。このパターンはより単純で、タスクや、ファイルのアップロードで 1 つのフローを使用する例で使用されます。「契約データの確認とレコードの更新の例」を参照してください。
- 異なるパス (レコードトリガーと承認): フローがレコードトリガーの場合 (たとえば、ファイルがレコードに添付されている場合)、同じフローに画面要素を追加することはできません。フローオーケストレーションをコールする承認アクションを使用し、オーケストレーションが画面フローをコールします。抽出は親フローで実行され、レビューは画面フローで実行されます。これらは異なるパス上にあるため、親フロー、オーケストレーション、画面フロー間でデータ (コンテンツドキュメント ID、抽出出力、レビュー済みデータ) を渡すには、各フェーズで変数を作成する必要があります。承認エクスペリエンスでユーザーにレビュー画面が表示されます。「添付ドキュメントの処理と確認の例」を参照してください。
サポートされるドキュメント種別
この機能では、次のようなさまざまな種類のビジネスドキュメントを処理できます。
- 請求書と領収書
- 購入注文と契約
- フォームとアプリケーション
- レポートおよびステートメント
- スキャンされた文書と画像
AI モデルは、デジタルドキュメント、スキャンされた画像、手書きテキストの両方からテキスト項目 (名前、住所、説明)、数値 (金額、数量、パーセント)、日付とタイムスタンプ、構造化データ (テーブル、フォーム) を抽出できます。
組織でドキュメント処理を使用する具体的な例を次に示します。
- 請求書処理: PDF 請求書から請求書番号、ベンダー名、金額、期日を抽出し、Salesforce で請求書レコードを自動的に作成または更新します。
- 購入注文管理: 在庫レベルがしきい値を下回ると、購入注文を処理して在庫システムを自動的に更新し、再注文ワークフローをトリガーします。
- 申込ルーティング: ローン申込または求職申込からフォームデータを抽出し、コンテンツ分析に基づいて自動的に適切なチームに転送します。
- Contract Compliance (契約コンプライアンス): 契約期間を検証し、特定の条項が検出されたときに承認ワークフローを自動的にトリガーします。
- ドキュメントから抽出するデータの定義
ドキュメント処理設定では、ドキュメントからデータを抽出するための構造とルールを定義します。これらの設定を作成することで、検索する情報と抽出されたデータの整理方法を定義します。このステップは、フローでドキュメントを処理したり、レビューワークフローを設定したりする前に不可欠です。 - ドキュメントの抽出とヒューマンレビューへのルーティングの設定
[ドキュメントからデータを抽出] アクションをフローに追加し、ドキュメントと設定の入力を設定し、出力を保存して、条件を満たしたときに人によるレビューに転送する決定を追加します。 - 抽出されたドキュメントデータの確認インターフェースの作成
[抽出されたデータを確認] コンポーネントを使用して画面フローを作成し、フローを続行する前にレビュー担当者が抽出されたデータを検証および変更できるようにします。 - レコードおよびビジネスプロセスへのレビュー済みデータの転送
オーケストレーションから画面フローをコールし、レビュー結果に基づいて分岐し、レコードの更新、通知の送信、レビュー済みデータを使用した他のプロセスのトリガーを行うアクションを追加します。 - ドキュメント処理ワークフローの例
1 つのフローパスから、承認とオーケストレーションを備えたレコードトリガーフローまで、ドキュメント抽出と人によるレビューを組み合わせたエンドツーエンドの例を紹介します。 - ドキュメント処理の制限と目標
フローのドキュメント処理の制限は、該当する場合は Data 360 に準拠します。プロンプト制限およびその他のドキュメント処理固有の目標は、MuleSoft ドキュメント処理ドキュメントに記載されています。

