문서에서 추출할 데이터 정의
문서 처리 구성은 문서에서 데이터를 추출하는 구조와 규칙을 정의합니다. 해당 구성을 만들어 찾을 정보 및 추출된 데이터를 구성하는 방법을 정의합니다. 플로에서 문서를 처리하거나 검토 워크플로를 설정하려면 먼저 이 단계를 수행해야 합니다.
필수 Edition
| 지원 제품: Lightning Experience |
| 지원되는 Edition을 확인하세요. |
| 이 기능을 사용하려면 MuleSoft for Flow가 필요합니다. IDP 추가 기능. Professional Edition에는 API 액세스 추가 기능이 필요합니다. 구매하려면 Salesforce 계정 담당자에게 문의하십시오. |
| 문서 처리 기능은 설정에서 Einstein 생성형 AI를 켜고 조직에 대해 Data 360을 프로비저닝하고 활성화해야 합니다. |
| 플로용 MuleSoft: Agentforce 함께 사용되는 IDP 기능에는 Foundations 또는 Agentforce 1 Edition이 필요합니다. 해당 Edition을 구매하려면 Salesforce 계정 담당자에게 문의하십시오. |
| 필요한 사용자 권한 | |
|---|---|
| 문서 처리 구성 만들기, 읽기, 편집 및 삭제: | 문서 처리 구성 관리 |
문서에서 추출할 데이터를 정의하기 전에 다음을 확인하십시오.
- 처리할 유형의 샘플 문서(PDF, 이미지 또는 스캔된 문서)
- 문서에서 추출할 특정 데이터 필드 목록
- 각 필드의 데이터 유형에 대한 Knowledge(텍스트, 숫자, 통화 또는 날짜)
- 처리할 문서 구조 및 레이아웃 이해
- Flow Builder 기본 숙지(워크플로의 다음 단계)
자동화 앱에서 문서 처리 구성을 만들어 처리할 각 유형의 문서에 대한 지침 및 출력 구조를 정의합니다. 문서 처리 구성을 만드는 동안 문서를 업로드하고 추출 프로세스를 테스트할 수 있습니다.
- 자동화 앱에서 문서 처리 탭을 선택합니다.
- 새 문서 처리 구성을 클릭합니다.
-
파일 업로드를 클릭하고 문서 처리 구성을 만드는 데 사용할 예제 문서를 선택합니다.
업로드가 완료되면 완료를 클릭합니다.
-
업로드된 문서를 기반으로 필드 및 테이블을 자동으로 추가하려면 자동 추출 사용을 클릭합니다.
샘플 문서를 스캔하고 검색된 모든 필드를 자동으로 식별하고 추출하므로 권장되는 접근 방식입니다.
- 옵션:
필요한 경우 구성에 추가 필드 및 테이블을 수동으로 추가합니다.
- 출력 패널에서 필드를 클릭하고 필드 추가를 클릭합니다.
- 이름, 필드 유형(문자열, 숫자, 부울), 경우에 따라 Einstein 추출 프로세스 도중 고려할 추가 세부 사항과 함께 프롬프트 명령을 제공합니다.
- 추가를 클릭합니다.
- 필요에 따라 계속 필드를 추가합니다.
- 테이블을 추가하려면 출력 패널에서 테이블 탭을 선택합니다.
- 테이블 추가를 클릭합니다.
- 이름, 경우에 따라 프롬프트 지침을 입력하고 추가를 클릭합니다.
- 테이블 이름을 클릭하고 열 탭을 선택합니다.
- 열 추가를 클릭합니다.
- 이름, 필드 유형, 경우에 따라 프롬프트 지침을 입력하고 추가를 클릭합니다.
자동 추출 후 필드 및 테이블을 수동으로 추가하거나 자동 추출 사용 대신 수동으로 만들기를 클릭하여 구성이 완전히 수동으로 생성되도록 선택할 수 있습니다. -
업로드된 문서를 분석하고 추출된 테이블 데이터를 보려면 테스트를 클릭합니다.
테스트 결과에 추출 정확도를 나타내는 신뢰도 점수와 함께 각 필드 및 테이블에 대해 추출된 값이 표시됩니다.
- 구성 만들기를 완료한 후 문서 처리 구성의 이름을 입력하고 저장을 클릭합니다.
이제 문서 처리 구성이 저장되어 사용할 준비가 되었습니다. 구성은 문서에서 추출할 모든 필드 및 데이터 유형을 정의합니다. 다음을 확인하여 구성이 완료되었는지 확인할 수 있습니다.
- 모든 필수 필드가 적절한 데이터 유형으로 정의됨
- 테스트 분석에 정확한 추출 결과가 표시됩니다.
- 사용 사례에 대해 허용되는 신뢰도 점수
이제 이 구성을 문서에서 데이터 추출 작업으로 플로에서 사용할 수 있으며, 검토 프레임워크를 만들어 추출된 데이터를 확인할 수 있습니다.
예
다음은 인보이스를 처리하기 위한 필드 구성의 예입니다.
| 필드 이름 | API 이름 | 필드 유형 | 프롬프트 명령 |
|---|---|---|---|
| 회사 이름 | CompanyName | 텍스트 | 인보이스 머리글에서 공급업체 또는 회사 이름 추출 |
| 주문 번호 | OrderNumber | 텍스트 | 일반적으로 문서 상단 근처에서 인보이스 또는 주문 번호 찾기 |
| 구매자 이름 | PurchaserName | 텍스트 | 청구 섹션에서 고객 또는 구매자 이름 추출 |
| 합계 | TotalAmount | 통화 | 일반적으로 인보이스 하단에서 기한 총액 찾기 |
| 세금 | TaxAmount | 통화 | 별도로 나열된 경우 세액 추출 |
이 예는 일반 인보이스 데이터에 대한 필드 정의를 구조화하는 방법을 보여줍니다. 프롬프트 지침을 통해 Einstein 문서에서 각 정보를 찾을 수 있는 위치를 이해할 수 있습니다.
문서에서 추출할 데이터를 정의한 후 문서 추출 및 사람이 검토할 라우팅을 설정합니다. 문서 추출 설정 및 Human Review 라우팅을 참조하십시오.
이 기사를 통해 문제를 해결했습니까?
개선을 위한 의견을 보내주세요.

