위치:
Semi 및 Anti 조인에 대한 제한 사항 및 고려 사항
Semi 및 안티 조인은 관련 레코드 존재를 기반으로 데이터를 필터링하는 강력한 도구입니다. 정확한 결과와 최적의 성능을 보장하려면 시작할 때 다음 특정 동작을 고려하십시오.
지원되지 않는 작업:
cogroup및 조인을 동일한 쿼리에서 사용할 수 없습니다.- 합계 및 소계는 지원되지 않습니다.
- 부울 필터 논리는 지원되지 않습니다.
- 같은 쿼리에서 블렌드와 조인을 결합할 수 없습니다.
성능 최적화:
- 조인을 실행하기 전에 두 번째 데이터 집합을 필터링합니다. 조인 성능은 두 번째 데이터 집합에서 반환되는 데이터의 양에 직접 비례합니다.
- 쿼리 결과에 대한 프로젝션 전에 조인 문을 실행합니다. 예를 들어, 쿼리에
q = foreach q generate count(q1) as 'A';와 같은foreach문이 포함되어 있는 경우 조인 후 실행합니다.
지원되는 필터
- 필터는 기본 및 보조 데이터 집합에 모두 적용할 수 있습니다.
조인 제한 사항
| 제한 사항 | 세부 사항 |
|---|---|
| 데이터 집합 제한 | 최대 두 개의 데이터 집합을 조인할 수 있습니다. 더 많은 데이터 집합을 결합하려면(최대 6개) 블렌드를 사용하는 것이 좋습니다. |
| 필드 페어링 | 데이터 집합 간 최대 5개의 필드 페어링이 허용됩니다. |
| 작업 순서 | 데이터 집합을 탐색하기 전에 조인해야 합니다. 그룹, 측정값 또는 필터가 먼저 추가되면 데이터 소스 조인을 사용할 수 없습니다. |
| 셀프 조인 | 동일한 데이터 집합 내의 행 결합이 지원됩니다. 셀프 조인에 필터가 적용되면 데이터 집합이 하나만 표시됩니다. 조인의 기본 데이터 집합에 전역 필터가 적용됩니다. |
| 기본 데이터 집합 포커스 | 패싯 및 레코드 수준 작업은 기본 데이터 집합에만 적용됩니다. |

