Du er her:
Begrensninger og vurderinger for semi- og anti-koblinger
Semi- og anti-koblinger er kraftige verktøy for filtrering av data basert på eksistensen av relaterte poster. Vurder disse spesifikke virkemåtene når du går i gang for å sikre nøyaktige resultater og optimal ytelse.
Operasjoner som ikke støttes:
cogroupog koblinger kan ikke brukes i samme spørring.- Totaler og deltotaler støttes ikke.
- Boolsk filterlogikk støttes ikke.
- Blandinger og koblinger kan ikke kombineres i samme spørring.
Optimalisere ytelse:
- Filtrer det andre datasettet før du kjører en kobling. Samleytelse er direkte proporsjonal med mengden data som returneres av det andre datasettet.
- Utfør koblingssetninger før eventuelle projeksjoner i spørringsresultatene. Hvis for eksempel spørringen inneholder en
foreach-setning, for eksempelq = foreach q generate count(q1) as 'A';, kjører du den etter koblingen.
Filtre som støttes
- Filtre kan brukes på både primære og sekundære datasett.
Koblingsbegrensninger
| Begrensning | Detaljer |
|---|---|
| Datasettgrense | Du kan delta maksimalt to datasett. Vurder å bruke en blanding for å kombinere flere datasett (opptil seks). |
| Felttparinger | Opptil fem feltparinger er tillatt mellom datasett. |
| Rekkefølge av operasjoner | Datasett må slå sammen før utforsking. Samle datakilde blir utilgjengelig hvis grupperinger, målinger eller filtre legges til først. |
| Egenkoblinger | Kombinasjon av rader i det samme datasettet støttes. Når et filter brukes i en selvkobling, er bare ett datasett synlig. Globale filtre brukes på det primære datasettet i koblingen. |
| Primært datasettfokus | Fasettering og handlinger på postnivå brukes eksklusivt på det primære datasettet. |

