Sie befinden sich hier:
Einschränkungen und Überlegungen für Semi- und Anti-Verknüpfungen
Semi- und Anti-Verknüpfungen sind leistungsstarke Tools zum Filtern von Daten anhand von verwandten Datensätzen. Beachten Sie zu Beginn die folgenden spezifischen Verhaltensweisen, um genaue Ergebnisse und optimale Leistung zu gewährleisten.
Nicht unterstützte Vorgänge:
cogroupund Verknüpfungen können nicht in derselben Abfrage verwendet werden.- Summen und Zwischensummen werden nicht unterstützt.
- Boolesche Filterlogik wird nicht unterstützt.
- Mischungen und Verknüpfungen können nicht in derselben Abfrage kombiniert werden.
Optimizing Performance (Leistungsoptimierung):
- Filtern Sie das zweite Datenset, bevor Sie eine Verknüpfung ausführen. Die Verknüpfungsleistung ist direkt proportional zur Menge der vom zweiten Datenset zurückgegebenen Daten.
- Führen Sie Verknüpfungsanweisungen vor Projektionen der Abfrageergebnisse aus. Wenn Ihre Abfrage beispielsweise eine
foreach-Anweisung wieq = foreach q generate count(q1) as 'A';enthält, führen Sie sie nach der Verknüpfung aus.
Unterstützte Filter
- Filter können sowohl auf das primäre als auch auf das sekundäre Datenset angewendet werden.
Einschränkungen beitreten
| Einschränkung | Details |
|---|---|
| Obergrenze für Datensets | Sie können maximal zwei Datensets verknüpfen. Wenn Sie mehr Datensets (bis zu sechs) kombinieren möchten, sollten Sie eine Mischung verwenden. |
| Field Pairings (Feldzahlungen) | Zwischen Datensets sind bis zu fünf Feldpaarungen zulässig. |
| Reihenfolge der Vorgänge | Datensets müssen vor der Erkundung verknüpft werden. "Datenquelle verknüpfen" ist nicht mehr verfügbar, wenn Gruppierungen, Maßeinheiten oder Filter zuerst hinzugefügt werden. |
| Selbstverknüpfungen | Das Kombinieren von Zeilen innerhalb desselben Datensets wird unterstützt. Wenn ein Filter in einer Selbstverknüpfung angewendet wird, ist nur ein Datenset sichtbar. Globale Filter werden auf das primäre Datenset in der Verknüpfung angewendet. |
| Fokus auf primäres Datenset | Aktionen auf Bereiche und Datensatzebene werden ausschließlich auf das primäre Datenset angewendet. |

