Você está aqui:
Limitações e considerações sobre junções semia e antia
Semi e antijunções são ferramentas eficientes para filtrar dados com base na existência de registros relacionados. Para garantir resultados precisos e desempenho ideal, considere estes comportamentos específicos ao começar.
Operações sem suporte:
- Não é possível usar
cogroupe junções na mesma consulta. - Não há suporte para totais e subtotais.
- Não há suporte à lógica de filtro booleano.
- Combinações e junções não podem ser combinadas na mesma consulta.
Otimização do desempenho:
- Filtre o segundo conjunto de dados antes de executar uma junção. O desempenho da junção é diretamente proporcional à quantidade de dados retornada pelo segundo conjunto de dados.
- Execute declarações join antes de qualquer projeção nos resultados da consulta. Por exemplo, se a sua consulta incluir uma instrução
foreach, comoq = foreach q generate count(q1) as 'A';, execute-a após a junção.
Filtros suportados
- Os filtros podem ser aplicados aos conjuntos de dados primários e secundários.
Limitações de junção
| Limitação | Detalhes |
|---|---|
| Limite do conjunto de dados | Você pode unir no máximo dois conjuntos de dados. Para combinar mais conjuntos de dados (até seis), considere usar uma combinação. |
| Combinações de campo | São permitidos até cinco pares de campos entre conjuntos de dados. |
| Ordem de operações | Os conjuntos de dados devem ser unidos antes da exploração. Unir a fonte de dados ficará indisponível se agrupamentos, medidas ou filtros forem adicionados primeiro. |
| Autojunções | Há suporte para combinar linhas no mesmo conjunto de dados. Quando um filtro é aplicado em uma junção automática, apenas um conjunto de dados fica visível. Filtros globais são aplicados ao conjunto de dados primário na junção. |
| Foco principal do conjunto de dados | Ações de facetamento e no nível do registro são aplicadas exclusivamente ao conjunto de dados primário. |

