您在此处:
半联接和反联接的限制和注意事项
半联接和反联接是基于相关记录的存在筛选数据的强大工具。为了确保准确的结果和最佳的性能,请在开始时考虑这些特定的行为。
不支持的操作:
cogroup和联接不能在同一查询中使用。- 不支持总计和小计。
- 不支持布尔值筛选器逻辑。
- 混合和连接不能在同一个查询中组合。
优化性能:
- 在运行联接之前,筛选第二个数据集。联接性能与第二个数据集返回的数据量成正比。
- 在对查询结果进行任何预测之前,执行连接语句。例如,如果您的查询包含
foreach语句,例如q = foreach q generate count(q1) as 'A';,请在联接后运行它。
支持的筛选器
- 筛选器可以应用于主要和次要数据集。
联接限制
| 限制 | 详细信息 |
|---|---|
| 数据集限制 | 您最多可以加入两个数据集。要合并更多数据集(最多六个),请考虑使用混合。 |
| 字段配对 | 数据集之间最多允许五个字段配对。 |
| 操作顺序 | 数据集必须在探索前连接。如果首先添加分组、评测或筛选器,联接数据源将不可用。 |
| 自联接 | 支持合并相同数据集中的行。当在自联接中应用筛选器时,只有一个数据集可见。全局筛选器应用于联接中的主要数据集。 |
| 主要数据集焦点 | 多面化和记录级操作仅应用于主要数据集。 |

