电话 400-111-2626

# 横向连接

# 笛卡尔积现象

横向连接节点,会存在笛卡尔积现象。在数据工厂中,判断笛是否出现笛卡尔积的公式为:

经横向连接计算后的数据总量 >(n+m)*2

n:表 A 的数据量
m:表 B 的数据量

案例演示: 将以下两张表,用“姓名”作为连接字段,进行横向连接。 image 6.png

横向连接后的总数据量=5*5+4*4=41
(m+n)*2=(9+9)*2=36
41>36

所以计算结果将触发笛卡尔积。

由于图中横向连接后的数据总量大于(表A+表B)的数据总和的 2 倍。

注:不论是左连接、右连接还是内连接,只要计算出来的结果符合公式规则,都将触发笛卡尔积限制。

解决方案: 当结果出现笛卡尔积时,需要调整数据工厂配置或者修改原始数据(删除或新增数据,使得上述公式不成立即可)。 如上述示例中的笛卡尔积,我们可以通过修改横向连接的配置解决:将“部门”,也设为连接字段,此时,两张表中出现“姓名”和“部门”数据都一样的的概率会大大降低,触发笛卡尔积限制的概率也将降低。

image 7.png

1 / 0