如何确定 Spark 是否正在重写数据

首先打开写入阶段的 SQL DAG。 向上滚动到作业页面顶部,然后单击关联的 SQL 查询:

暂存到 SQL

现在应该会看到 DAG。 如果没有,请滚动一下,你就能看到它。

SQL DAG

如果要执行“删除”或“更新”操作,请查看编写器写入的数据量与预期数据量。 如果看到写入的数据多于预期,则可能要重写数据:

写入统计信息

如果要进行合并,合并节点具有明确的数据重写量统计信息。