处理重复值

可以通过转换处理重复的值集,这些转换可以删除数据中的重复项。 或者,可以筛选数据以仅显示重复项,以便可以专注于它们。

警告

Power Query 区分大小写。 在处理重复值时,Power Query 会考虑文本的大小写,这可能会导致意外结果。 解决方法是,用户可以在删除重复值之前应用大写或小写转换。

对于本文,这些示例使用 ID、Category 和 Total 列的下表

包含 ID、类别和总计列的初始示例表的屏幕截图。

删除重复值

可以执行的操作之一是从表中删除重复值。

  1. 选择包含重复值的列。

  2. 转到“主页”选项卡。

  3. 在“减少行”组中,选择“删除行”。

  4. 从下拉菜单中,选择“删除重复值”。

    显示“删除行”下“删除重复项”选项的位置的屏幕截图。

警告

无法保证删除重复值时会选择一组重复值中的第一个实例。 若要详细了解如何保留排序,请转到“保留排序”。

删除多列中的重复值

在本例中,你会使用表中的所有列来标识和删除重复值。

突出显示多个列中重复项的初始表的屏幕截图。

有四行是重复的。 目标是删除这些重复行,以便表中只有唯一行。 从表中选择所有列,然后选择“删除重复项”。

该操作的结果提供要查找的表。

从所有列中删除重复项的最终表的屏幕截图。

注意

也可以使用列的子集执行此操作。

从单个列中删除重复值

在本例中,你会仅使用表中的“类别”列来标识和删除重复值。

标识类别列中重复项的初始表的屏幕截图。

你希望删除这些重复值,并且只保留唯一值。 若要从“类别”列中删除重复值,请选择该重复值,然后选择“删除重复值”。

该操作的结果提供要查找的表。

从“类别”列中删除重复项的最终表的屏幕截图。

保留重复值

可以使用重复值执行的另一个操作是仅保留表中找到的重复值。

  1. 选择包含重复值的列。

  2. 转到“主页”选项卡。

  3. 在“减少行”组中,选择“保留行”。

  4. 从下拉菜单中,选择“保留重复值”。

    显示“保留重复项”选项在“保留行”下的位置的屏幕截图。

从多个列保留重复值

在本例中,你会使用表中的所有列来标识和保留重复值。

用于保留多个列重复项的初始表的屏幕截图。

有四行是重复的。 本示例中的目标是仅保留表中重复的行。 选择表格中的所有列,然后选择“保留重复值”。

该操作的结果提供要查找的表。

最后一个表的屏幕截图,其中仅包含多个列中的重复行。

保留单个列的重复值

在本例中,你会仅使用表中的“ID”列来标识和保留重复值。

用于保留单个列中重复项的初始表。

在本例中,有多个重复值,并且只保留表中的重复值。 若要从 ID 列保留重复值,请选择 ID 列,然后选择“保留重复值”。

该操作的结果提供要查找的表。

仅包含单个列中重复行的最终表。

数据分析工具