Поделиться через


Table.FuzzyGroup

Синтаксис

Table.FuzzyGroup(table as table, key as any, aggregatedColumns as list, optional options as nullable record) as table

О сайте

Группирует строки table, нечетко сопоставляя значения в указанном столбце keyдля каждой строки. Для каждой группы создается запись, содержащая ключевые столбцы (и их значения) вместе с любыми агрегированными столбцами, указанными в aggregatedColumns. Эта функция не может гарантировать возврат фиксированного порядка строк.

Необязательный набор options может быть включен, чтобы указать, как сравнивать ключевые столбцы. Варианты включают:

  • Culture: позволяет группировать записи на основе правил, специфичных для конкретной культуры. Это может быть любое допустимое имя культуры. Например, параметр "Культура" с значением "ja-JP" группирует записи на основе японской культуры. Значение по умолчанию — "", которое группируется на основе инвариантных английских настроек культуры.
  • IgnoreCase: логическое значение (true/false), позволяющее группировать ключи без учета регистра. Например, если значение равно true, "Виноград" группируется с "виноградом". Значение по умолчанию — true.
  • IgnoreSpace: логическое значение (true/false), позволяющее объединять текстовые части для поиска групп. Например, если значение true, "Gra pes" группируется с "Виноград". Значение по умолчанию — true.
  • SimilarityColumnName: имя столбца, показывающее сходство между входным значением и репрезентативным значением для этого ввода. Значение по умолчанию равно NULL, в этом случае новый столбец для сходства не будет добавлен.
  • Threshold: число от 0,00 до 1.00, указывающее оценку сходства, по которой будут сгруппированы два значения. Например, "Виноград" и "Graes" (где отсутствует "p") группируются только в том случае, если заданный параметр имеет значение менее 0.90. Пороговое значение 1.00 допускает только точные совпадения. (Обратите внимание, что нечеткое "точное совпадение" может игнорировать различия, такие как регистр, порядок слов и знак препинания.) Значение по умолчанию — 0,80.
  • TransformationTable: таблица, которая позволяет группировать записи на основе сопоставлений настраиваемых значений. Он должен содержать столбцы From и To. Например, "Виноград" группируется с "Изюмом", если предоставляется таблица преобразования со столбцом "От", содержащим "Виноград", и столбцом "К", содержащим "Изюм". Обратите внимание, что преобразование будет применено ко всем случаям текста в таблице преобразования. С приведенной выше таблицей преобразования "Виноград сладкий" также будет сгруппирован с "Изюм сладкий".

Пример 1

Группировать таблицу с добавлением агрегатного столбца [Count], содержащего количество сотрудников в каждом месте (each Table.RowCount(_)).

использование

Table.FuzzyGroup(
    Table.FromRecords(
        {
            [EmployeeID = 1, Location = "Seattle"],
            [EmployeeID = 2, Location = "seattl"],
            [EmployeeID = 3, Location = "Vancouver"],
            [EmployeeID = 4, Location = "Seatle"],
            [EmployeeID = 5, Location = "vancover"],
            [EmployeeID = 6, Location = "Seattle"],
            [EmployeeID = 7, Location = "Vancouver"]
        },
        type table [EmployeeID = nullable number, Location = nullable text]
    ),
    "Location",
    {"Count", each Table.RowCount(_)},
    [IgnoreCase = true, IgnoreSpace = true]
)

выход

Table.FromRecords({
    [Location = "Seattle", Count = 4],
    [Location = "Vancouver", Count = 3]
})