Del via


Table.AddFuzzyClusterColumn

Syntaks

Table.AddFuzzyClusterColumn(table as table, columnName as text, newColumnName as text, optional options as nullable record) as table

Omtrent

Føjer en ny kolonne newColumnName til table med repræsentative værdier for columnName. Repræsentanterne opnås ved at matche værdierne i columnNamefor hver række.

Der kan inkluderes et valgfrit sæt options for at angive, hvordan nøglekolonnerne skal sammenlignes. Indstillingerne omfatter:

  • Culture: Tillader gruppering af poster baseret på kulturspecifikke regler. Det kan være et vilkårligt gyldigt kulturnavn. En kulturindstilling med "ja-JP" grupperer f.eks. poster baseret på den japanske kultur. Standardværdien er "", som grupperer baseret på den invariante engelske kultur.
  • IgnoreCase: En logisk værdi (sand/falsk), der tillader nøglegruppering, hvor der ikke skelnes mellem store og små bogstaver. Når true f.eks. er "Druer" grupperet med "druer". Standardværdien er true.
  • IgnoreSpace: En logisk værdi (sand/falsk), der gør det muligt at kombinere tekstdele for at finde grupper. Når sand er "Gra pes" f.eks. grupperet med "Druer". Standardværdien er true.
  • SimilarityColumnName: Et navn på kolonnen, der viser ligheden mellem en inputværdi og den repræsentative værdi for det pågældende input. Standardværdien er null, og i så fald tilføjes der ikke en ny kolonne for ligheder.
  • Threshold: Et tal mellem 0,00 og 1,00, der angiver den lighedsscore, hvor to værdier grupperes. "Druer" og "Graes" (mangler "p") grupperes f.eks. kun, hvis denne indstilling er angivet til mindre end 0,90. En grænse på 1,00 tillader kun nøjagtige match. Bemærk, at et fuzzy "nøjagtigt match" kan ignorere forskelle, f.eks. kasse, ordrækkefølge og tegnsætning. Standardværdien er 0,80.
  • TransformationTable: En tabel, der tillader gruppering af poster baseret på brugerdefinerede værditilknytninger. Den skal indeholde kolonnerne "Fra" og "Til". "Druer" er f.eks. grupperet med "Rosiner", hvis der er angivet en transformationstabel med kolonnen "Fra", der indeholder "Druer" og kolonnen "Til", der indeholder "Rosiner". Bemærk, at transformationen anvendes på alle forekomster af teksten i transformationstabellen. Med ovenstående transformationstabel grupperes "Druer er søde" også med "Rosiner er søde".

Eksempel 1

Find de repræsentative værdier for medarbejdernes placering.

brug

Table.AddFuzzyClusterColumn(
    Table.FromRecords(
        {
            [EmployeeID = 1, Location = "Seattle"],
            [EmployeeID = 2, Location = "seattl"],
            [EmployeeID = 3, Location = "Vancouver"],
            [EmployeeID = 4, Location = "Seatle"],
            [EmployeeID = 5, Location = "vancover"],
            [EmployeeID = 6, Location = "Seattle"],
            [EmployeeID = 7, Location = "Vancouver"]
        },
        type table [EmployeeID = nullable number, Location = nullable text]
    ),
    "Location",
    "Location_Cleaned",
    [IgnoreCase = true, IgnoreSpace = true]
)

output

Table.FromRecords(
    {
        [EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
        [EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
        [EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
        [EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
        [EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
        [EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
        [EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
    },
    type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)