Table.AddFuzzyClusterColumn
Syntaks
Table.AddFuzzyClusterColumn(table as table, columnName as text, newColumnName as text, optional options as nullable record) as table
Om
Legger til en ny kolonne newColumnName
i table
med representative verdier for columnName
. Representantene innhentes ved å samsvare verdier i columnName
for hver rad.
Et valgfritt sett med options
kan inkluderes for å angi hvordan du sammenligner nøkkelkolonnene. Alternativene omfatter:
-
Culture
: Tillater gruppering av poster basert på kulturspesifikke regler. Det kan være et hvilket som helst gyldig kulturnavn. Et kulturalternativ forja-JPgrupperer for eksempel poster basert på den japanske kulturen. Standardverdien er «», som grupperer basert på den invariante engelske kulturen. -
IgnoreCase
: En logisk verdi (sann/usann) som tillater nøkkelgruppering som ikke skilles mellom store og små bokstaver. Når for eksempel sann, grupperes «Druer» med «druer». Standardverdien er sann. -
IgnoreSpace
: En logisk verdi (sann/usann) som gjør det mulig å kombinere tekstdeler for å finne grupper. Når for eksempel sann, grupperes «Gra pes» med «Druer». Standardverdien er sann. -
SimilarityColumnName
: Et navn på kolonnen som viser likheten mellom en inndataverdi og den representative verdien for inndataene. Standardverdien er null, og i så fall legges det ikke til en ny kolonne for likheter. -
Threshold
: Et tall mellom 0,00 og 1,00 som angir likhetspoengsummen som to verdier skal grupperes etter. «Druer» og «Graes» (mangler «p») grupperes bare sammen hvis dette alternativet er satt til mindre enn 0,90. En terskel på 1,00 tillater bare nøyaktige treff. (Vær oppmerksom på at et uklart «nøyaktig treff» kan ignorere forskjeller som foringsrør, ordrekkefølge og tegnsetting.) Standardverdien er 0,80. -
TransformationTable
: En tabell som tillater gruppering av poster basert på egendefinerte verditilordninger. Den skal inneholde «Fra»- og «Til»-kolonner. «Druer» grupperes for eksempel med «Rosiner» hvis en transformasjonstabell leveres med «Fra»-kolonnen som inneholder «Druer» og «Til»-kolonnen som inneholder «Rosiner». Vær oppmerksom på at transformasjonen vil bli brukt på alle forekomster av teksten i transformasjonstabellen. Med transformasjonstabellen ovenfor vil «Druer er søte» også grupperes med «Rosiner er søte».
Eksempel 1
Finn de representative verdiene for plasseringen av de ansatte.
bruk
Table.AddFuzzyClusterColumn(
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle"],
[EmployeeID = 2, Location = "seattl"],
[EmployeeID = 3, Location = "Vancouver"],
[EmployeeID = 4, Location = "Seatle"],
[EmployeeID = 5, Location = "vancover"],
[EmployeeID = 6, Location = "Seattle"],
[EmployeeID = 7, Location = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text]
),
"Location",
"Location_Cleaned",
[IgnoreCase = true, IgnoreSpace = true]
)
utdata
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
[EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
[EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
[EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
[EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)