Table.AddFuzzyClusterColumn
Syntaksi
Table.AddFuzzyClusterColumn(table as table, columnName as text, newColumnName as text, optional options as nullable record) as table
Noin
Lisää uuden sarakkeen newColumnName
table
edustavilla columnName
arvoilla . Edustajat saadaan täsmäyttämällä sumeasti arvot kohdassa columnName
kullekin riville.
Valinnainen joukko options
voidaan sisällyttää määrittämään, miten avainsarakkeita verrataan. Vaihtoehtoja ovat seuraavat:
-
Culture
: Mahdollistaa tietueiden ryhmittelyn maa-asetuskohtaisten sääntöjen perusteella. Se voi olla mikä tahansa kelvollinen maa-asetuksen nimi. Esimerkiksi Maa-asetusja-JPryhmittelee tietueet japanin maa-asetuksen perusteella. Oletusarvo on "", joka ryhmittelee muuttumattoman englannin maa-asetuksen perusteella. -
IgnoreCase
: Looginen arvo (tosi/epätosi), joka sallii kirjainkooltaan riippumattoman avainryhmittämisen. Esimerkiksi kun arvo on tosi, Viinirypäleet ryhmitetään arvon "viinirypäleet" kanssa. Oletusarvo on true. -
IgnoreSpace
: Looginen arvo (true/false), joka sallii tekstiosien yhdistämisen ryhmien löytämiseksi. Esimerkiksi kun arvo on tosi, "Viinirypäleet" ryhmitettää arvon "Viinirypäleet" kanssa. Oletusarvo on true. -
SimilarityColumnName
: Sarakkeen nimi, joka näyttää syötteen arvon ja kyseisen syötteen edustavan arvon samankaltaisuuden. Oletusarvo on tyhjäarvo, jolloin uutta saraketta samankaltaisuuksille ei lisätä. -
Threshold
: Luku väliltä 0,00–1,00, joka määrittää samankaltaisuuspistemäärän, jolla kaksi arvoa ryhmitellään. Esimerkiksi Rypäleet ja Ryäleet (p puuttuu) ryhmitetään yhteen vain, jos tämän asetuksen arvo on pienempi kuin 0,90. Raja-arvo 1,00 sallii vain tarkat vastaavuudet. (Huomaa, että sumea "tarkka vastaavuus" saattaa ohittaa erot, kuten johdannaisen, sanajärjestyksen ja välimerkit.) Oletusarvo on 0,80. -
TransformationTable
: Taulukko, joka sallii tietueiden ryhmittelyn mukautettujen arvoyhteyksien perusteella. Sen tulee sisältää sarakkeet From ja To. Esimerkiksi Rypäleet ryhmitelee arvon "Rusinat", jos annetaan muunnostaulukko, jossa on From-sarakkeessa Rypäleet ja To-sarakkeessa Rusinat. Ota huomioon, että muunnoksia käytetään tekstin kaikissa esiintymiskertoissa muunnostaulukossa. Yllä olevassa muunnostaulukossa "Rypäleet ovat makeita" ryhmitetään myös "Rusinat ovat makeita".
Esimerkki 1
Selvitä työntekijöiden arvot työntekijöiden sijaintia varten.
käyttö
Table.AddFuzzyClusterColumn(
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle"],
[EmployeeID = 2, Location = "seattl"],
[EmployeeID = 3, Location = "Vancouver"],
[EmployeeID = 4, Location = "Seatle"],
[EmployeeID = 5, Location = "vancover"],
[EmployeeID = 6, Location = "Seattle"],
[EmployeeID = 7, Location = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text]
),
"Location",
"Location_Cleaned",
[IgnoreCase = true, IgnoreSpace = true]
)
Output
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
[EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
[EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
[EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
[EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)