Juurisyyanalyysin yleiskatsaus
Juurisyyanalyysin (RCA) avulla voit löytää tiedoistasi piileviä yhteyksiä. Se voi esimerkiksi auttaa sinua ymmärtämään, miksi tiettyjen tapausten loppuun saattaminen kestää pidempään kuin toisten tai miksi jotkut tapaukset jumiutuvat korjauksiin ja toiset kulkevat sujuvasti. RCA näyttää keskeisimmät erot tällaisten tapausten välillä.
Pakolliset tiedot
RCA voi käyttää kaikkia tapaustason määritteitä, mittareita ja mukautettuja mittareita etsiäkseen yhteyksiä niiden ja jonkin valitsemasi mittarin välillä.
Paras esimerkki on sisällyttää kaikki mahdolliset tiedot tapaustason määritteenä ja antaa RCA:n valita, mikä määrite tosiasiassa vaikuttaa mittariin ja mikä ei.
RCA:n toimintatapa
RCA-algoritmi käsittelee puurakenteen, jossa jokainen solmu jakaa tietojoukon kahteen pienempään osaan. Tämä perustuu yhteen muuttujaan, jossa se löytää parhaan korrelaation jaetun muuttujan ja kohdemittarin välillä. Tämän perusteella voi nähdä tietojen piilevät yhteydet. Tässä RCA kertoo, mikä määritteiden yhdistelmä vaikuttaa tapaukseen mitenkin.
Tapa, jolla RCA löytää parhaan jaon
Ensin luodaan satojatuhansia mahdollisten jakojen yhdistelmiä. Sen jälkeen jokaista jakoa kokeillaan sen selvittämiseksi, kuinka hyvin se tosiasiassa jakaa tietojoukon kahteen osaan. Päämittarin varianssi lasketaan jokaisessa jaon osassa ja jokaisen jaon pistemäärä lasketaan seuraavalla tavalla:
pistemääräsplit_x = varianssivasen * tapausten määrävasen + varianssioikea * tapausten määräoikea
Tämän jälkeen kaikki jaot lajitellaan tämän pistemäärän perusteella ja parhaat jaot (alin pistemäärä) valitaan alusta. Luokan päämittarille (merkkijono) lasketaan Gini-epäpuhtaus varianssin sijaan.
RCA-esimerkki
Tässä esimerkissä haluamme nähdä tapauksen keston juurisyyn. Tiedoissa ovat tapaustason määritteet toimittajamaa, toimittajamaa, materiaali,kokonaismäärä ja kustannuspaikka. Tapausten keskimääräinen kesto on 46 tuntia.
Kun kunkin määriteen kutakin arvoa tarkastellaan erikseen, nähdään, että tapahtuman keston suurin vaikuttaja on toimittajakaupunkiGraz, joka pidentää tapauksen kestoa keskimäärin 15 tunnilla. Tämän alustavan analyysin perusteella näkee, että muut määritteiden arvot vaikuttavat kohdemittariin huomattavasti vähemmän. Kun kuitenkin käsitellään puumalli, nähdään, että edellinen laskenta on harhaanjohtava (kuten seuraavassa näyttökuvassa).
Puurakenne näyttää tältä:
Ensimmäisenä jakona ovat materiaali-muuttujaan liittyvät tiedot. Tiedot, joissa alumiini on yhdellä puolella ja kaikki muut materiaalit ovat toisella puolella.
Alumiini-haara jaetaan pidemmälle toimittajamaan perusteella Saksaan ja Itävaltaan.
Itävalta-haara jatkuu jaolla toimittajakaupungin mukaan. Siinä Graz on yhdellä puolella ja Wien toisella puolella.
Solmussa Graz keskimääräinen tapaus kesti 36 tuntia pidempään kuin 46 tunnin yleinen keskimääräinen kesto.
Samassa puussa näkyy, että materiaalin ollessa muu kuin alumiini, jako tapahtuu myös muuttujan toimittajakaupunki mukaan. Siinä yhdellä puolella on Graz ja toisella on Wien, München tai Frankfurt. Tässä arvot ovat kuitenkin päinvastaiset. Grazilla on huomattavasti paremmat tilastotiedot kuin Wienillä tai millään Saksan kaupungilla Grazin keskimääräisen tapauksen kestäessä 15 tuntia vähemmän kuin kaikkien tapausten yleinen keskimääräinen kesto.
Tästä voidaan päätellä että alustavat tilastotiedot ovat harhaanjohtavia, koska Graz suoriutuu huonosti, kun materiaalina on alumiini. Se kuitenkin suoriutuu keskimääräistä paremmin, kun materiaali on muu kuin alumiini, ja tämä on muiden kaupunkien osalta täysin päinvastoin.
Tapauksen keston vaikutus -tilastotiedoissa otetaan huomioon vain yksi arvo, joten se voi joskus olla harhaanjohtava. RCA ottaa huomioon niiden yhdistelmiä, jolloin prosesseista saa merkityksellisempiä tietoja.