共用方式為


根本原因分析概觀

根本原因分析 (RCA) 可讓您尋找資料中的隱藏連接。 例如,這可協助您了解為什麼有些案例比其他案例需要更長的時間才能完成,或者為什麼有些案例停滯於重做而其他案例順利執行。 RCA 為您展示這類案例之間的主要區別。

必要的資料

RCA 可以使用所有的案例層級屬性、計量和自訂計量來尋找其間的連接,以及您選擇的計量。

最合適的範例是將所有資料當做案例層級屬性包含在內,並讓 RCA 選擇哪個屬性實際影響計量,而哪個屬性不影響計量。

RCA 運作方式

RCA 演算法會計算樹狀結構,其中每個節點都會將資料集分割成兩個較小的部分。 這是根據變數而定,藉此尋找變數分割與目標計量之間的最佳相互相關。 由此,您可以看到資料中隱藏的連接。 至此,它會告訴您何種屬性組合將以何種方式影響案例。

RCA 尋找最佳分割的方式

首先,產生數百到數千個可能的分割組合。 接著嘗試每個分割,以了解其將資料集分割成兩個部分的實際效果。 我們計算該分割每個部分中主要計量的變異數,並使用下列計算方式計算每個分割的分數:

分數分割_x = 變異數 * 案例數目 + 變異數 * 案例數目

接著依此分數排序所有分割,而最佳分割則取自開頭處,其分數最低。 對於分類主要計量 (字串),我們計算的是基尼不純度而不是變異數。

RCA 範例

在此範例中,我們想要了解案例期間背後的根本原因。 在資料中,我們的案例層級屬性有供應商國家/地區供應商城市材料總金額成本中心。 平均案例期間為 46 小時。

只要查看每個屬性的各個值,就能了解到案例期間的最大影響因素是在供應商城市格拉茨時,案例期間平均增加了 15 小時。 從這次初始分析中,我們可以看到屬性的其他值對目標計量的影響要小得多。 不過,計算樹狀模型時,我們發現上述計算會造成誤解 (如下列螢幕擷取畫面所示)。

案例期間影響者的螢幕擷取畫面。

樹狀結構看起來像這樣:

  • 第一個分割是沿著材料變數的資料。 包含鋁材的資料位於同一側,而所有其他材料則位於另一側。

  • 鋁材分支依據供應商國家/地區進一步分割成德國奧地利

  • 奧地利分支繼續依據供應商城市進行分割,使得格拉茨維也納分列兩側。

  • 在節點格拉茨中,平均案例期間比整體平均期間 46 小時慢 36 小時。

在同一個樹狀結構中可以發現,如果我們有鋁材以外的其他材料,同樣會依據變數供應商城市進行分割,其中一側是格拉茨,另一側是維也納、慕尼黑或法蘭克福。 但在這裡,值是相反的。 格拉茨的統計資料比維也納或任何德國城市都要好得多,格拉茨的平均案例比所有案例的整體平均值快 15 小時。

由此可見,最初的統計資料造成誤解,因為當材料是鋁材時,格拉茨的表現很差,但是當材料是鋁以外的材料時,其表現高於平均值,而其他城市則完全相反。

案例期間影響統計資料僅考慮一個值,有時可能會產生誤導。 RCA 會將這些值的組合納入考量,讓您更深入了解您的程序。