Compartir a través de


Información general del análisis de la causa raíz

El análisis de causa raíz (RCA) le permite encontrar conexiones ocultas en sus datos. Por ejemplo, lo ayuda a comprender por qué algunos casos tardan más en completarse que otros, o por qué algunos casos se atascan en reelaboraciones mientras que otros se ejecutan sin problemas. RCA le mostrará las diferencias clave entre estos casos.

Datos necesarios

RCA puede usar todos sus atributos a nivel de caso, métricas y métricas personalizadas para encontrar conexiones entre ellos, y una métrica de su elección.

La mejor muestra es incluir todos los datos que pueda como atributo a nivel de caso y dejar que el RCA haga la elección de qué atributo influye realmente en la métrica y cuál no.

Cómo funciona el RCA

El algoritmo RCA calculará una estructura de árbol en la que cada nodo dividirá el conjunto de datos en dos partes más pequeñas. Se basa en una variable en la que encuentra la mejor correlación entre la variable dividida y la métrica objetivo. A partir de esto, puede ver las conexiones ocultas en los datos. Aquí es donde le dirá qué combinación de atributos influirá en el caso de qué manera.

Cómo encuentra RCA la mejor división

Primero, generamos de cientos a miles de combinaciones de posibles divisiones. A continuación, probamos cada división para descubrir hasta qué punto dividirá realmente el conjunto de datos en dos partes. Calculamos la varianza de la métrica principal en cada parte de la división y calculamos la puntuación de cada división con el siguiente cálculo:

puntuaciónsplit_x = varianzaizquierda * número de casosizquierda + varianzaderecha * número de casosderecha

A continuación, ordenamos todas las divisiones por esta puntuación y se toman las mejores divisiones desde el principio, con la puntuación más baja. Para la métrica principal categórica (cadena), calculamos la impureza de Gini en lugar de la varianza.

Ejemplo de RCA

En este ejemplo, queremos ver la causa raíz detrás de la duración del caso. En los datos, tenemos atributos a nivel de caso país del proveedor, ciudad del proveedor, material,importe total y centro de costes. La duración media de los casos es de 46 horas.

Al observar cada valor de cada atributo por separado, podemos ver que el mayor factor de influencia de la duración del caso es cuando la ciudad del proveedor es Graz, que en promedio aumenta la duración del caso en 15 horas adicionales. A partir de este análisis inicial, podemos ver que los demás valores de los atributos influyen mucho menos en la métrica objetivo. Sin embargo, cuando calculamos el modelo de árbol, podemos ver que el cálculo anterior es engañoso (como en la siguiente captura de pantalla).

Captura de pantalla de la duración del caso influencer.

La estructura de árbol tiene el siguiente aspecto:

  • La primera división son los datos a lo largo de la variable material. Los datos con aluminio están en un lado y todos los otros materiales están en el otro lado.

  • La sucursal de aluminio se divide aún más por país proveedor en Alemania y Austria.

  • La sucursal Austria continúa con una división por ciudad proveedora, con Graz por un lado y Viena por el otro.

  • En el nodo Graz, el caso promedio fue 36 horas más lento que la duración promedio general de 46 horas.

En el mismo árbol podemos ver que si tenemos otro material que no sea aluminio, también se desdobla por la variable ciudad proveedora, donde por un lado está Graz y por el otro está Viena, Múnich o Frankfurt. Pero aquí, los valores son los opuestos. Graz tiene estadísticas mucho mejores que Viena o cualquier ciudad alemana, con un caso promedio en Graz 15 horas más rápido que el promedio general para todos los casos.

De ello se desprende que las estadísticas iniciales son engañosas, ya que Graz obtiene malos resultados cuando el material es aluminio. Sin embargo, obtiene resultados por encima de la media cuando el material es distinto del aluminio y es totalmente opuesto en el caso de otras ciudades.

Las estadísticas Influencia de duración del caso tienen en cuenta solo un valor y, a veces, puede ser engañoso. RCA tiene en cuenta las combinaciones de ellos para brindarle más información sobre su proceso.