Matrice záměny

Dokončeno

Data si můžete představit jako průběžná, kategorická nebo řadová (kategorická, ale s pořadím). Matrice nejasnosti představují způsob vyhodnocení, jak dobře model kategorií funguje. Pro kontext, jak tyto funkce fungují, nejprve aktualizujeme naše znalosti o průběžných datech. Díky tomu můžeme vidět, jak konfuzní matice představují jednoduše rozšíření histogramů, které už víme.

Průběžné distribuce dat

Když chceme porozumět průběžným datům, prvním krokem je často zjistit, jak se distribuují. Představte si následující histogram:

Histogram znázorňující distribuci popisků

Vidíme, že popisek je v průměru přibližně nula a většina datových bodů spadá mezi -1 a 1. Zdá se jako symetrické; existuje přibližně sudý počet menších a větších než průměr. Pokud bychom chtěli, mohli bychom místo histogramu použít tabulku, ale mohlo by to být nepraktní.

Kategorické distribuce dat

V některých ohledech nejsou kategorická data tak odlišná od průběžných dat. Stále můžeme vytvořit histogramy, abychom posoudili, jak často se hodnoty zobrazují pro každý popisek. Například binární popisek (true/false) se může objevit s frekvencí, například takto:

Pruhový graf zobrazující více popisků false a pak true

To nám říká, že jako popisek je 750 vzorků s "false" a jako popisek je 250 s "true".

Popisek pro tři kategorie je podobný:

Pruhový graf zobrazující více popisků zvířat než popisky osob a stromů

To nám říká, že existuje 200 vzorků, které jsou "osoba", 400, které jsou "zvíře" a 100, které jsou "strom".

Protože popisky kategorií jsou jednodušší, můžeme je často zobrazit jako jednoduché tabulky. Dva předchozí grafy by vypadaly takto:

Popisek False True
Počet 750 250

A:

Popisek Osoba Zvíře Strom
Počet 200 400 100

Pohled na předpovědi

Můžeme se podívat na předpovědi, které model dělá stejně, jako se podíváme na popisky základní pravdy v našich datech. Můžeme například vidět, že v testovací sadě náš model předpověděl "false" 700krát a "true" 300krát.

Predikce modelu Počet
False 700
True 300

To poskytuje přímé informace o předpovědích, které náš model vytváří, ale neřekne nám, které z nich jsou správné. I když můžeme použít nákladovou funkci, abychom pochopili, jak často jsou zadány správné odpovědi, nákladová funkce nám neřekne, jaké druhy chyb se provádějí. Model může například správně uhodnout všechny "true" hodnoty, ale také odhadnout "true", když by měl uhodnout "false".

Konfuzní matice

Klíčem k pochopení výkonu modelu je zkombinovat tabulku pro predikci modelu s tabulkou pro popisky dat pro pravdivou pravdu:

Diagram konfuzní matice s přidanými celkovými čísly

Čtverec, který jsme nevyplnili, se nazývá konfuzní matice.

Každá buňka v konfuzní matici nám říká jednu věc o výkonu modelu. Jedná se o true negatives (TN), false negatives (FN), false positives (FP) a true positives (TP).

Pojďme tyto zkratky vysvětlit jeden po druhém a nahradit je skutečnými hodnotami. Modré zelené čtverce znamenají, že model provedl správnou předpověď a oranžové čtverce znamenají, že model vytvořil nesprávnou předpověď.

True Negatives (TN)

Levá horní hodnota vypíše, kolikrát model predikoval hodnotu false a skutečný popisek byl také false. Jinými slovy, tento seznam uvádí, kolikrát model správně predikoval hodnotu false. Řekněme například, že k tomu došlo 500krát:

Diagram konfuzní matice bez celkových čísel zobrazující pouze pravdivá záporná data

Falešně negativní (FN)

Hodnota vpravo nahoře nám říká, kolikrát model predikoval hodnotu false, ale skutečný popisek byl pravdivý. Teď víme, že je to 200. Jak? Vzhledem k tomu, že model předpověděl hodnotu false 700krát a 500 z těchto časů to udělal správně. Proto 200krát musí mít předpověděnou hodnotu false, pokud by neměla mít.

Diagram konfuzní matice zobrazující pouze falešně negativní hodnoty

Falešně pozitivní (FP)

Levá dolní hodnota obsahuje falešně pozitivní výsledky. To nám říká, kolikrát model predikoval hodnotu true, ale skutečný popisek byl false. Víme teď, že je to 250, protože 750krát bylo, že správná odpověď byla nepravda. 500 z těchto časů se zobrazí v levé horní buňce (TN):

Diagram konfuzní matice zobrazující falešně pozitivní výsledky

Pravdivě pozitivní (TP)

Nakonec máme pravdivě pozitivní výsledky. Toto je počet, kolikrát model správně predikuje hodnotu true. Víme, že to je 50 ze dvou důvodů. Za prvé model předpověděl 300krát hodnotu true, ale 250krát byl nesprávný (levá dolní buňka). Za druhé, pravda byla 250krát správná odpověď, ale 200krát model předpověděl false.

Diagram konfuzní matice zobrazující pravdivě pozitivní výsledky

Konečná matice

My obvykle zjednodušujeme konfuzní matici mírně, například takto:

Diagram zjednodušené konfuzní matice

Vybarvení buněk jsme zde zvýraznili, když model provedl správné předpovědi. Z toho víme nejen, jak často model provedl určité typy predikcí, ale také jak často byly tyto předpovědi správné nebo nesprávné.

Matrice záměny lze také vytvořit, pokud existuje více popisků. Například pro naši osobu/ zvíře/ stromový příklad můžeme získat matici takto:

Diagram rozšířené konfuzní matice se třemi popisky: osoba, zvíře a strom

Pokud existují tři kategorie, metriky, jako jsou pravdivě pozitivní výsledky, už se nepoužijí, ale stále vidíme, jak často model provedl určité druhy chyb. Vidíme například, že model předpověděl, že "osoba" 200krát, když skutečný správný výsledek byl "zvíře".