Udostępnij za pośrednictwem


Ulepszanie modelu ML.NET

Dowiedz się, jak ulepszyć model ML.NET.

Zmień ramkę problemu

Czasami ulepszenie modelu może nie mieć nic wspólnego z danymi lub technikami używanymi do trenowania modelu. Zamiast tego może być tylko to, że zadawane jest niewłaściwe pytanie. Rozważ przyjrzenie się problemowi z różnych kątów i wykorzystanie danych w celu wyodrębnienia ukrytych wskaźników i ukrytych relacji w celu uściślenia pytania.

Podaj więcej przykładów danych

Podobnie jak u ludzi, im więcej algorytmy są szkolone, tym większe jest prawdopodobieństwo lepszej wydajności. Jednym ze sposobów poprawy wydajności modelu jest zapewnienie większej liczby przykładów danych szkoleniowych algorytmom. Im więcej danych się nauczy, tym więcej przypadków jest w stanie poprawnie zidentyfikować.

Dodawanie kontekstu do danych

Znaczenie pojedynczego punktu danych może być trudne do zinterpretowania. Tworzenie kontekstu wokół punktów danych pomaga algorytmom, a także ekspertom w zakresie zagadnień, lepiej podejmować decyzje. Na przykład fakt, że dom ma trzy sypialnie, nie daje dobrego wskazania jego ceny. Jeśli jednak dodasz kontekst i zdajesz sobie sprawę, że jest to podmiejska dzielnica poza głównym obszarem metropolitalnym, gdzie średni wiek wynosi 38 lat, średni dochód gospodarstwa domowego wynosi 80.000 USD, a szkoły znajdują się w górnych 20% rankingów, algorytm ma więcej informacji do podejmowania decyzji. Cały ten kontekst można dodać jako dane wejściowe do modelu uczenia maszynowego jako funkcje.

Używanie znaczących danych i funkcji

Chociaż więcej przykładów danych i funkcji może pomóc zwiększyć dokładność modelu, mogą również wprowadzać szum, ponieważ nie wszystkie dane i funkcje są istotne. Dlatego ważne jest, aby zrozumieć, które funkcje są tymi, które mają największy wpływ na decyzje podejmowane przez algorytm. Użycie technik, takich jak ważność funkcji permutacji (PFI), może pomóc zidentyfikować te istotne funkcje i nie tylko pomóc wyjaśnić model, ale także użyć danych wyjściowych jako metody wyboru funkcji, aby zmniejszyć ilość hałaśliwych funkcji przechodzących do procesu trenowania.

Aby uzyskać więcej informacji na temat korzystania z PFI, zobacz Wyjaśnij przewidywania modelu przy użyciu Ważności Cech Permutacji.

Krzyżowe sprawdzanie poprawności

Krzyżowa walidacja to technika trenowania i oceny modelu, która dzieli dane na kilka partycji i trenuje wiele algorytmów na tych partycjach. Ta technika poprawia niezawodność modelu, przechowując dane z procesu trenowania. Oprócz poprawy wydajności na nieznanych obserwacjach, w środowiskach o ograniczonej dostępności danych może to być skuteczne narzędzie do trenowania modeli na mniejszych zestawach danych.

Odwiedź poniższy link, aby dowiedzieć się, jak używać krzyżowej weryfikacji w ML.NET

Dostrajanie hiperparametrów

Trenowanie modeli uczenia maszynowego jest procesem iteracyjnym i eksploracyjnym. Na przykład, jaka jest optymalna liczba klastrów przy trenowaniu modelu z użyciem algorytmu K-średnich? Odpowiedź zależy od wielu czynników, takich jak struktura danych. Znalezienie tej liczby wymagałoby eksperymentowania z różnymi wartościami dla k, a następnie ocenianie wydajności w celu określenia, która wartość jest najlepsza. Praktyka dostrajania parametrów, które prowadzą proces trenowania w celu znalezienia optymalnego modelu, jest znana jako dostrajanie hiperparametrów.

Wybieranie innego algorytmu

Zadania uczenia maszynowego, takie jak regresja i klasyfikacja, zawierają różne implementacje algorytmów. Może się okazać, że problem, który próbujesz rozwiązać, i sposób, w jaki dane są ustrukturyzowane, nie pasuje dobrze do bieżącego algorytmu. W takim przypadku rozważ użycie innego algorytmu dla zadania, aby sprawdzić, czy uczy się lepiej na podstawie danych.

Poniższy link zawiera więcej wskazówek dotyczących wyboru odpowiedniego algorytmu.