Odkrywanie nowych modeli regresji
W lekcji 2 przyjrzeliśmy się dopasowaniu prostej linii do punktów danych. Jednak regresja może pasować do wielu rodzajów relacji, w tym tych z wieloma czynnikami i tych, w których znaczenie jednego czynnika zależy od drugiego.
Eksperymentowanie z modelami
Modele regresji są często wybierane, ponieważ współpracują z małymi próbkami danych, są niezawodne, łatwe do interpretacji i istnieją różne.
Regresja liniowa jest najprostszą formą regresji , bez limitu liczby używanych funkcji. Regresja liniowa występuje w wielu formach, często określanych liczbą używanych cech i kształtem krzywej, która pasuje.
Drzewa decyzyjne podejmują krok po kroku podejście do przewidywania zmiennej. Jeśli pomyślimy o naszym przykładzie roweru, drzewo decyzyjne może być najpierw podzielone przykłady między tymi, które są w okresie wiosny/lata i jesienią/zimą, należy przewidzieć na podstawie dnia tygodnia. Wiosna/Lato-poniedziałek może mieć stawkę wynajmu rowerów w wysokości 100 dziennie, podczas gdy Jesień /Zima-Poniedziałek może mieć stawkę wynajmu 20 dziennie.
Algorytmy zespołowe tworzą nie tylko jedno drzewo decyzyjne, ale dużą liczbę drzew, co pozwala lepiej przewidywać bardziej złożone dane. Algorytmy zespołów, takie jak las losowy, są powszechnie używane w uczeniu maszynowym i nauce o danych ze względu na ich silne możliwości przewidywania.
Analitycy danych często eksperymentować z użyciem różnych modeli. W poniższym ćwiczeniu będziemy eksperymentować z różnymi typami modeli, aby porównać ich działanie na tych samych danych.