Microsoft algorytm regresji liniowej
Microsoft Algorytm regresji liniowej jest odmianą Microsoft algorytm drzewa decyzji, który pomaga obliczyć liniowej zależności pomiędzy zmienną niezależne i zależne, a następnie użyć tej relacji dla przewidywanie.
Relacja ma postać równania dla linii najlepiej reprezentuje serię danych.Na przykład w poniższym diagramie wiersz jest najlepsze możliwe liniową reprezentację danych.
Każdy punkt danych na diagramie ma występuje błąd związany z jego odległości od linii regresja.Współczynniki i b w regresja równanie dopasować kąt i położenie linii regresja.Równanie regresja można uzyskać, regulując i b do momentu, aż Suma błędów, które są skojarzone z wszystkich punktów jej minimalnego.
Istnieją inne rodzaje regresja, które używają wielu zmiennych i nieliniowych metody regresja.regresja liniowej jest jednak użyteczne i dobrze znane metoda modelowania odpowiedzi do zmiany niektórych podstawowych współczynnik.
Przykład
regresja liniowej umożliwia określenie relacji między dwoma kolumnami ciągłe.Na przykład można użyć regresja liniowej do obliczenia linii trend danych produkcji lub sprzedaży.Można także użyć regresja liniowej jako prekursorów do rozwoju bardziej złożonych modeli wyszukiwanie danych do oceny relacje między kolumnami danych.
Chociaż istnieje wiele sposobów obliczyć regresję liniową, które nie wymagają narzędzia wyszukiwanie danych, zaletą używania Microsoft algorytm regresja liniowej dla tego zadania jest wszystkich możliwych relacji pomiędzy zmiennymi są automatycznie obliczane i przetestowane.Nie trzeba wybrać metoda obliczeń, takich jak rozwiązywanie najmniejszych kwadratów.Jednakże regresja liniowej może oversimplify relacje w scenariuszach, w których wielu czynników wpływ na wynik.
Jak działa algorytm
Microsoft Algorytm regresji liniowej jest odmianą Microsoft algorytm drzewa decyzji.Po wybraniu Microsoft algorytm regresji liniowej, szczególny przypadek Microsoft algorytm drzewa decyzji jest wywoływana z parametrami, które ograniczyć działanie algorytmu i wymagają niektórych typów danych wejściowych.Ponadto w modelu regresja liniowej całego zestaw danych jest używany dla relacji w przebiegu wstępnego przetwarzania natomiast model drzewa decyzji standardowych dzieli dane wielokrotnie na mniejsze podzbiory lub drzew.
Dane wymagane dla modeli regresji liniowej
Podczas przygotowywania danych do użycia w modelu regresja liniowej, należy zrozumieć wymagania dla określonego algorytmu.Obejmuje to, jak dużo danych jest wymagana i sposobu używania danych.Wymagania dla tego typu modelu są następujące:
Jeden key kolumnakażdego modelu musi zawierać jedną kolumna liczbowe lub tekst, który unikatowo identyfikuje każdy rekord.Mieszanki klucze nie są dozwolone.
Przewidywalne kolumnawymaga co najmniej jedną przewidywalna kolumna.W modelu można dołączyć wiele atrybutów przewidywalny, ale przewidywalne atrybuty muszą być ciągłe liczbowych typów danych.Typ danych Data/Godzina nie można używać jako atrybut przewidywalne nawet jeśli macierzystym magazynu danych liczbowych.
Wprowadzanie kolumny kolumny Input musi zawierać dane liczbowe ciągłe i przypisać odpowiedni typ danych.
Aby uzyskać więcej informacji, zobacz sekcję wymagania Microsoft techniczne algorytm regresji liniowej.
Wyświetlanie modelu regresji liniowej
Aby poznać model, użyj Przeglądarka Microsoft drzewa.Struktury drzewa modelu regresja liniowej jest bardzo proste, wszystkie informacje zawarte w pojedynczym węźle równanie regresja.Aby uzyskać więcej informacji, zobacz Wyświetlanie modelu górnictwo Viewer drzewa Microsoft.
Jeśli chcesz wiedzieć więcej szczegółów dotyczących równanie można również wyświetlić współczynników oraz innych szczegółów za pomocą Ogólnej zawartości drzewa Podgląd programu Microsoft.
Dla modelu regresja liniowej modelu zawartości zawiera metadane, formuła regresja i statystyki dotyczące dystrybucji wartości wejściowych.Aby uzyskać więcej informacji, zobacz Górnictwo zawartości modelu regresji liniowej modeli (Analysis Services - wyszukiwania danych).
Tworzenie prognoz
Po przetworzeniu modelu, wyniki są przechowywane jako zestaw statystyk wraz z formuły regresja liniowej, która służy do obliczania przyszłych trendów.Przykłady kwerend z modelu regresja liniowej, zobacz Badanie modelu regresji liniowej (Analysis Services - wyszukiwania danych).
Aby uzyskać ogólne informacje dotyczące tworzenia kwerend modeli wyszukiwania, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).
Oprócz tworzenia modelu regresja liniowej, wybierając Microsoft algorytm regresja liniowej przewidywalne atrybut jest typu ciągłego danych liczbowych można utworzyć model drzewo decyzyjne zawierającej strat zauważyć.przypadek algorytmu podzielić dane znajdzie oddzielenia odpowiednie punkty, ale w niektórych regionach danych spowoduje utworzenie formuły Regresja zamiast.Aby uzyskać więcej informacji na temat regresja drzewa modelu drzewa decyzji, zobacz Model zawartości dla modeli drzewa decyzji górnictwo (Analysis Services - wyszukiwania danych).
Uwagi
Nie obsługuje korzystania z przewidywanych modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.
Nie obsługuje tworzenia wymiary wyszukiwanie danych.
Obsługuje przeglądanie szczegółowe.
Obsługuje korzystanie z modeli wyszukiwania OLAP.
Zobacz także