Podczas badania Naive modelu Bayes (Analysis Services — wyszukiwanie danych)
Podczas tworzenia kwerendy przed model wyszukiwanie danych, można utworzyć albo zawartości kwerendę, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie, która używa desenie w modelu, aby prognoz dla nowych danych.Można również pobierać metadane dotyczące modelu za pomocą kwerendy przed zestaw wierszy schematu wyszukiwanie danych.W tej sekcji wyjaśniono, jak utworzyć te kwerendy dla modeli, które są oparte na algorytmie Bayes Naive firmy Microsoft.
Kwerendy zawartości
Pobieranie metadane modelu przy użyciu DMX
Trwa pobieranie podsumowanie danych szkolenia
Znajdowanie dalszych informacji dotyczących atrybutów
Korzystanie z systemu przechowywanych procedur
Kwerendy przewidywanie
Przewidywana wyniki przy użyciu kwerendy Singleton
Zwróciło prognoz prawdopodobieństwo i obsługi technicznej
Przewidywana skojarzenia
Znajdowanie informacji o modelu Bayes Naive
Model zawartości modelu Naive Bayes zawiera zagregowane informacje dotyczące występowania wartości w danych szkolenia.Można także pobrać informacje o metadane modelu przez utworzenie kwerendy przed wierszy schematu wyszukiwanie danych.
Powrót do początku
Przykładowa kwerenda 1: Pobieranie metadane modelu przy użyciu DMX
Za pomocą kwerend wysyłanych do zestaw zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane modelu.Może to dotyczyć, gdy model został utworzony, podczas ostatniego przetworzenia modelu, nazwa struktura wyszukiwania na podstawie modelu i nazwy kolumn używanych jako atrybut przewidywalne.Można także wrócić parametrów, które były używane podczas tworzenia modelu.
SELECT MODEL_CATALOG, MODEL_NAME, DATE_CREATED, LAST_PROCESSED,
SERVICE_NAME, PREDICTION_ENTITY, FILTER
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_NaiveBayes_Filtered'
Przykładowe wyniki:
MODEL_CATALOG |
AdventureWorks |
NAZWA_MODELU |
TM_NaiveBayes_Filtered |
DATE_CREATED |
3/1/2008 19:15 |
LAST_PROCESSED |
3/2/2008 20:00 |
NAZWA_USŁUGI |
Microsoft_Naive_Bayes |
PREDICTION_ENTITY |
Nabywca rowerów, roczny dochód |
FILTER |
[Region] = "Europa" lub [Region] = "USA" |
Model używany w tym przykładzie jest oparty na modelu Naive Bayes, Utwórz w Podstawowe wyszukiwanie danych — samouczek, ale został zmodyfikowany przez dodanie drugiej atrybut przewidywalny i zastosowanie filtru do danych szkoleniowych.
Powrót do początku
Przykładowa kwerenda 2: Trwa pobieranie podsumowanie danych szkolenia
W modelu Naive Bayes węzeł Statystyka marginalna przechowuje zagregowane informacje dotyczące występowania wartości w danych szkoleniowych.Podsumowanie to jest wygodne i zapisuje użytkownik z konieczności tworzenia kwerend SQL dla danych szkolenia, aby znaleźć te same informacje.
W poniższym przykładzie użyto DMX zawartości kwerendy do pobierania danych z węzła (NODE_TYPE = 24).Ponieważ statystyki są przechowywane w tabela zagnieżdżonej, słowo kluczowe FLATTENED jest używana do ułatwiają wyświetlanie wyniki.
SELECT FLATTENED MODEL_NAME,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT], [PROBABILITY], VALUETYPE FROM NODE_DISTRIBUTION) AS t
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 26
Uwaga
Nazwy kolumn, SUPPORT i prawdopodobieństwo, należy ująć w nawiasy, aby odróżnić je od słów kluczowych wyrażeń MDX (Multidimensional) zarezerwowane o tych samych nazwach.
Częściowe wyniki:
NAZWA_MODELU |
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.SUPPORT |
t.PROBABILITY |
t.VALUETYPE |
---|---|---|---|---|---|
TM_NaiveBayes |
Rower kupujących |
Brak |
0 |
0 |
1 |
TM_NaiveBayes |
Rower kupujących |
0 |
8869 |
0.507263784 |
4 |
TM_NaiveBayes |
Rower kupujących |
1 |
8615 |
0.492736216 |
4 |
TM_NaiveBayes |
Płeć |
Brak |
0 |
0 |
1 |
TM_NaiveBayes |
Płeć |
P |
8656 |
0.495081217 |
4 |
TM_NaiveBayes |
Płeć |
M |
8828 |
0.504918783 |
4 |
Na przykład, wyniki te informują liczba przypadków szkoleń dla każdej wartości discrete (wartości = 4), razem z prawdopodobieństwem obliczaną, skorygowaną o brakujących wartości (wartości = 1).
Aby uzyskać definicję wartości podane w tabela NODE_DISTRIBUTION w modelu Naive Bayes zobacz model wyszukiwania Zawartości dla Naive modele Bayes (Analysis Services — wyszukiwanie danych). Aby uzyskać więcej informacji na temat wpływu obliczenia prawdopodobieństwa i obsługę przez brakujących wartości zobacz Brak wartości (Analysis Services — wyszukiwanie danych).
Powrót do początku
Przykładowa kwerenda 3: Znajdowanie dalszych informacji dotyczących atrybutów
Ponieważ model Naive Bayes często zawiera złożone informacje o relacji między różnymi atrybutami, najłatwiejszy sposób, aby wyświetlić te relacje jest użycie Podgląd Bayes Naive firmy Microsoft.Można jednak utworzyć DMX kwerendy, aby dane były zwracane.
W poniższym przykładzie pokazano, jak do zwracania informacji z modelu o określonego atrybut, region.
SELECT NODE_TYPE, NODE_CAPTION,
NODE_PROBABILITY, NODE_SUPPORT, MSOLAP_NODE_SCORE
FROM TM_NaiveBayes.CONTENT
WHERE ATTRIBUTE_NAME = 'Region'
Ta kwerenda zwraca dwa typy węzłów: węzeł, który reprezentuje atrybut wejściowy (NODE_TYPE = 10) i węzłów dla każdej wartości atrybutu (NODE_TYPE = 11). Podpis węzła służy do identyfikacji węzła, a nie nazwy węzła, ponieważ podpis zawiera nazwę atrybut i wartości atrybut.
NODE_TYPE |
NODE_CAPTION |
NODE_PROBABILITY |
NODE_SUPPORT |
MSOLAP_NODE_SCORE |
NODE_TYPE |
---|---|---|---|---|---|
10 |
Rower kupujących-> Region |
1 |
17484 |
84.51555875 |
10 |
11 |
Rower kupujących-> Region = Brak |
0 |
0 |
0 |
11 |
11 |
Rower kupujących-> Region = USA |
0.508236102 |
8886 |
0 |
11 |
11 |
Rower kupujących-> Region = Pacyfiku |
0.193891558 |
3390 |
0 |
11 |
11 |
Rower kupujących-> Region = Europa |
0.29787234 |
5208 |
0 |
11 |
Niektórych kolumn, przechowywane w węzłach są takie same, można uzyskać z węzłów marginalna statystyk, takich jak ocena prawdopodobieństwa węzła i węzeł obsługuje wartości.Jednak MSOLAP_NODE_SCORE jest wartością specjalną dostarczane tylko dla węzłów wejściowych atrybut a wskazuje względną wagę tego atrybutu w modelu.Można wyświetlić wiele te same informacje w okienku zależności sieci podglądu; jednak przeglądarka nie udostępnia wyniki.
Następująca kwerenda zwraca wyniki znaczenie wszystkich atrybutów w modelu:
SELECT NODE_CAPTION, MSOLAP_NODE_SCORE
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 10
ORDER BY MSOLAP_NODE_SCORE DESC
Przykładowe wyniki:
NODE_CAPTION |
MSOLAP_NODE_SCORE |
---|---|
Rower kupujących-> Całkowita elementy podrzędne |
181.3654836 |
Rower kupujących-> Commute odległość |
179.8419482 |
Rower kupujących-> Angielski edukacja |
156.9841928 |
Rower kupujących-> Liczba dzieci w Główny |
111.8122599 |
Rower kupujących-> Region |
84.51555875 |
Rower kupujących-> Stan cywilny |
23.13297354 |
Rower kupujących-> Angielski, zawód |
2.832069191 |
Przeglądając zawartość modelu Podgląd zawartości drzewa rodzajowa firmy Microsoft, uzyskasz lepsze rozwiązanie z statystyk, jakie mogą być interesujące.Przykłady prostych były wykazane w tym miejscu; częściej może być konieczne wykonać wielu kwerend lub wyniki są przechowywane i przetwarzać je klient.
Powrót do początku
Przykładowa kwerenda 4: Za pomocą procedury składowane w systemie
Dodatkowo, oprócz zapisywania kwerendy zawartości, można użyć niektórych usług Analysis Services procedury składowane w systemie przeszukiwać wyniki.Aby użyć systemu przechowywane procedury, prefiks nazwy procedura przechowywana ze słowem kluczowym Wywołaj:
CALL GetPredictableAttributes ('TM_NaiveBayes')
Częściowe wyniki:
ATTRIBUTE_NAME |
NODE_UNIQUE_NAME |
---|---|
Rower kupujących |
100000001 |
Uwaga
Te procedury składowane w systemie są do wewnętrznej komunikacji między serwerem usług Analysis Services i klient i powinno być używane tylko dla wygody podczas opracowywania i testowania modeli wyszukiwania.Podczas tworzenia kwerendy w systemie produkcji należy zawsze wpisać własne kwerendy przy użyciu DMX AMO i XMLA.
Aby uzyskać więcej informacji na temat usług Analysis Services systemu Zobacz procedur przechowywanych Wyszukiwanie danych przechowywanych procedur (Analysis Services — wyszukiwanie danych).
Powrót do początku
Tworzenie przy użyciu modelu prognoz
Microsoft Bayes Naive algorytm jest zazwyczaj używane mniej do przewidywanie niż eksploracji relacje między atrybuty wejściowych i przewidywalny.Jednak w modelu obsługuje korzystanie z funkcji przewidywanie prognozowania i skojarzenia.
Przykładowa kwerenda 5: Przewidywana wyniki przy użyciu Singleton Query
Następujące zastosowania kwerendy pojedyncza kwerendy, aby podać nową wartość i przewidywania, oparty na modelu, czy dla nabywcy z tych właściwości jest prawdopodobne, że kupują rowerów.Najprostszym sposobem utworzenia pojedynczych kwerendy w modelu regresja jest przy użyciu Pojedyncza Query wprowadzania -okno dialogowe.Na przykład utworzyć następującą kwerendę DMX wybierając TM_NaiveBayes model, wybieranie Pojedyncza kwerendyi wybieranie wartości z listy rozwijanej [Commute Distance] i Gender.
SELECT
Predict([TM_NaiveBayes].[Bike Buyer])
FROM
[TM_NaiveBayes]
NATURAL PREDICTION JOIN
(SELECT '5-10 Miles' AS [Commute Distance],
'F' AS [Gender]) AS t
Przykład wyniki:
Expression |
---|
0 |
przewidywanie Funkcja zwraca wartość najczęściej wartość, w tym przypadek 0, co oznacza tego typu odbiorca jest mało prawdopodobne, aby kupić rowerów.
Powrót do początku
Przykładowa kwerenda 6: Zwróciło prawdopodobieństwo i obsługa techniczna prognoz
W uzupełnieniu do przewidywanie wyniku, często chcą wiedzieć, jak silne są przewidywanie.Następująca kwerenda używa tej samej kwerendy pojedynczych, jak w poprzednim przykładzie, ale dodaje funkcja prognozowania PredictHistogram (DMX), aby przywrócić zagnieżdżoną tabela, która zawiera dane statystyczne w celu prognozowania wartości.
SELECT
Predict([TM_NaiveBayes].[Bike Buyer]),
PredictHistogram([TM_NaiveBayes].[Bike Buyer])
FROM
[TM_NaiveBayes]
NATURAL PREDICTION JOIN
(SELECT '5-10 Miles' AS [Commute Distance],
'F' AS [Gender]) AS t
Przykład wyniki:
Rower kupujących |
OBSŁUGA $ |
PRAWDOPODOBIEŃSTWO $ |
$ ADJUSTEDPROBABILITY |
ODCHYLENIE $ |
$ ODCH.STANDARDOWE |
---|---|---|---|---|---|
0 |
10161.5714 |
0.581192599 |
0.010530981 |
0 |
0 |
1 |
7321.428768 |
0.418750215 |
0.008945684 |
0 |
0 |
|
0.999828444 |
5.72E - 05 |
5.72E - 05 |
0 |
0 |
Końcowe wierszy w tabela pokazuje korekt do obsługi i prawdopodobieństwa dla brakujących wartości.Wartości wariancji i odchylenia standardowego są zawsze 0, ponieważ modeli Naive Bayes nie modelu stałe wartości.
Powrót do początku
Przykładowa kwerenda 7: Przewidywana skojarzenia
Algorytm Bayes Naive firmy Microsoft mogą służyć do analizy skojarzenia, jeśli struktura wyszukiwania zawiera zagnieżdżona tabela z atrybut przewidywalne jako klucz.Na przykład utworzyć model Naive Bayes za pomocą struktura wyszukiwania utworzone w Lekcja 3: Tworzenie scenariusza koszyk rynku (samouczek wyszukiwanie danych pośrednich) Samouczek wyszukiwanie danych. Model używany w tym przykładzie został zmodyfikowany, aby dodać informacje o region przychodów i klientów przypadek tabela.
W poniższym przykładzie kwerendy zawiera kwerendę pojedynczych prognozuje produktów, które są związane z zakupami produktu, 'Road Tire Tube'. Za pomocą tych informacji może zalecić produktów do określonego typu klienta.
SELECT PredictAssociation([Association].[v Assoc Seq Line Items])
FROM [Association_NB]
NATURAL PREDICTION JOIN
(SELECT 'High' AS [Income Group],
'Europe' AS [Region],
(SELECT 'Road Tire Tube' AS [Model])
AS [v Assoc Seq Line Items])
AS t
Częściowe wyniki:
Model |
---|
Women's Mountain Shorts |
Butli wody |
3000 Turystyczne |
Touring-2000 |
1000 Turystyczne |
Powrót do początku
Lista funkcja
Wszystkie Microsoft algorytmy obsługują wspólny zestaw funkcji. Jednak Microsoft Algorytm Bayes naive obsługuje inne funkcje, które są wymienione w poniższej tabela.
Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Algorytm Reference (Analysis Services — wyszukiwanie danych). Aby zapoznać się ze składnią określonych funkcji zobacz Odwołanie do funkcja wyszukiwanie danych rozszerzeń (DMX).
Historia zmian
Microsoft Learning |
---|
Dodać łącza nawigacyjne, które ułatwiają przeglądanie próbek kwerendy. |