Udostępnij za pośrednictwem


Podczas badania Naive modelu Bayes (Analysis Services — wyszukiwanie danych)

Podczas tworzenia kwerendy przed model wyszukiwanie danych, można utworzyć albo zawartości kwerendę, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie, która używa desenie w modelu, aby prognoz dla nowych danych.Można również pobierać metadane dotyczące modelu za pomocą kwerendy przed zestaw wierszy schematu wyszukiwanie danych.W tej sekcji wyjaśniono, jak utworzyć te kwerendy dla modeli, które są oparte na algorytmie Bayes Naive firmy Microsoft.

  • Kwerendy zawartości

    Pobieranie metadane modelu przy użyciu DMX

    Trwa pobieranie podsumowanie danych szkolenia

    Znajdowanie dalszych informacji dotyczących atrybutów

    Korzystanie z systemu przechowywanych procedur

  • Kwerendy przewidywanie

    Przewidywana wyniki przy użyciu kwerendy Singleton

    Zwróciło prognoz prawdopodobieństwo i obsługi technicznej

    Przewidywana skojarzenia

Znajdowanie informacji o modelu Bayes Naive

Model zawartości modelu Naive Bayes zawiera zagregowane informacje dotyczące występowania wartości w danych szkolenia.Można także pobrać informacje o metadane modelu przez utworzenie kwerendy przed wierszy schematu wyszukiwanie danych.

Powrót do początku

Przykładowa kwerenda 1: Pobieranie metadane modelu przy użyciu DMX

Za pomocą kwerend wysyłanych do zestaw zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane modelu.Może to dotyczyć, gdy model został utworzony, podczas ostatniego przetworzenia modelu, nazwa struktura wyszukiwania na podstawie modelu i nazwy kolumn używanych jako atrybut przewidywalne.Można także wrócić parametrów, które były używane podczas tworzenia modelu.

SELECT MODEL_CATALOG, MODEL_NAME, DATE_CREATED, LAST_PROCESSED,
SERVICE_NAME, PREDICTION_ENTITY, FILTER
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_NaiveBayes_Filtered'

Przykładowe wyniki:

MODEL_CATALOG

AdventureWorks

NAZWA_MODELU

TM_NaiveBayes_Filtered

DATE_CREATED

3/1/2008 19:15

LAST_PROCESSED

3/2/2008 20:00

NAZWA_USŁUGI

Microsoft_Naive_Bayes

PREDICTION_ENTITY

Nabywca rowerów, roczny dochód

FILTER

[Region] = "Europa" lub [Region] = "USA"

Model używany w tym przykładzie jest oparty na modelu Naive Bayes, Utwórz w Podstawowe wyszukiwanie danych — samouczek, ale został zmodyfikowany przez dodanie drugiej atrybut przewidywalny i zastosowanie filtru do danych szkoleniowych.

Powrót do początku

Przykładowa kwerenda 2: Trwa pobieranie podsumowanie danych szkolenia

W modelu Naive Bayes węzeł Statystyka marginalna przechowuje zagregowane informacje dotyczące występowania wartości w danych szkoleniowych.Podsumowanie to jest wygodne i zapisuje użytkownik z konieczności tworzenia kwerend SQL dla danych szkolenia, aby znaleźć te same informacje.

W poniższym przykładzie użyto DMX zawartości kwerendy do pobierania danych z węzła (NODE_TYPE = 24).Ponieważ statystyki są przechowywane w tabela zagnieżdżonej, słowo kluczowe FLATTENED jest używana do ułatwiają wyświetlanie wyniki.

SELECT FLATTENED MODEL_NAME,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT], [PROBABILITY], VALUETYPE FROM NODE_DISTRIBUTION) AS t
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 26

Uwaga

Nazwy kolumn, SUPPORT i prawdopodobieństwo, należy ująć w nawiasy, aby odróżnić je od słów kluczowych wyrażeń MDX (Multidimensional) zarezerwowane o tych samych nazwach.

Częściowe wyniki:

NAZWA_MODELU

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.SUPPORT

t.PROBABILITY

t.VALUETYPE

TM_NaiveBayes

Rower kupujących

Brak

0

0

1

TM_NaiveBayes

Rower kupujących

0

8869

0.507263784

4

TM_NaiveBayes

Rower kupujących

1

8615

0.492736216

4

TM_NaiveBayes

Płeć

Brak

0

0

1

TM_NaiveBayes

Płeć

P

8656

0.495081217

4

TM_NaiveBayes

Płeć

M

8828

0.504918783

4

Na przykład, wyniki te informują liczba przypadków szkoleń dla każdej wartości discrete (wartości = 4), razem z prawdopodobieństwem obliczaną, skorygowaną o brakujących wartości (wartości = 1).

Aby uzyskać definicję wartości podane w tabela NODE_DISTRIBUTION w modelu Naive Bayes zobacz model wyszukiwania Zawartości dla Naive modele Bayes (Analysis Services — wyszukiwanie danych). Aby uzyskać więcej informacji na temat wpływu obliczenia prawdopodobieństwa i obsługę przez brakujących wartości zobacz Brak wartości (Analysis Services — wyszukiwanie danych).

Powrót do początku

Przykładowa kwerenda 3: Znajdowanie dalszych informacji dotyczących atrybutów

Ponieważ model Naive Bayes często zawiera złożone informacje o relacji między różnymi atrybutami, najłatwiejszy sposób, aby wyświetlić te relacje jest użycie Podgląd Bayes Naive firmy Microsoft.Można jednak utworzyć DMX kwerendy, aby dane były zwracane.

W poniższym przykładzie pokazano, jak do zwracania informacji z modelu o określonego atrybut, region.

SELECT NODE_TYPE, NODE_CAPTION, 
NODE_PROBABILITY, NODE_SUPPORT, MSOLAP_NODE_SCORE
FROM TM_NaiveBayes.CONTENT
WHERE ATTRIBUTE_NAME = 'Region'

Ta kwerenda zwraca dwa typy węzłów: węzeł, który reprezentuje atrybut wejściowy (NODE_TYPE = 10) i węzłów dla każdej wartości atrybutu (NODE_TYPE = 11). Podpis węzła służy do identyfikacji węzła, a nie nazwy węzła, ponieważ podpis zawiera nazwę atrybut i wartości atrybut.

NODE_TYPE

NODE_CAPTION

NODE_PROBABILITY

NODE_SUPPORT

MSOLAP_NODE_SCORE

NODE_TYPE

10

Rower kupujących-> Region

1

17484

84.51555875

10

11

Rower kupujących-> Region = Brak

0

0

0

11

11

Rower kupujących-> Region = USA

0.508236102

8886

0

11

11

Rower kupujących-> Region = Pacyfiku

0.193891558

3390

0

11

11

Rower kupujących-> Region = Europa

0.29787234

5208

0

11

Niektórych kolumn, przechowywane w węzłach są takie same, można uzyskać z węzłów marginalna statystyk, takich jak ocena prawdopodobieństwa węzła i węzeł obsługuje wartości.Jednak MSOLAP_NODE_SCORE jest wartością specjalną dostarczane tylko dla węzłów wejściowych atrybut a wskazuje względną wagę tego atrybutu w modelu.Można wyświetlić wiele te same informacje w okienku zależności sieci podglądu; jednak przeglądarka nie udostępnia wyniki.

Następująca kwerenda zwraca wyniki znaczenie wszystkich atrybutów w modelu:

SELECT NODE_CAPTION, MSOLAP_NODE_SCORE
FROM TM_NaiveBayes.CONTENT
WHERE NODE_TYPE = 10
ORDER BY MSOLAP_NODE_SCORE DESC

Przykładowe wyniki:

NODE_CAPTION

MSOLAP_NODE_SCORE

Rower kupujących-> Całkowita elementy podrzędne

181.3654836

Rower kupujących-> Commute odległość

179.8419482

Rower kupujących-> Angielski edukacja

156.9841928

Rower kupujących-> Liczba dzieci w Główny

111.8122599

Rower kupujących-> Region

84.51555875

Rower kupujących-> Stan cywilny

23.13297354

Rower kupujących-> Angielski, zawód

2.832069191

Przeglądając zawartość modelu Podgląd zawartości drzewa rodzajowa firmy Microsoft, uzyskasz lepsze rozwiązanie z statystyk, jakie mogą być interesujące.Przykłady prostych były wykazane w tym miejscu; częściej może być konieczne wykonać wielu kwerend lub wyniki są przechowywane i przetwarzać je klient.

Powrót do początku

Przykładowa kwerenda 4: Za pomocą procedury składowane w systemie

Dodatkowo, oprócz zapisywania kwerendy zawartości, można użyć niektórych usług Analysis Services procedury składowane w systemie przeszukiwać wyniki.Aby użyć systemu przechowywane procedury, prefiks nazwy procedura przechowywana ze słowem kluczowym Wywołaj:

CALL GetPredictableAttributes ('TM_NaiveBayes')

Częściowe wyniki:

ATTRIBUTE_NAME

NODE_UNIQUE_NAME

Rower kupujących

100000001

Uwaga

Te procedury składowane w systemie są do wewnętrznej komunikacji między serwerem usług Analysis Services i klient i powinno być używane tylko dla wygody podczas opracowywania i testowania modeli wyszukiwania.Podczas tworzenia kwerendy w systemie produkcji należy zawsze wpisać własne kwerendy przy użyciu DMX AMO i XMLA.

Aby uzyskać więcej informacji na temat usług Analysis Services systemu Zobacz procedur przechowywanych Wyszukiwanie danych przechowywanych procedur (Analysis Services — wyszukiwanie danych).

Powrót do początku

Tworzenie przy użyciu modelu prognoz

Microsoft Bayes Naive algorytm jest zazwyczaj używane mniej do przewidywanie niż eksploracji relacje między atrybuty wejściowych i przewidywalny.Jednak w modelu obsługuje korzystanie z funkcji przewidywanie prognozowania i skojarzenia.

Przykładowa kwerenda 5: Przewidywana wyniki przy użyciu Singleton Query

Następujące zastosowania kwerendy pojedyncza kwerendy, aby podać nową wartość i przewidywania, oparty na modelu, czy dla nabywcy z tych właściwości jest prawdopodobne, że kupują rowerów.Najprostszym sposobem utworzenia pojedynczych kwerendy w modelu regresja jest przy użyciu Pojedyncza Query wprowadzania -okno dialogowe.Na przykład utworzyć następującą kwerendę DMX wybierając TM_NaiveBayes model, wybieranie Pojedyncza kwerendyi wybieranie wartości z listy rozwijanej [Commute Distance] i Gender.

SELECT
  Predict([TM_NaiveBayes].[Bike Buyer])
FROM
  [TM_NaiveBayes]
NATURAL PREDICTION JOIN
(SELECT '5-10 Miles' AS [Commute Distance],
  'F' AS [Gender]) AS t

Przykład wyniki:

Expression

0

przewidywanie Funkcja zwraca wartość najczęściej wartość, w tym przypadek 0, co oznacza tego typu odbiorca jest mało prawdopodobne, aby kupić rowerów.

Powrót do początku

Przykładowa kwerenda 6: Zwróciło prawdopodobieństwo i obsługa techniczna prognoz

W uzupełnieniu do przewidywanie wyniku, często chcą wiedzieć, jak silne są przewidywanie.Następująca kwerenda używa tej samej kwerendy pojedynczych, jak w poprzednim przykładzie, ale dodaje funkcja prognozowania PredictHistogram (DMX), aby przywrócić zagnieżdżoną tabela, która zawiera dane statystyczne w celu prognozowania wartości.

SELECT
  Predict([TM_NaiveBayes].[Bike Buyer]),
  PredictHistogram([TM_NaiveBayes].[Bike Buyer])
FROM
  [TM_NaiveBayes]
NATURAL PREDICTION JOIN
(SELECT '5-10 Miles' AS [Commute Distance],
  'F' AS [Gender]) AS t

Przykład wyniki:

Rower kupujących

OBSŁUGA $

PRAWDOPODOBIEŃSTWO $

$ ADJUSTEDPROBABILITY

ODCHYLENIE $

$ ODCH.STANDARDOWE

0

10161.5714

0.581192599

0.010530981

0

0

1

7321.428768

0.418750215

0.008945684

0

0

  

0.999828444

5.72E - 05

5.72E - 05

0

0

Końcowe wierszy w tabela pokazuje korekt do obsługi i prawdopodobieństwa dla brakujących wartości.Wartości wariancji i odchylenia standardowego są zawsze 0, ponieważ modeli Naive Bayes nie modelu stałe wartości.

Powrót do początku

Przykładowa kwerenda 7: Przewidywana skojarzenia

Algorytm Bayes Naive firmy Microsoft mogą służyć do analizy skojarzenia, jeśli struktura wyszukiwania zawiera zagnieżdżona tabela z atrybut przewidywalne jako klucz.Na przykład utworzyć model Naive Bayes za pomocą struktura wyszukiwania utworzone w Lekcja 3: Tworzenie scenariusza koszyk rynku (samouczek wyszukiwanie danych pośrednich) Samouczek wyszukiwanie danych. Model używany w tym przykładzie został zmodyfikowany, aby dodać informacje o region przychodów i klientów przypadek tabela.

W poniższym przykładzie kwerendy zawiera kwerendę pojedynczych prognozuje produktów, które są związane z zakupami produktu, 'Road Tire Tube'. Za pomocą tych informacji może zalecić produktów do określonego typu klienta.

SELECT   PredictAssociation([Association].[v Assoc Seq Line Items])
FROM [Association_NB]
NATURAL PREDICTION JOIN
(SELECT 'High' AS [Income Group],
  'Europe' AS [Region],
  (SELECT 'Road Tire Tube' AS [Model]) 
AS [v Assoc Seq Line Items]) 
AS t

Częściowe wyniki:

Model

Women's Mountain Shorts

Butli wody

3000 Turystyczne

Touring-2000

1000 Turystyczne

Powrót do początku

Lista funkcja

Wszystkie Microsoft algorytmy obsługują wspólny zestaw funkcji. Jednak Microsoft Algorytm Bayes naive obsługuje inne funkcje, które są wymienione w poniższej tabela.

Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Algorytm Reference (Analysis Services — wyszukiwanie danych). Aby zapoznać się ze składnią określonych funkcji zobacz Odwołanie do funkcja wyszukiwanie danych rozszerzeń (DMX).

Historia zmian

Microsoft Learning

Dodać łącza nawigacyjne, które ułatwiają przeglądanie próbek kwerendy.