Udostępnij za pośrednictwem


Podczas badania modelu neuronowe sieci (Analysis Services-wyszukiwanie danych)

Podczas tworzenia kwerendy przed model wyszukiwanie danych, można utworzyć kwerendę zawartości, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub przewidywanie kwerendę, która używa desenie w modelu, aby prognoz dla nowych danych.Na przykład kwerendy zawartości dla modelu neuronowe sieci może pobierać metadane modelu, takie jak liczba warstwy ukryte.Możesz również kwerendy przewidywanie może sugerować klasyfikacje w oparciu o dane wejściowe i opcjonalnie podać prawdopodobieństw każdego klasyfikacji.

W tej sekcji wyjaśniono, jak tworzyć kwerendy dla modeli, które są oparte na Microsoft Algorytm neuronowe sieci.

Kwerendy zawartości

Pobieranie metadane modelu przy użyciu DMX

Kwerendy przewidywanie

Tworzenie prognozowania Singleton

Znajdowanie informacji o modelu neuronowe sieci

Wszystkie modele górnictwo narazić rozpoznane przez algorytm zgodnie ze standardowym schematem, zestaw wierszy schematu model wyszukiwania zawartości.Informacje zawarte w modelu zawartość zawiera szczegółowe informacje dotyczące modelu i zawiera podstawowe metadane, struktur wykryte analizy oraz parametry, które są używane do przetwarzania.Można utworzyć kwerendy wobec zawartości modelu przy użyciu instrukcji DMX (rozszerzenie do wyszukiwanie danych).

Powrót do początku

Przykładowa kwerenda 1: Pobieranie metadane modelu przy użyciu DMX

Następująca kwerenda zwraca pewne podstawowe metadane dotyczące modelu, który został zbudowany przy użyciu Microsoft Algorytm neuronowe sieci. W modelu sieci neuronowe węzła nadrzędnego modelu zawiera tylko nazwę modelu, nazwa bazy danych, w której przechowywane są w modelu oraz liczby węzłów podrzędność.Jednak węzeł marginalna statystyk (NODE_TYPE = 24) zawiera zarówno te podstawowe metadane i niektóre pochodnego statystyki dotyczące wprowadzania kolumn w modelu.

W następującej kwerendzie przykładowej jest oparty na model wyszukiwania, które są tworzone w Pośrednie wyszukiwanie danych — samouczek, named Call Center Default NN. Model korzysta z danych od środka wywołanie zbadanie możliwości korelacji pomiędzy obsadzania i liczbę połączeń, zamówień i problemów.Instrukcja DMX pobiera dane z węzła marginalna statystyki modelu neuronowe sieci.Kwerenda zawiera słowo kluczowe FLATTENED, ponieważ statystyki odsetki są przechowywane w tabela zagnieżdżonej NODE_DISTRIBUTION.Niemniej jednak jeśli dostawca kwerendy obsługuje hierarchiczne zestawy wierszy nie trzeba FLATTENED słowo kluczowe.

SELECT FLATTENED MODEL_CATALOG, MODEL_NAME, 
(    SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE,
     [SUPPORT], [PROBABILITY], VALUETYPE 
     FROM NODE_DISTRIBUTION
) AS t
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 24

Uwaga

Należy wpisać nazwę kolumny w tabela zagnieżdżonej [SUPPORT] i [PROBABILITY] w nawiasach kwadratowych, aby odróżnić je od zastrzeżonych słów kluczowych o takiej samej nazwie.

Przykład wyniki:

MODEL_CATALOG

NAZWA_MODELU

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.SUPPORT

t.PROBABILITY

t.VALUETYPE

AdventureWorksDW 2008

Wywołanie Centrum NN

Średni czas na problem

Brak

0

0

1

AdventureWorksDW 2008

Wywołanie Centrum NN

Średni czas na problem

< 64.7094100096

11

0.407407407

5

Aby definicje kolumn w zestawie zestaw wierszy schematu znaczenie w kontekście modelu neuronowe sieci Zobacz model wyszukiwania Zawartości dla neuronowe modele sieci (Analysis Services — wyszukiwanie danych).

Powrót do początku

Przykładowa kwerenda 2: Pobieranie metadane modelu z zestaw wierszy schematu

Można znaleźć informacje, które są zwracane w kwerendzie zawartości DMX za pomocą kwerend wysyłanych do zestaw zestaw wierszy schematu wyszukiwanie danych.Jednak zestaw wierszy schemat zawiera kilka dodatkowych kolumn.W następującej kwerendzie przykładowej zwraca datę, która została utworzona w modelu, data, został zmodyfikowany i datę ostatniego przetworzenia modelu.Kwerenda zwraca również przewidywalne kolumn, które nie są łatwo dostępne w modelu zawartości, oraz parametry, które były używane w celu utworzenia modelu.Informacje te mogą być przydatne do dokumentowania modelu.

SELECT MODEL_NAME, DATE_CREATED, LAST_PROCESSED, PREDICTION_ENTITY, MINING_PARAMETERS 
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Default NN'

Przykład wyniki:

NAZWA_MODELU

Domyślne Centrum wywołanie NN

DATE_CREATED

1/10/2008 5: 07: 38 PM

LAST_PROCESSED

1/10/2008 5:24:02 PM

PREDICTION_ENTITY

Średni czas na problem,

Klasa usługa,

Liczba zamówień

MINING_PARAMETERS

HOLDOUT_PERCENTAGE = 30 HOLDOUT_SEED = 0,

MAXIMUM_INPUT_ATTRIBUTES = 255 MAXIMUM_OUTPUT_ATTRIBUTES = 255,

MAXIMUM_STATES = 100 SAMPLE_SIZE = 10 000 HIDDEN_NODE_RATIO = 4

Powrót do początku

Przykładowa kwerenda 3: Trwa pobieranie atrybutów wprowadzania dla modelu

Możesz pobrać pary atrybut wartość wejściowa użytych do utworzenia modelu za pomocą kwerend wysyłanych do węzłów podrzędność (NODE_TYPE = 20) warstwy wejściowy (NODE_TYPE = 18).Następująca kwerenda zwraca listę atrybutów wejściowego z opisy węzła.

SELECT NODE_DESCRIPTION
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 2

Przykład wyniki:

NODE_DESCRIPTION

Średni czas na rozchód = 64.7094100096 - 77.4002099712

Day of tydzień = Fri.

Operatorzy poziom 1

W tym polu wyświetlane są tylko kilku reprezentatywnych wierszy w wynikach.Jednak można zobaczyć, że NODE_DESCRIPTION informacje nieco inny w zależności od typu danych wejściowych atrybut.

  • Jeśli atrybut jest wartość discrete lub discretized, NODE_DESCRIPTION zawiera atrybut i jej wartość lub atrybut i jego discretized zakres.

  • Jeśli atrybut jest typ danych numerycznych ciągłe, the NODE_DESCRIPTION zawiera tylko nazwę atrybutu.Jednak można pobrać zagnieżdżona tabela NODE_DISTRIBUTION uzyskania średniej lub możesz pobrać NODE_RULE uzyskanie minimalną i maksymalną wartość liczbową zakres.

Następująca kwerenda pokazuje, jak kwerenda zagnieżdżona tabela NODE_DISTRIBUTION do zwracania atrybutów w jednej kolumnie i ich wartości w innej kolumnie.Należy zauważyć, że dla atrybut ciągłe, wartość atrybut jest reprezentowany przez jego średniej.

SELECT FLATTENED 
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE
FROM NODE_DISTRIBUTION) as t
FROM [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 21

Przykład wyniki:

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

Średni czas na problem

64.7094100096 - 77.4002099712

Day of tydzień

Pią.

Operatorzy poziom 1

3.2962962962963

Wartości minimalne i maksymalne zakres są przechowywane kolumna NODE_RULE i są reprezentowane jako XML fragment, jak pokazano w poniższym przykładzie:

<NormContinuous field="Level 1 Operators">  
  <LinearNorm orig="2.83967303681711" norm="-1" />  
  <LinearNorm orig="3.75291955577548" norm="1" />  
</NormContinuous>  

Powrót do początku

Przykładowa kwerenda 4: Trwa pobieranie grubość z warstwy ukryte

Model zawartości modelu neuronowe sieci ma strukturę w taki sposób, że można w prosty sposób pobierania szczegółów dowolnego węzła w sieci.Ponadto numery identyfikatorów węzłów zawierają informacje, które pomagają określić relacje między typami węzłów.

Następująca kwerenda pokazuje, jak pobrać współczynniki, które są przechowywane w określonym węźle ukrytej warstwie.Ukrytej warstwie składa się z węzła programu organizer (NODE_TYPE = 19), który zawiera tylko metadane i wielu węzłów podrzędność (NODE_TYPE = 22), które zawierają współczynniki dla różnych kombinacji atrybutów i wartości.Ta kwerenda zwraca tylko węzły współczynnik.

SELECT FLATTENED TOP 1 NODE_UNIQUE_NAME, 
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM  [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 22
AND [PARENT_UNIQUE_NAME] = '40000000200000000' FROM [Call Center Default NN].CONTENT

Przykład wyniki:

NODE_UNIQUE_NAME

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.VALUETYPE

70000000200000000

6 000 000 000 000 000a

-0.178616518

7

70000000200000000

6000000000000000b

-0.267561918

7

70000000200000000

6000000000000000c

0.11069497

7

70000000200000000

6000000000000000d

0.123757712

7

70000000200000000

6000000000000000e

0.294565343

7

70000000200000000

6000000000000000f

0.22245318

7

70000000200000000

  

0.188805045

7

Częściowe wyniki pokazanego wykazać, jak zawartość modelu sieci neuronowe dotyczy ukryte węzła węzłów wejściowych.

  • Unikatowe nazwy węzłów w ukrytej warstwie zawsze zaczynają się od 70000000.

  • Unikatowe nazwy węzłów wejściowych warstwie zawsze zaczynają się od 60000000.

W ten sposób te wyniki informujący że oznaczona 70000000200000000 identyfikator węzła ma sześć różnych współczynnikach (wartości = 7) do niej przekazany.Wartości współczynników znajdują się kolumna ATTRIBUTE_VALUE.Można określić dokładnie co wejściowy współczynnik jest przy użyciu IDENTYFIKATORA węzła kolumna ATTRIBUTE_NAME atrybut.

Na przykład 6000000000000000a identyfikator węzła odwołuje się atrybut wejściowy i wartości, Day of Week = 'Tue.' Identyfikator węzła można użyć do utworzenia kwerendy lub do węzła można przeglądać za pomocą Podgląd zawartości drzewa rodzajowa firmy Microsoft.

Podobnie jeżeli kwerenda tabela NODE_DISTRIBUTION węzłów w warstwie danych wyjściowych (NODE_TYPE = 23), można wyświetlić współczynniki dla każdego wyjściowych wartości.Jednak w warstwie danych wyjściowych wskaźników dotyczą ponownie węzły ukrytej warstwie.Aby uzyskać więcej informacji zobaczmodel wyszukiwania Zawartości dla neuronowe modele sieci (Analysis Services — wyszukiwanie danych).

Powrót do początku

Tworzenie prognoz przy użyciu modelu neuronowe sieci

The Microsoft Neural Network algorithm supports both classification and regresja. Można użyć przewidywanie funkcje za pomocą tych modeli, aby podać nowe dane i utworzyć albo pojedynczych lub przetwarzania wsadowego przewidywanie s.

Przykładowa kwerenda 5: Tworzenie Singleton przewidywanie

Najprostszym sposobem skonstruować kwerendę przewidywanie na modelu neuronowe sieci jest użycie konstruktora kwerend prognozowania, dostępny na Prognozowania wyszukiwania kartę Konstruktor wyszukiwanie danych w obu SQL Server Management Studio i Business Intelligence Development Studio. Można przeglądać w modelu Microsoft Neuronowe podglądu sieci filtrowania atrybutów odsetek i przeglądanie trendów, a następnie przełącz się do Prognozowania wyszukiwania kartę, aby utworzyć kwerendę i przewidywanie nowe wartości dla tych trendów.

Na przykład można przeglądać model Centrum wywołania, aby wyświetlić korelacji pomiędzy wielkość zamówienia i inne atrybuty.Aby to zrobić, Otwórz model, w przeglądarce, a dla Dane wejściowe, select <Wszystkie>. Następnie dla Dane wyjściowe, select Numer zamówienia.Dla Wartość 1, zaznacz zakres, który przedstawia najbardziej zamówień, a dla Wartość 2, zaznacz zakres, który reprezentuje najmniejsze zamówień.Następnie widoczne na pierwszy rzut oka wszystkie atrybuty modelu jest całkowicie skorelowany z ilością zamówienia.

Przeglądając wyniki w przeglądarce, można znaleźć określone dni tygodnia, że woluminy znaczących i że wzrost liczby podmiotów gospodarczych wydaje się można skorelować z wyższym sprzedaży.Można następnie użyć kwerendy przewidywanie na modelu do testowania hipotez "co w przypadku, gdy" i poprosić o zwiększenie liczby podmiotów gospodarczych, poziom 2 w dniu niskim woluminu może zwiększyć zamówień.W tym celu należy utworzyć kwerendę, takie jak:

SELECT Predict([Call Center Default NN].[Number of Orders]) AS [Predicted Orders],
PredictProbability([Call Center Default NN].[Number of Orders]) AS [Probability]
FROM [Call Center Default NN]
NATURAL PREDICTION JOIN 
(SELECT 'Tue.' AS [Day of Week]
13 AS [Level 2 Operators] AS t

Przykład wyniki:

Przewidywane zamówienia

Prawdopodobieństwo

364

0.9532…

Przewidywane wielkości sprzedaży jest większa niż bieżący zakres sprzedaży dla wtorku, a prawdopodobieństwo przewidywanie jest bardzo duża.Można jednak utworzyć wiele prognoz za pomocą procesu partia do testowania różnych hipotez w modelu.

Uwaga

wyszukiwanie danych dodatki programu Excel 2007 zapewniają kreatory logistyczne regresja, które ułatwiają odpowiedzi na pytania złożonych, takich jak liczby dwa operatory poziom byłaby potrzebna do poprawy jakości usługa do poziomu docelowego dla określonego przesunięcia.wyszukiwanie danych Dodatki są bezpłatnie pobrać i zawierają kreatorów, które są oparte na sieci neuronowe i/lub regresja logistyczne algorytmów.Aby uzyskać więcej informacji, zobacz temat Dane wyszukiwanie dodatki pakietu Office 2007 r. Witryna sieci Web.

Powrót do początku

Lista przewidywanie funkcje

Wszystkie Microsoft algorytmy obsługują wspólny zestaw funkcji. Dostępne są funkcje nie przewidywanie, które są specyficzne dla Microsoft Algorytm neuronowe sieci; jednak algorytm obsługuje funkcje, które są wymienione w poniższej tabela.

IsDescendant (DMX)

PredictStdev (DMX)

PredictAdjustedProbability (DMX)

PredictSupport (DMX)

Uwaga   Neuronowe sieci i modele logistyczne regresja zwraca jedną wartość, która reprezentuje rozmiar szkolenia zestaw dla całego modelu.

PredictHistogram (DMX)

PredictVariance (DMX)

PredictProbability (DMX)

  

Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Algorytm Reference (Analysis Services — wyszukiwanie danych). Aby zapoznać się ze składnią określonych funkcji zobacz Odwołanie do funkcja wyszukiwanie danych rozszerzeń (DMX).

Historia zmian

Microsoft Learning

Dodano łącza w temacie ot był ewasier do przenoszenia między próbkami kwerendy.