Górnictwo modelu zawartości (Analysis Services - wyszukiwania danych)
Po zaprojektowane i przetwarzane modelu górnictwa, używając danych z podstawowych struktura wyszukiwania, model górnictwo jest pełny i zawiera górnictwa modelu zawartości.Przewidywania lub analizowania danych, można użyć tej zawartości.
Górnictwo modelu zawartości zawiera metadane dotyczące modelu, statystyki dotyczące danych i wykrytych przez algorytm wyszukiwania wzorców.W zależności od algorytmu, który został użyty zawartość modelu może zawierać formuły regresja, definicje reguł i itemsets lub wag i innych informacji statystycznych.
Niezależnie od algorytmu, który został użyty model wyszukiwania zawartości jest przedstawiany w standardowej strukturze.Można przeglądać strukturę w ogólnej zawartości drzewa Podgląd firmy Microsoft, w Business Intelligence Development Studio, a następnie przełącz się do jednego z niestandardowych odbiorcom Zobacz, jak informacje są interpretowane i wyświetlane graficznie, dla każdego typu modelu. Można również utworzyć kwerendy przeciwko model wyszukiwania zawartości za pomocą dowolnego klient, który obsługuje zestaw wierszy schematu MINING_MODEL_CONTENT.Aby uzyskać więcej informacji, zobacz Badanie modeli wyszukiwania danych: Tematy dotyczące wykonywania określonych zadań (Analysis Services - wyszukiwania danych).
W tej sekcji opisano podstawową strukturę zawartość dla wszystkich rodzajów modeli wyszukiwania.Opisuje typy węzłów, które są wspólne dla wszystkich model wyszukiwania zawartości i zawiera wskazówki dotyczące interpretacji informacji.
Struktura modelu wydobycia, zawartość
Węzły
Wyszukiwania zawartości typu algorytmu modelu
Narzędzia do przeglądania zawartości modelu górnictwo
Narzędzia do badania zawartości modelu górnictwo
Struktura modelu wydobycia, zawartość
Zawartość każdego modelu jest przedstawiany jako seria węzłów.Węzeł jest obiekt model wyszukiwania zawiera metadane i informacje o części modelu.Węzły są ułożone w hierarchii.Dokładne rozmieszczenie węzłów w hierarchii i znaczenie hierarchii, zależy od użytego algorytmu.Na przykład jeśli tworzysz model drzewa decyzji modelu może zawierać wiele drzew, wszystkie podłączone do głównego modelu; Utwórz model sieci neuronowe, modelu mogą zawierać jeden lub więcej sieci plus węzeł Statystyka.
Pierwszy węzeł w każdym modelu jest nazywany węzła głównego, lub modelu nadrzędnego węzła.Każdy model ma węzła głównego (NODE_TYPE = 1).Węzeł główny zazwyczaj zawiera niektóre metadane dotyczące modelu, a liczba węzłów podrzędność, ale niewiele dodatkowe informacje dotyczące wzorców wykryte przez model.
W zależności od tego, który algorytm używany do tworzenia modelu węzła głównego ma różną liczbę węzłów podrzędność.Węzły podrzędne mają różne znaczenie i innej zawartości, w zależności od algorytmu i głębokość i stopnia złożoności danych.
Powrót do początku
Węzły
W model wyszukiwania, węzeł jest ogólnego kontener, który przechowuje informacje o wszystkich lub części modelu.Struktura każdego węzła jest zawsze taka sama i zawiera kolumny zdefiniowane przez wyszukiwania danych zestaw zestaw wierszy schematu.Aby uzyskać więcej informacji, zobacz DMSCHEMA_MINING_MODEL_CONTENT wierszy.
Każdy węzeł zawiera metadane dotyczące węźle, w tym identyfikator, który jest unikatowy w obrębie każdego modelu identyfikator węzła nadrzędnego, a liczba węzłów podrzędność, które ma węzła.Metadane identyfikuje modelu, do której należy dany węzeł i przechowywania tego konkretnego modelu wykaz bazy danych.Dodatkową zawartość w węźle różni się w zależności od typu algorytm używany do tworzenia modelu i mogą być następujące:
Liczba przypadków w dane szkolenia obsługuje określonego prognozowanej wartości.
Statystyki, takie jak średnia, odchylenie standardowe lub WARIANCJA.
Współczynniki i formuły.
Definicja reguły i boczne wskaźniki.
Fragmenty XML opisujących części modelu.
Lista typów węzłów
Poniższa tabela zawiera listę różnych typów węzłów, które są dostępne w przypadku modeli wyszukiwanie danych.Ponieważ każdy algorytm przetwarza informacje inaczej, każdy model generuje tylko kilka określonych typów węzłów.Jeśli zmienisz algorytm może zmienić typ węzłów.Ponadto jeśli użytkownik ponownie przetwórz model, może zmienić zawartość każdego węzła.
Ostrzeżenie
Jeśli jest używana usługa wyszukiwanie danych innego niż te przewidziane w usługach Analysis Services programu SQL Server 2008 lub utworzyć własny dodatek algorytmy, mogą być dostępne typy dodatkowego węzła niestandardowe.
IDENTYFIKATOR NODE_TYPE |
Etykieta węzła |
Zawartość węzła |
---|---|---|
1 |
Model |
Metadane i główny węzeł zawartości.Dotyczy to wszystkich typów modelu. |
2 |
Drzewa |
Węzeł główny drzewa klasyfikacji.Stosuje się do modeli drzewo decyzyjne. |
3 |
Wnętrze |
Wnętrze podzielić węzeł w drzewie.Stosuje się do modeli drzewo decyzyjne. |
4 |
Rozkład |
Terminal węzła drzewa.Stosuje się do modeli drzewo decyzyjne. |
5 |
Klaster |
Klastrów wykrytych przez algorytm.Dotyczy klastrowanie modeli i klastrowanie modeli sekwencji. |
6 |
Nieznany |
Typ nieznany węzeł. |
7 |
ItemSet |
Itemset wykrytych przez algorytm.Dotyczy skojarzenia modeli lub sekwencji klastrowanie modeli. |
8 |
AssociationRule |
Stowarzyszenie reguła wykryty przez algorytm.Dotyczy skojarzenia modeli lub sekwencji klastrowanie modeli. |
9 |
PredictableAttribute |
Atrybut przewidywalne.Dotyczy to wszystkich typów modelu. |
10 |
InputAttribute |
Atrybut danych wejściowych.Stosuje się do drzewa decyzji i modele Naïve Bayes. |
11 |
InputAttributeState |
Statystyka Państwa atrybut wejściowy.Stosuje się do drzewa decyzji i modele Naïve Bayes. |
13 |
Sekwencja |
Węzeł najwyższego poziomu dla składnika modelu Markov klastra sekwencji.Dotyczy sekwencji klastrowanie modeli. |
14 |
Przejścia |
Macierz transformacji Markov.Dotyczy sekwencji klastrowanie modeli. |
15 |
Szereg czasowy |
Węzeł główny non czas serii drzewa.Stosuje się do czas serii tylko modele. |
16 |
TsTree |
Węzeł główny drzewa serii czas odpowiadający szeregu czasowego przewidywalne.Stosuje się do czas modele serii i tylko wtedy, gdy model został utworzony przy użyciu parametru MIESZANYCH. |
17 |
NNetSubnetwork |
Jeden sub-network.Stosuje się do sieci neuronowe modeli. |
18 |
NNetInputLayer |
Grupa zawiera węzły wprowadzania warstwy.Stosuje się do sieci neuronowe modeli. |
19 |
NNetHiddenLayer |
Grupy, które zawiera węzły, które opisują warstwy ukryte.Stosuje się do sieci neuronowe modeli. |
21 |
NNetOutputLayer |
Grupy, które zawiera węzły wyjściowe warstwy.Stosuje się do sieci neuronowe modeli. |
21 |
NNetInputNode |
Węzeł w wejściowy warstwy, która pasuje do wprowadzania atrybut z odpowiednimi państwami.Stosuje się do sieci neuronowe modeli. |
22 |
NNetHiddenNode |
Węzeł w ukrytej warstwie.Stosuje się do sieci neuronowe modeli. |
23 |
NNetOutputNode |
Węzeł w warstwie danych wyjściowych.Ten węzeł zwykle będzie pasował do atrybut wyjścia i odpowiednich państw.Stosuje się do sieci neuronowe modeli. |
24 |
NNetMarginalNode |
Marginalna statystykę zestaw szkoleniowy.Stosuje się do sieci neuronowe modeli. |
25 |
RegressionTreeRoot |
Katalog główny drzewa regresja.Dotyczy regresja liniowej modeli i modele drzewa decyzji, które zawiera atrybuty ciągłego wprowadzania. |
26 |
NaiveBayesMarginalStatNode |
Marginalna statystykę zestaw szkoleniowy.Stosuje się do modeli Naïve Bayes. |
27 |
ArimaRoot |
Węzeł główny modelu ARIMA.Stosuje się tylko do tych czas modeli serii algorytm ARIMA. |
28 |
ArimaPeriodicStructure |
Struktura okresowych w modelu ARIMA.Stosuje się tylko do tych czas modeli serii algorytm ARIMA. |
29 |
ArimaAutoRegressive |
Współczynnik pojedynczy termin w modelu ARIMA Autoregressive. Stosuje się tylko do tych czas modeli serii algorytm ARIMA. |
30 |
ArimaMovingAverage |
Przenoszenie średni współczynnik dla jednego terminu w modelu ARIMA.Stosuje się tylko do tych czas modeli serii algorytm ARIMA. |
1000 |
CustomBase |
Punkt początkowy dla typów węzłów niestandardowe.Typy węzłów niestandardowe muszą być liczbami całkowitymi większej wartości niż ta stała.Stosuje się do modeli utworzonych przy użyciu algorytmów niestandardowych dodatku plug-in. |
Identyfikator węzła, nazwisko, podpis i opis
Węzeł główny każdego modelu zawsze ma unikatowy identyfikator (NODE_UNIQUE_NAME) 0.Wszystkie identyfikatory węzeł są przypisywane automatycznie przez usługi Analysis Services i nie można modyfikować.
Węzeł główny dla każdego modelu zawiera również pewne podstawowe metadane dotyczące modelu.metadane zawiera osobny model bazy danych usług Analysis Services (MODEL_CATALOG), schemat (MODEL_SCHEMA), a nazwa modelu (nazwa_modelu).Jednakże informacje powtarza się w wszystkie węzły modelu, więc nie trzeba zbadać węzła głównego uzyskać metadane.
Oprócz nazwy używane jako identyfikator unikatowy, każdy węzeł dysponuje nazwę (nazwa_węzła).Ta nazwa jest automatycznie tworzony przez algorytm w celach wyświetlania i nie może być edytowany.
Ostrzeżenie
Algorytm klastrowania firmy Microsoft umożliwia użytkownikom przypisać przyjazne nazwy każdego klastra.Jednak te przyjazne nazwy nie są zachowywane na serwerze, a jeśli użytkownik ponownie przetwórz model, algorytm generuje nowe nazwy klastra.
Podpis i Opis dla każdego węzła są generowane automatycznie przez algorytm i etykiet, aby ułatwić zrozumienie zawartości węzła.Tekst wygenerowany dla każdego pole zależy od typu modelu.W niektórych przypadkach nazwisko, podpis i opis może zawierać ten sam ciąg, ale w niektórych modelach opis może zawierać dodatkowe informacje.Zobacz temat typ modelu szczegóły realizacji.
Ostrzeżenie
Serwera Analysis Services obsługuje, zmiana nazwy węzłów tylko w przypadku tworzenia modeli przy użyciu niestandardowe algorytm dodatek, który implementuje zmianę nazwy.Podczas tworzenia dodatku algorytm umożliwiające zmienianie nazw należy zastąpić metody.
Węzeł nadrzędne, podrzędne węzła i Kardynalność węzła
Związek między nadrzędnym i podrzędność węzły w strukturze drzewa jest określana przez wartość z kolumna PARENT_UNIQUE_NAME.Ta wartość jest przechowywana w podrzędność węzła i informuje o identyfikator węzła nadrzędnego.Niektóre przykłady sposobu użycia tych informacji może być:
PARENT_UNIQUE_NAME, który jest NULL oznacza, że węzeł jest węzłem modelu.
Jeśli wartość PARENT_UNIQUE_NAME jest równa 0, węzeł musi być bezpośrednio podrzędny węzeł najwyższego poziomu w modelu.Wynika to identyfikator węzła głównego jest zawsze 0.
Za pomocą funkcji w ramach kwerendy danych górnictwa rozszerzenia (DMX) elementy podrzędne lub nadrzędne określonego węzła.Aby uzyskać więcej informacji o korzystaniu z funkcji w kwerendach, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).
Kardynalność odnosi się do liczby elementów w zestaw.W kontekście przetworzonych model wyszukiwania, liczebność informuje liczby dzieci w określonym węźle.Na przykład, jeśli model drzewo decyzyjne ma węzła dla [roczny dochód] i węzeł ma dwa węzły podrzędność, jedną dla warunku [roczny dochód] = wysoki i jedną dla warunku [roczny dochód] = niski, wartość CHILDREN_CARDINALITY dla węzła [roczny dochód] byłoby 2.
Ostrzeżenie
W Usługi Analysis Services, tylko węzły podrzędność natychmiastowe są uwzględniane przy obliczaniu Kardynalność węzła.Jednak utworzyć niestandardowy algorytm dodatku, można przeciążenia CHILDREN_CARDINALITY do zliczania Kardynalność inaczej.Może to być przydatne, na przykład, jeśli chciał liczba całkowita liczba elementy podrzędne, nie tylko bezpośrednie elementy podrzędne.
Chociaż Kardynalność jest liczony w taki sam sposób dla wszystkich modeli, jak interpretować lub użyj wartości Kardynalność różni się w zależności od typu modelu.Na przykład w klastrowanie modelu Kardynalność węzłem informuje całkowita liczba klastrów, które zostały znalezione.W innych typach modeli Kardynalność zawsze może być zestaw wartości w zależności od typu węzła.Aby uzyskać więcej informacji dotyczących sposobu interpretowania Kardynalność zobacz temat about typu modelu.
Ostrzeżenie
Niektóre modele, takich jak przez algorytm sieci neuronowe Microsoft dodatkowo zawierają typ węzła specjalne, która zapewnia Statystyki opisowe informacje o danych szkolenia dla całego modelu.Z definicji węzły te nigdy mieć węzłów podrzędność.
Węzła dystrybucyjnego
Kolumna NODE_DISTRIBUTION zawiera zagnieżdżoną tabela, że w wielu węzłów zawiera ważne i szczegółowe informacje dotyczące wzorców wykrytych przez algorytm.Dokładne statystyki zawarte w tej tabela zmienia się w zależności od typu modelu, pozycja węzła w drzewie i czy atrybut przewidywalne ciągłą wartość numeryczną lub dyskretnych wartości; może jednak zawierać minimalne i maksymalne wartości atrybut, wag przypisanych do wartości liczby przypadków w węźle Współczynniki użyte w formule regresja i środki statystyczne odchylenie standardowe i WARIANCJA.Aby uzyskać więcej informacji dotyczących sposobu interpretowania węzła dystrybucji zobacz temat dla określonego typu typ modelu, który pracuje z.
Ostrzeżenie
Tabela NODE_DISTRIBUTION może być puste, w zależności od typu węzła.Na przykład niektóre węzły służą tylko do organizowania kolekcja węzły podrzędność i jest węzłów podrzędność, które zawierają szczegółowe statystyki.
Tabela zagnieżdżona, NODE_DISTRIBUTION, zawsze zawiera następujące kolumny.Zawartość każdej kolumna zależy od typu modelu.Aby uzyskać więcej informacji o typach określonego modelu, zobacz Górnictwa modelu zawartości typu algorytmu.
ATTRIBUTE_NAME
Zawartość zależy od algorytmu.Może być nazwa kolumna, takie jak atrybut przewidywalny, reguły, itemset lub fragment informacji wewnętrznych algorytmu, taki jak część formuły.Ta kolumna może zawierać również parę atrybut wartość.
ATTRIBUTE_VALUE
Wartość atrybut o nazwie w ATTRIBUTE_NAME.Jeśli nazwa atrybut jest kolumną, następnie przypadek najprostszą ATTRIBUTE_VALUE zawiera jeden z dyskretnych wartości kolumna.
W zależności od tego, jak algorytm przetwarza wartości, ATTRIBUTE_VALUE może również zawierać flaga, informujący o tym, czy istnieje wartość atrybut (Existing), lub czy ma wartość null (Missing).
Na przykład, jeśli model jest zestaw do znajdowania klientów, którzy kupili określonego towaru, co najmniej raz, kolumna ATTRIBUTE_NAME może zawierać parę atrybut wartość, która definiuje przedmiot wspólnego zainteresowania, takich jak Model = 'Water bottle', i zawiera tylko słowo kluczowe w kolumnie ATTRIBUTE_VALUE Existing lub Missing.
OBSŁUGA
Liczba przypadków, które mają tę parę atrybut wartość lub zawierające to itemset lub reguły.Ogólnie, dla każdego węzła wartość obsługi informuje liczbie spraw w kształceniu, zestaw są zawarte w bieżącym węźle.W większości typów modelu obsługi reprezentuje dokładna liczba przypadków.Obsługa wartości są przydatne, ponieważ dystrybucji danych można przeglądać w ramach spraw szkolenia bez konieczności kwerendy danych szkolenia.Serwer usług Analysis Services używa również te przechowywane wartości do obliczenia prawdopodobieństwa przechowywanych w stosunku do poprzedniego prawdopodobieństwa, czy wnioskowanie jest silne i słabe.
Na przykład, w drzewie klasyfikacji obsługi wartość wskazuje liczbę przypadków, w których opisane kombinację atrybutów.
drzewo decyzyjne sumę pomocy technicznej na każdym poziom kwot drzewa do obsługi jego nadrzędnym węźle.Na przykład, jeśli model zawierający 1200 sprawy jest jednakowo podzielone według płci i następnie dzielona równomiernie przez trzy wartości do dochodu — niski, średni i wysoki — węzły podrzędność węzła (2), które są węzłami (4) (5) i (6) Suma zawsze tego samego numeru przypadkach jako węzeł (2).
Identyfikator węzła i atrybuty węzła
Licznik obsługi
(1) Modelu głównego
1200
(2) Płci = męska
(3) Płci = kobieta
600
600
(4) Płci = samców i dochód = wysoki
(5) Płci = samców i dochód = średni
(6) Płci = samców i dochód = niski
200
200
200
(7) Płci = samic i dochodu = wysoki
(8) Płci = samic i dochodu = średni
(9) Płci = samic i dochodu = niski
200
200
200
Dla klastrowanie , numer modelu dla wsparcia ważone można dołączyć prawdopodobieństw należących do wielu klastrów.Wiele członkostwa klastra jest domyślna metoda klastrowanie.W tym scenariuszu ponieważ każdego przypadek niekoniecznie nienależących do klastra jeden i tylko jeden obsługi tych modeli może nie zwiększają 100 procent wszystkich klastrów.
PRAWDOPODOBIEŃSTWO
Wskazuje prawdopodobieństwa dla tego określonego węzła w obrębie całego modelu.Ogólnie prawdopodobieństwa reprezentuje wsparcia dla określonej wartości, podzielonej przez całkowitą liczbę przypadków w węźle (NODE_SUPPORT).
Jednak prawdopodobieństwo jest nieznacznie dostosowane do wyeliminowania bias spowodowane przez brak wartości w danych.
[Na przykład, jeśli bieżące wartości całkowita dzieci] są "Jeden" i "Dwa", aby uniknąć tworzenia modelu, który przewiduje było niemożliwe, nie mają elementów podrzędnych lub mieć trzy elementy podrzędne.W celu zapewnienia, że brakuje wartości nietypowymi, ale nie uniemożliwia, algorytm zawsze dodaje 1 do liczby rzeczywiste wartości dla każdego atrybut.
Przykład:
Prawdopodobieństwo [całkowita dzieci jedną =] = [liczba przypadków, gdy całkowita dzieci = jeden] + 1 / [liczba wszystkich przypadkach] + 3
Prawdopodobieństwo [całkowita dzieci dwóch =] = [liczba przypadków, gdy całkowita dzieci dwóch =] + 1 / [liczba wszystkich przypadkach] + 3
Ostrzeżenie
Korekta 3 jest obliczana przez dodanie 1 do całkowitej liczby istniejących wartości n.
Po dostosowaniu prawdopodobieństwa dla wszystkich wartości nadal dodawać do 1.Prawdopodobieństwo wartości bez danych (w tym przykładzie [całkowita dzieci = "Zero", "Trzy" lub pewną inną wartość]), rozpoczyna się od bardzo niskie zera poziomi powoli rośnie w kilku przypadkach są dodawane.
ODCHYLENIE
Wskazuje odchylenie wartości w węźle.Z definicji odchylenie jest zawsze 0 dla wartości dyskretnego.Jeśli model obsługuje wartości ciągłego, odchylenie jest obliczana jako σ (sigma) przy użyciu mianownik n, lub liczba przypadków w węźle.Istnieją dwie definicje ogólne używany do reprezentowania odchylenie standardowe (StDev).Jedną metodę obliczania odchylenia standardowego uwzględnia bias konta, a inna metoda oblicza odchylenie standardowe bez użycia bias.Ogólnie rzecz biorąc algorytmów wyszukiwanie danych firmy Microsoft nie używać bias computing odchylenie standardowe.
Wartość wyświetlana w tabela NODE_DISTRIBUTION jest rzeczywista wartość dla wszystkich atrybutów dyskretnych i discretized i średniej ciągłej wartości.
VALUE_TYPE
Wskazuje typ danych wartości lub atrybut i użycie wartości.Niektórych typów wartości dotyczą tylko niektórych typów modeli:IDENTYFIKATOR VALUE_TYPE
Etykieta wartości
Nazwa Typ wartości
1
Brak
Wskazuje, że dane przypadek nie zawierają wartość tego atrybut.Missing Państwo jest obliczana oddzielnie od atrybutów, które mają wartości.
2
Istniejące
Wskazuje, że przypadek dane zawierają wartość tego atrybut.
3
Ciągłe
Wskazuje, że wartość atrybut jest wartością liczbową ciągłe i może być reprezentowany przez średnią, wraz z WARIANCJA i odchylenie standardowe.
4
Dyskretne
Wskazuje wartość numeryczną lub tekst, który jest traktowany jako osobny.
Uwaga dyskretnych wartości mogą być także brak; Jednakże są obsługiwane inaczej podczas obliczeń.Aby uzyskać informacje, zobacz Brak wartości (Analysis Services - wyszukiwania danych).
5
Discretized
Wskazuje, że atrybut zawiera wartości liczbowe, które zostały discretized.Wartość będzie sformatowany ciąg znakowy opisujący pakiety discretization.
6
Istniejące
Indicates that the attribute has continuous numeric values and that values have been supplied in the data, vs.values that are missing or inferred.
7
Współczynnik
Wskazuje wartość numeryczną, która reprezentuje współczynnik.
Współczynnik jest wartość, która jest stosowana przy obliczaniu wartości zmiennej zależnej.Na przykład jeśli model tworzy formułę regresja, która przewiduje przychodów oparte na wiek, współczynnik jest używany w formułę, która odnosi się do wieku do dochodu.
8
Wynik zysk
Wskazuje wartość numeryczną, która reprezentuje wynik zysk dla atrybut.
9
Statystyki
Wskazuje wartość numeryczną, która reprezentuje statystyki regressor.
10
Unikatowa nazwa węzła
Wskazuje, że wartość nie być obsługiwane nie jako wartości liczbowe lub ciąg, ale jako identyfikator unikatowy innego węzła zawartości w modelu.
Na przykład model sieci neuronowe identyfikatory zapewniają wskaźniki z węzłów w warstwie danych wyjściowych do węzłów w ukrytej warstwie i z węzłów w ukrytej warstwie węzły w wejściowy warstwy.
11
Punkt przecięcia
Wskazuje wartość numeryczną, która reprezentuje punkt przecięcia z osią w formule regresja.
12
Okresowość
Wskazuje, że wartość oznacza okresowe struktury modelu.
Dotyczy tylko czas modeli serii, które zawierają ARIMA model.
Uwaga:
algorytm serii czasowych firmy Microsoft Automatycznie wykrywa okresowe struktur w oparciu o dane szkolenia.W rezultacie terminy końcowe modelu może zawierać wartości okresowości, które nie podaje jako parametr podczas tworzenia modelu.13
Kolejność Autoregressive
Wskazuje, że wartość reprezentuje liczbę serii autoregressive.
Dotyczy czas modeli serii algorytm ARIMA.
14
Przenoszenie zamówienia średnia
Reprezentuje wartość, która reprezentuje liczbę ze średnich w serii.
Dotyczy czas modeli serii algorytm ARIMA.
15
Różnica zamówienia
Wskazuje, że wartość reprezentuje wartość wskazującą, ile razy serii jest zróżnicowana.
Dotyczy czas modeli serii algorytm ARIMA.
16
Boolean
Reprezentuje typ wartość logiczna.
17
Inne
Reprezentuje wartość niestandardowe określone przez algorytm.
18
Ciąg prerendered
Reprezentuje wartość niestandardowego, który renderuje algorytm jako ciąg.Formatowanie nie został zastosowany przez model obiektów.
Typy wartości są uzyskiwane z ADMOMD.Wyliczanie netto.Aby uzyskać więcej informacji, zobacz MiningValueType.
Wynik węzła
Znaczenie wynik węzła różni się w zależności od typu modelu i mogą być określone dla wybranego typu węzła.Aby uzyskać informacje dotyczące sposobu obliczania NODE_SCORE dla każdego typu modelu i węzła, zobacz Górnictwa modelu zawartości typu algorytmu.
Węzeł prawdopodobieństwa i prawdopodobieństwo marginalny
Model górnictwa zestaw zestaw wierszy schematu zawiera kolumny NODE_PROBABILITY i MARGINAL_PROBABILITY dla wszystkich typów modelu.Te kolumny zawierają wartości tylko w węzłach, gdzie wartość prawdopodobieństwa jest znaczące.Węzeł główny model zawiera nigdy wynik prawdopodobieństwa.
W tych węzłów, które zapewniają wyniki prawdopodobieństwa prawdopodobieństwo węzła i prawdopodobieństwa marginalny reprezentują różnych obliczeń.
Marginalna prawdopodobieństwo jest prawdopodobieństwo osiągnięcia z nadrzędnego węzła.
Węzeł prawdopodobieństwo jest prawdopodobieństwo osiągnięcia węzła z katalogu głównego.
Węzeł prawdopodobieństwo jest zawsze mniejsza lub równa marginalny prawdopodobieństwo.
Na przykład jeśli zapełnianie wszystkich klientów drzewo decyzyjne jest jednakowo podzielona według płci (i nie ma żadnych wartości), prawdopodobieństwo węzły podrzędność powinny być 0,5.Jednakże, załóżmy, że węzłach dla płci jest dzielona równomiernie przez poziomów dochodu — wysoki, średni i niski.W tym przypadek wynik każdej MARGINAL_PROBABILITY podrzędność węzeł powinien być zawsze.33, ale wartość NODE_PROBABILTY będzie produktu prawdopodobieństw wszystkich prowadzących do tego węzła i dlatego zawsze mniej niż MARGINAL_PROBABILITY wartość.
Poziom węzła i atrybut i wartość |
Marginalna prawdopodobieństwa |
Prawdopodobieństwo węzła |
---|---|---|
Modelu głównego Wszystkich klientów miejsce docelowe |
1 |
1 |
Podział według płci klientów docelowych |
.5 |
.5 |
Klientów docelowych podzielić według płci i dzielenie ponownie trzy sposoby przy przychód |
.33 |
.5 * .33 = .165 |
Węzeł reguły i reguły marginalny
Model górnictwa zestaw zestaw wierszy schematu obejmuje również kolumnach NODE_RULE i MARGINAL_RULE dla wszystkich typów modelu.Te kolumny zawierają fragmenty danych XML, które mogą być używane do serializacji modelu lub stanowią część struktury modelu.Kolumny te mogą być puste dla niektórych węzłów, jeśli wartość byłoby bez znaczenia.
Dwa rodzaje reguł XML są dostarczone, podobnie jak dwa rodzaje wartości prawdopodobieństwa.Fragment XML w MARGINAL_RULE definiuje atrybut i wartość dla bieżącego węzła należy fragment XML w NODE_RULE opisuje ścieżka do bieżącego węzła z modelu głównego.
Powrót do początku
Wyszukiwania zawartości typu algorytmu modelu
Każdy algorytm przechowuje różne rodzaje informacji jako część jego zawartości schemat.Na przykład Microsoft algorytm klastrowania generuje wiele węzłów podrzędność, z których każdy reprezentuje możliwości klastra.Każdy węzeł klastra zawiera reguły, które opisują cechy współużytkowane przez elementy w klastrze.Natomiast Microsoft regresji liniowej algorytm nie zawiera żadnych węzłów podrzędność; Zamiast tego węzła nadrzędnego modelu zawiera równanie, które opisano zależność liniowa wykryte przez analizę.
Poniższa tabela zawiera łącza do tematów, dla każdego typu algorytmu.
Model zawartości tematy: Wyjaśnić znaczenie każdego typu węzła dla każdego typu algorytmu i dostarczenia wytycznych, o którym węzły są większości zainteresowanie typu określonego modelu.
Wykonywanie kwerend tematy: Zawierają przykłady kwerend typu określonego modelu i wskazówki dotyczące interpretacji wyniki.
Narzędzia do przeglądania zawartości modelu górnictwo
Podczas przeglądania lub eksplorowania modelu w Business Intelligence Development Studio, można wyświetlać informacje w Ogólnej zawartości drzewa Podgląd programu Microsoft, który jest dostępny zarówno w Business Intelligence Development Studio i SQL Server Management Studio.
Microsoft Wyświetla rodzajowy przeglądarka zawartości kolumny, reguły, właściwości, atrybutów, węzły i innej zawartości z modelu przy użyciu tych samych informacji, która jest dostępna w zawartości zestaw zestaw wierszy schematu modelu górnictwa.Zawartość zestaw wierszy schematu jest ogólne ramy dla przedstawiania szczegółowe informacje na temat zawartości modelu wyszukiwanie danych. Model zawartości można wyświetlić w każdy klient, który obsługuje hierarchicznych zestawów wierszy.Podgląd w Business Intelligence Development Studio zorganizowane w podglądzie tabela HTML, reprezentujący wszystkie modele w spójny format, co ułatwia zrozumienie struktury tworzonych wzorów.Aby uzyskać więcej informacji, zobacz Wyświetlanie szczegółów modelu z podglądem drzewa zawartości Microsoft Generic.
Powrót do początku
Narzędzia do badania zawartości modelu górnictwo
Aby pobrać model wyszukiwania zawartości, należy utworzyć na zapytanie dane model wyszukiwania.
Najprostszym sposobem utworzenia kwerendy zawartości jest wykonanie następujących DMX instrukcja w SQL Server Management Studio:
SELECT * FROM [<mining model name>].CONTENT
Aby uzyskać więcej informacji, zobacz Badanie modeli wyszukiwania danych (Analysis Services - wyszukiwania danych).
model wyszukiwania zawartości można również kwerendy przy użyciu zestawów wierszy schematu wyszukiwanie danych.Zestaw wierszy schematu jest standardowej strukturze, której klienci używają do odnajdowanie, przeglądanie i kwerendami struktur górnictwa i modeli.Kwerendy z zestawów wierszy schematu, przy użyciu XMLA, języka Transact-SQL lub instrukcji DMX.
W SQL Server 2008, możesz również dostęp do informacji w wyszukiwanie danych zestawów wierszy schematu połączeń do serwera Analysis Services, otwierając i kwerenda tabele systemowe.Aby uzyskać więcej informacji za pomocą instrukcji SELECT, aby wierszy schematu wyszukiwanie danych kwerendy, zobacz Narzędzia do rozwiązywania problemów (Analysis Services - wyszukiwania danych).
Powrót do początku