SystemGetCrossValidationResults (Analysis Services — wyszukiwanie danych)
Partycje struktura wyszukiwania do określonej liczby przekrój poprzeczny, przygotowuje modelu dla każdej partycji, a następnie zwraca dokładności metryki dla każdej partycji.
Uwaga
Nie można użyć tej procedura przechowywana krzyżyk poprawności modeli klastrów lub modele, które są wbudowane przy użyciu Microsoft Algorytm seria czas lub Microsoft Algorytm klastrowanie sekwencji. Aby krzyżyk poprawność modeli klastrów, można użyć oddzielnej procedura przechowywana SystemGetClusterCrossValidationResults (Analysis Services — wyszukiwanie danych).
SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])
Argumenty
mining structure
Nazwa struktura wyszukiwania w bieżącej bazie danych.(wymagane)
mining model list
Rozdzielana przecinkami lista modeli wyszukiwania do sprawdzania poprawności.Jeśli nazwa modelu zawiera znaki, których nie są prawidłowe w imieniu identyfikator, nazwę muszą być ujęte w nawiasy.
Jeśli lista modeli wyszukiwania nie zostanie określona, krzyżyk-sprawdzanie poprawności jest wykonywane dla wszystkich modeli, które są skojarzone z określoną strukturą, które zawierają przewidywalne atrybut.
Uwaga
Aby krzyżyk poprawność modeli klastrów, należy użyć oddzielnej procedura przechowywana SystemGetClusterCrossValidationResults (Analysis Services — wyszukiwanie danych).
(opcjonalnie)
fold count
Liczba całkowita, która określa numer partycji, w którym do rozdzielenia zestaw danych.Wartość minimalna to 2.Maksymalna liczba zgięcia wynosi maximum integer lub liczba przypadków, zależnie od tego, który jest niższa.Każda partycja będzie zawierał mniej więcej fizycznemu to liczbę przypadków: max cases/fold count.
Brak wartości domyślnej.
Uwaga
Liczba zgięcia znacznie wpływa na czas wymagany do sprawdzenia krzyżowe sprawdzanie poprawności.Jeśli wybierasz numer, który jest zbyt wysoka, kwerenda może być uruchamiana przez bardzo długi czas, a w niektórych przypadkach serwer może przestać odpowiadać lub limitu czasu.
(wymagane)
max cases
Liczba całkowita, która określa maksymalną liczbę przypadków, które mogą być badane przez wszystkie zgięcia.Wartość 0 wskazuje, że wszystkie przypadki, w danych urządzenie źródłowe będą używane.
Jeżeli określono wartość, która jest większa niż rzeczywista liczba przypadków zestaw danych, wszystkie przypadki, w danych urządzenie źródłowe będą używane.
Brak wartości domyślnej.
(wymagane)
target attribute
Ciąg, który zawiera nazwę atrybut przewidywalne.Atrybut przewidywalne może być kolumny, kolumna w tabela zagnieżdżonej lub kolumnę klucz w tabela zagnieżdżonej model wyszukiwania.Uwaga
Istnienie atrybut docelowego jest sprawdzana tylko przy uruchomieniu czas.
(wymagane)
target state
Formuły, która określa wartość do przewidywania.Jeżeli określono wartość docelową, metryki są zbierane tylko określonej wartości.Jeśli wartość nie została określona lub jest null, metryki są obliczane dla najbardziej prawdopodobne stanu dla każdego przewidywanie.
Wartość domyślna to null.
Błąd jest wywoływane podczas sprawdzania poprawności, jeśli podana wartość nie jest prawidłowy dla określonego atrybut, lub jeśli formuła nie jest poprawnego typu dla określonego atrybut.
(opcjonalnie)
target threshold
Double większa niż 0 i mniejsza niż 1.Wskazuje wynik prawdopodobieństwo minimalne, które muszą być pobrane do przewidywanie stanu określony obiekt miejsce docelowe do zliczania jako poprawne.przewidywanie zawierający prawdopodobieństwo mniejsza lub równa tej wartości jest uważany za nieprawidłowe.
Jeśli wartość nie została określona lub jest null, używany jest najbardziej prawdopodobne stanu, niezależnie od jej wynik prawdopodobieństwa.
Wartość domyślna to null.
Uwaga
Analysis Services nie będzie podnieść błąd, jeśli ustawisz state threshold Aby 0.0 ale nigdy nie należy używać tej wartości. W efekcie próg 0.0 oznacza, że prognoz z prawdopodobieństwem 0 procent są liczone jako poprawne.
(opcjonalnie)
test list
Ciąg, który określa opcje testowania.Uwaga Ten parametr jest zarezerwowana do wykorzystania w przyszłości.
(opcjonalnie)
Zwracany typ
Zestaw wierszy, która jest zwracana zawiera wyniki dla każdej partycji w każdym modelu.
W poniższej tabela opisano kolumny w zestawie zestaw wierszy.
Nazwa kolumna |
Description |
---|---|
ModelName |
Nazwa modelu, który został przetestowany. |
Nazwa_atrybutu |
Nazwa przewidywalna kolumna. |
AttributeState |
Wartość określone miejsce docelowe kolumna przewidywalne.Jeśli ta wartość jest null, użyto w najbardziej prawdopodobnym przewidywanie. Jeśli ta kolumna zawiera wartość, dokładność modelu jest oceniane przed tylko tę wartość. |
PartitionIndex |
Zastosowanie indeksu opartego na 1, identyfikujący, do której partycji wyniki. |
PartitionSize |
Liczba całkowita, która wskazuje liczbę przypadków zostały uwzględnione w każdej partycji. |
Test |
Kategoria test, która została wykonana.Aby uzyskać opis kategorii i testy, które znajdują się w każdej kategorii Zobacz Raport sprawdzania poprawności między (Analysis Services — wyszukiwanie danych). |
Miara |
Nazwa miara, zwracane przez test.Środki, dla każdego modelu, zależą od typu wartości przewidywalne.Aby uzyskać definicję każdej miara zobacz krzyżowe sprawdzanie poprawności (Analysis Services — wyszukiwanie danych). Aby uzyskać listę zwrócone dla każdego typu przewidywalne działania Zobacz Raport sprawdzania poprawności między (Analysis Services — wyszukiwanie danych). |
Wartość |
Wartość miara określonego testu. |
Remarks
Aby zwrócić dokładności metryki dla kompletny zestaw danych, należy użyć SystemGetAccuracyResults (Analysis Services — wyszukiwanie danych).
Jeśli już model wyszukiwania jest podzielony na partycje w zgięcia, można pominąć przetwarzania i zwracają tylko wyniki krzyżowe sprawdzanie poprawności przy użyciu SystemGetAccuracyResults (Analysis Services — wyszukiwanie danych).
Przykłady
Poniższy przykład ilustruje sposób partycji struktura wyszukiwania do sprawdzania krzyżowe sprawdzanie poprawności w dwóch zgięciach, a następnie przetestować dwóch modeli wyszukiwania związanych ze strukturą wyszukiwania [v Target Mail].
Wiersz z listy Kod trzy modele wyszukiwania, które chcesz przetestować.Jeśli na liście nie zostanie określony, używane są skojarzone ze strukturą wszystkich modeli bez klastrowanie.Czterech linii kodu określa liczbę partycji.Ponieważ nie określono wartości dla max cases, wszystkich przypadkach w strukturze wyszukiwania są używane i równomiernie rozłożone na partycje.
Wiersz pięciu Określa atrybut przewidywalny, nabywca Bike i wiersz sześciu określa wartość do przewidywania, 1 (co oznacza, "tak, będzie kupić „).
Wartość NULL w wierszu siedmiu wskazuje, że brak jest paska minimalne prawdopodobieństwo muszą być spełnione.W związku z tym pierwsze przewidywanie, zawierający prawdopodobieństwo zera będą używane przy ocenie dokładności.
CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)
Przykładowe wyniki:
ModelName |
Nazwa_atrybutu |
AttributeState |
PartitionIndex |
PartitionSize |
Test |
Miara |
Wartość |
---|---|---|---|---|---|---|---|
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
1 |
500 |
Klasyfikacja |
Dodatnia wartość true |
144 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
1 |
500 |
Klasyfikacja |
Fałszywie dodatnie. |
105 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
1 |
500 |
Klasyfikacja |
Ujemna wartość true |
186 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
1 |
500 |
Klasyfikacja |
Ujemna wartość false |
65 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
1 |
500 |
Prawdopodobieństwo |
Wynik dziennika |
-0.619042807138345 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
1 |
500 |
Prawdopodobieństwo |
Podnieś |
0.0740963734002671 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
1 |
500 |
Prawdopodobieństwo |
Błąd główny średniej kwadrat |
0.346946279977653 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
2 |
500 |
Klasyfikacja |
Dodatnia wartość true |
162 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
2 |
500 |
Klasyfikacja |
Fałszywie dodatnie. |
86 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
2 |
500 |
Klasyfikacja |
Ujemna wartość true |
165 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
2 |
500 |
Klasyfikacja |
Ujemna wartość false |
87 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
2 |
500 |
Prawdopodobieństwo |
Wynik dziennika |
-0.654117781086519 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
2 |
500 |
Prawdopodobieństwo |
Podnieś |
0.038997399132084 |
Poczta miejsce docelowe DT |
Rower kupujących |
1 |
2 |
500 |
Prawdopodobieństwo |
Błąd główny średniej kwadrat |
0.342721344892651 |
Requirements
Sprawdzanie poprawności między jest dostępna tylko w SQL Server 2008 Enterprise.
See Also