Artykuł
07/22/2011

SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych)

Partycje struktura wyszukiwania do określonej liczby przekrój poprzeczny pociągów modelu dla każdej partycji, a następnie zwraca dokładność pomiarów dla każdej partycji.

Uwagatej procedura składowana może być używany tylko z struktura wyszukiwania zawiera co najmniej jeden model klastrowania.Aby cross-sprawdzanie poprawności modeli klastrowanie, należy użyć SystemGetCrossValidationResults (Analysis Services - wyszukiwania danych).

Składnia

SystemGetClusterCrossValidationResults(
<structure name>, 
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])

Argumenty

mining structure
Nazwa struktura wyszukiwania w bieżącej bazie danych.

(wymagane)
mining model list
Rozdzielana przecinkami lista modeli wyszukiwania do sprawdzania poprawności.

Jeżeli nie określono listę modeli górnictwa, krzyżowe sprawdzanie poprawności jest przeprowadzana na podstawie wszystkich modeli klastrowania, które są skojarzone z określoną strukturę.

Ostrzeżenie

Aby cross-sprawdzanie poprawności modeli, które nie są klastrowanie modeli, należy użyć oddzielnej procedura składowana, SystemGetCrossValidationResults (Analysis Services - wyszukiwania danych).

(opcjonalnie)
fold count
Liczba całkowita, która określa numer partycji, w którym do rozdzielenia zestaw danych.Wartość minimalna to 2.Maksymalna liczba zgięcia jest maximum integer lub liczba przypadków dolnym.

Każda partycja będzie zawierać około to liczba przypadków: max cases/fold count.

Nie ma wartości domyślnej.

Ostrzeżenie

Liczba zgięcia znacznie wpływa na czas potrzebny do wykonania krzyżowe sprawdzanie poprawności.Jeśli wybierasz numer, który jest zbyt wysoka, wykonywanie kwerendy przez bardzo długi czas, a w niektórych przypadkach serwer może przestać odpowiadać lub limit czasu.

(wymagane)
max cases
Liczba całkowita, która określa maksymalną liczbę przypadków, które mogą być badane.

Wartość 0 wskazuje, że wszystkie przypadki dane źródło będą używane.

Jeśli określisz liczbę wyższą niż rzeczywista liczba przypadków zestaw danych wszystkich przypadkach dane źródło będą używane.

(wymagane)
test list
Ciąg, który określa opcje badania.

Uwaga tego parametru jest zarezerwowana do użytku w przyszłości.

(opcjonalnie)

Zwracany typ

Zwracany typ tabela zawiera wyniki dla każdej z poszczególnych partycji i agregaty dla wszystkich modeli.

W poniższej tabela opisano kolumny zwracane.

Nazwa kolumny	Opis
ModelName	Nazwa modelu, która została zbadana.
Nazwa_atrybutu	Nazwa przewidywalna kolumna.W przypadku modeli klastra zawsze null.
AttributeState	Wartość miejsce docelowe określonego przewidywalna kolumna.W przypadku modeli klastra, zawsze null.
PartitionIndex	1 Na podstawie indeksu identyfikującego partycji, która dotyczy wyniki.
PartitionSize	Liczba całkowita wskazująca liczbę przypadków zostały uwzględnione w każdej partycji.
Test	Typ testu, który został wykonany.
Miara	Nazwa miara zwracane przez badania.Środki dla każdego modelu zależą od typu wartości przewidywalne.Definicję każdego miara Sprawdzanie poprawności krzyżowych (Analysis Services - wyszukiwania danych). Listę środków zwracane dla każdego typu przewidywalny, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych).
Wartość	Wartość miara badania.

Uwagi

Zwraca dokładności metryki dla całego zestaw danych, użyj SystemGetClusterAccuracyResults (Analysis Services - wyszukiwania danych).

Ponadto jeśli model wyszukiwania już podzielony na partycje do zgięcia, można pominąć przetwarzania i zwracają tylko wyniki krzyżowo za pomocą SystemGetClusterAccuracyResults (Analysis Services - wyszukiwania danych).

Przykłady

Poniższy przykład ilustruje sposób dzielenia struktura wyszukiwania na trzech zgięcia, a następnie przetestować dwóch klastrowanie modeli, które są skojarzone z górnictwa struktury.

Trzech linii kodu wyświetla listę modeli wyszukiwania szczególne, które chcesz przetestować.Jeśli nie określisz listy wszystkich klastrowanie modeli skojarzonych ze struktury są używane.

Czterech linii kodu określa liczbę zgięcia i pięć linii określa maksymalną liczbę przypadków używania.

Ponieważ te klastrowanie modeli, nie trzeba określać przewidywalne atrybut lub wartość.

CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)

Przykładowe wyniki:

ModelName	PartitionIndex	PartitionSize	Test	Miara	Wartość
Klaster 1	1	3025	Klastrowanie	Prawdopodobieństwo sprawy	0.930524511864121
Klaster 1	2	3025	Klastrowanie	Prawdopodobieństwo sprawy	0.919184178430778
Klaster 1	3	3024	Klastrowanie	Prawdopodobieństwo sprawy	0.929651120490248
Klaster 2	1	1289	Klastrowanie	Prawdopodobieństwo sprawy	0.922789726933607
Klaster 2	2	1288	Klastrowanie	Prawdopodobieństwo sprawy	0.934865535691068
Klaster 2	3	1288	Klastrowanie	Prawdopodobieństwo sprawy	0.924724595688798