SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych)
Partycje struktura wyszukiwania do określonej liczby przekrój poprzeczny pociągów modelu dla każdej partycji, a następnie zwraca dokładność pomiarów dla każdej partycji.
Uwagatej procedura składowana może być używany tylko z struktura wyszukiwania zawiera co najmniej jeden model klastrowania.Aby cross-sprawdzanie poprawności modeli klastrowanie, należy użyć SystemGetCrossValidationResults (Analysis Services - wyszukiwania danych).
Składnia
SystemGetClusterCrossValidationResults(
<structure name>,
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])
Argumenty
mining structure
Nazwa struktura wyszukiwania w bieżącej bazie danych.(wymagane)
mining model list
Rozdzielana przecinkami lista modeli wyszukiwania do sprawdzania poprawności.Jeżeli nie określono listę modeli górnictwa, krzyżowe sprawdzanie poprawności jest przeprowadzana na podstawie wszystkich modeli klastrowania, które są skojarzone z określoną strukturę.
Ostrzeżenie
Aby cross-sprawdzanie poprawności modeli, które nie są klastrowanie modeli, należy użyć oddzielnej procedura składowana, SystemGetCrossValidationResults (Analysis Services - wyszukiwania danych).
(opcjonalnie)
fold count
Liczba całkowita, która określa numer partycji, w którym do rozdzielenia zestaw danych.Wartość minimalna to 2.Maksymalna liczba zgięcia jest maximum integer lub liczba przypadków dolnym.Każda partycja będzie zawierać około to liczba przypadków: max cases/fold count.
Nie ma wartości domyślnej.
Ostrzeżenie
Liczba zgięcia znacznie wpływa na czas potrzebny do wykonania krzyżowe sprawdzanie poprawności.Jeśli wybierasz numer, który jest zbyt wysoka, wykonywanie kwerendy przez bardzo długi czas, a w niektórych przypadkach serwer może przestać odpowiadać lub limit czasu.
(wymagane)
max cases
Liczba całkowita, która określa maksymalną liczbę przypadków, które mogą być badane.Wartość 0 wskazuje, że wszystkie przypadki dane źródło będą używane.
Jeśli określisz liczbę wyższą niż rzeczywista liczba przypadków zestaw danych wszystkich przypadkach dane źródło będą używane.
(wymagane)
test list
Ciąg, który określa opcje badania.Uwaga tego parametru jest zarezerwowana do użytku w przyszłości.
(opcjonalnie)
Zwracany typ
Zwracany typ tabela zawiera wyniki dla każdej z poszczególnych partycji i agregaty dla wszystkich modeli.
W poniższej tabela opisano kolumny zwracane.
Nazwa kolumny |
Opis |
---|---|
ModelName |
Nazwa modelu, która została zbadana. |
Nazwa_atrybutu |
Nazwa przewidywalna kolumna.W przypadku modeli klastra zawsze null. |
AttributeState |
Wartość miejsce docelowe określonego przewidywalna kolumna.W przypadku modeli klastra, zawsze null. |
PartitionIndex |
1 Na podstawie indeksu identyfikującego partycji, która dotyczy wyniki. |
PartitionSize |
Liczba całkowita wskazująca liczbę przypadków zostały uwzględnione w każdej partycji. |
Test |
Typ testu, który został wykonany. |
Miara |
Nazwa miara zwracane przez badania.Środki dla każdego modelu zależą od typu wartości przewidywalne.Definicję każdego miara Sprawdzanie poprawności krzyżowych (Analysis Services - wyszukiwania danych). Listę środków zwracane dla każdego typu przewidywalny, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych). |
Wartość |
Wartość miara badania. |
Uwagi
Zwraca dokładności metryki dla całego zestaw danych, użyj SystemGetClusterAccuracyResults (Analysis Services - wyszukiwania danych).
Ponadto jeśli model wyszukiwania już podzielony na partycje do zgięcia, można pominąć przetwarzania i zwracają tylko wyniki krzyżowo za pomocą SystemGetClusterAccuracyResults (Analysis Services - wyszukiwania danych).
Przykłady
Poniższy przykład ilustruje sposób dzielenia struktura wyszukiwania na trzech zgięcia, a następnie przetestować dwóch klastrowanie modeli, które są skojarzone z górnictwa struktury.
Trzech linii kodu wyświetla listę modeli wyszukiwania szczególne, które chcesz przetestować.Jeśli nie określisz listy wszystkich klastrowanie modeli skojarzonych ze struktury są używane.
Czterech linii kodu określa liczbę zgięcia i pięć linii określa maksymalną liczbę przypadków używania.
Ponieważ te klastrowanie modeli, nie trzeba określać przewidywalne atrybut lub wartość.
CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)
Przykładowe wyniki:
ModelName |
Nazwa_atrybutu |
AttributeState |
PartitionIndex |
PartitionSize |
Test |
Miara |
Wartość |
---|---|---|---|---|---|---|---|
Klaster 1 |
|
|
1 |
3025 |
Klastrowanie |
Prawdopodobieństwo sprawy |
0.930524511864121 |
Klaster 1 |
|
|
2 |
3025 |
Klastrowanie |
Prawdopodobieństwo sprawy |
0.919184178430778 |
Klaster 1 |
|
|
3 |
3024 |
Klastrowanie |
Prawdopodobieństwo sprawy |
0.929651120490248 |
Klaster 2 |
|
|
1 |
1289 |
Klastrowanie |
Prawdopodobieństwo sprawy |
0.922789726933607 |
Klaster 2 |
|
|
2 |
1288 |
Klastrowanie |
Prawdopodobieństwo sprawy |
0.934865535691068 |
Klaster 2 |
|
|
3 |
1288 |
Klastrowanie |
Prawdopodobieństwo sprawy |
0.924724595688798 |
Wymagania
Sprawdzanie poprawności krzyżowych jest dostępna tylko w SQL Server Enterprise począwszy od SQL Server 2008.
Zobacz także