Udostępnij za pośrednictwem


TWORZENIE STRUKTURY GÓRNICTWA (DMX)

Tworzy nową struktura wyszukiwania w bazie danych i opcjonalnie określa szkolenia i testowanie partycji.Po utworzeniu struktura wyszukiwania, można użyć ZMIANA STRUKTURY GÓRNICTWA (DMX) instrukcja, aby dodać modele do struktura wyszukiwania.

Składnia

CREATE [SESSION] MINING STRUCTURE <structure>
(
    [(<column definition list>)]
)
[WITH HOLDOUT (<holdout-specifier> [OR <holdout-specifier>])]
[REPEATABLE(<holdout seed>)]
<holdout-specifier>::=  <holdout-maxpercent> PERCENT | <holdout-maxcases> CASES

Argumenty

  • structure
    Unikatowa nazwa struktury.

  • column definition list
    Rozdzielana przecinkami lista kolumna definicje.

  • holdout-maxpercent
    Liczbą całkowitą pomiędzy 1 a 100, który wskazuje procent danych zestaw przeznaczone do badania.

  • holdout-maxcases
    Liczba całkowita, która wskazuje maksymalną liczbę przypadków dla badania.

    Jeśli wartość określona maksymalna liczba przypadków jest większy niż liczba przypadków wejściowe, wszystkich przypadkach wejściowe są wykorzystywane do badań i ostrzeżenie będzie uruchamiany.

    Ostrzeżenie

    Jeżeli określono wartość procentową i maksymalna liczba przypadków jest używany mniejszej z dwóch limitów.

  • holdout seed
    Liczba całkowita, używane jako materiał siewny uruchomić partycjonowanie danych.

    Jeśli zestaw 0, mieszania identyfikator struktura wyszukiwania jest używane jako materiał siewny.

    Ostrzeżenie

    Materiał siewny należy określić, jeśli trzeba zapewnić można powielać partycji.

    Wartość domyślna: REPEATABLE(0)

Uwagi

Zdefiniowaniu struktury górnictwa, określając listę kolumn, opcjonalnie Określanie hierarchiczne relacje między kolumnami, a opcjonalnie partycjonowanie struktury górnictwa, do szkolenia i testowania zestawów danych.

Opcjonalne słowa kluczowego sesja wskazuje, że struktura jest tymczasowe struktury, która można używać tylko na czas bieżącej sesja.Gdy sesja zostanie zakończona, struktury i żadnych modeli oparty na strukturze, zostaną usunięte.Tworzenie struktury tymczasowej górnictwa i modeli, musisz najpierw zestaw właściwości bazy danych AllowSessionMiningModels.Aby uzyskać więcej informacji, zobacz Właściwości wyszukiwania danych.

Lista definicji kolumny

Należy zdefiniować struktura wyszukiwania dołączając następujące informacje dla każdej kolumna listy definicji kolumn:

  • Nazwa (obowiązkowe)

  • Typ danych (obowiązkowe)

  • Rozkład

  • Lista modelowania flag

  • Typ zawartości (obowiązkowe)

  • Relacja do kolumna atrybut (obowiązkowe tylko, jeśli ma to zastosowanie), wskazane przez klauzula pokrewne do

Do zdefiniowania jednej kolumna, należy użyć następującej składni dla listy definicji kolumn:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<column relationship>]

Aby zdefiniować kolumna tabela zagnieżdżonej, należy użyć następującej składni dla listy definicji kolumn:

<column name>    TABLE    ( <column definition list> )

Lista typów danych typów zawartości, dystrybucje kolumna i flagi modelowania, które można użyć do zdefiniowania kolumna struktury, zobacz następujące tematy:

Można zdefiniować wiele modelowania flagi wartości kolumna.Jednak może mieć tylko jeden typ zawartości i jednego typu danych kolumna.

Relacje kolumny

You can add a clause to any column definition statement to describe the relationship between two columns.Usługi Analysis Services supports the use of the following <column relationship> clause.

  • RELATED TO
    Wskazuje wartość hierarchii.miejsce docelowe Pokrewne do kolumny może być kolumnę klucz w tabela zagnieżdżonej, kolumna indywidualnie wyceniane przypadek wierszy lub innej kolumny z pokrewnych do klauzulę, która wskazuje głębszych hierarchii.

Parametry holdout

Po określeniu parametrów wstrzymanie Utwórz partycję struktury danych.Kwotę określoną dla wstrzymanie jest zarezerwowana do testowania i pozostałych danych jest używany dla szkolenia.Domyślnie, jeśli tworzenie struktura wyszukiwania za pomocą Business Intelligence Development Studio, wstrzymanie partycja jest tworzona zawierający 30 procent badań, dane i dane szkolenia 70 procent.Aby uzyskać więcej informacji, zobacz Partycjonowanie danych do szkolenia i testowania zestawy (Analysis Services - wyszukiwania danych).

Utworzyć struktura wyszukiwania przy użyciu rozszerzenia górnictwo danych (DMX), należy ręcznie określić utworzenia partycji wstrzymanie.

Ostrzeżenie

ALTER MINING STRUCTURE Nie obsługuje instrukcja wstrzymanie.

Można określić maksymalnie trzy parametry wstrzymanie.Jeśli określona maksymalna liczba przypadków wstrzymanie i procent wstrzymanie, procent przypadków są zarezerwowane do momentu osiągnięcia limitu maksymalnej przypadkach.Określ procent wstrzymanie jako liczba całkowita następuje PERCENT słowo kluczowe i określić maksymalną liczbę przypadków jako liczba całkowita następuje CASES słów kluczowych.Można łączyć warunki w dowolnej kolejności, jak pokazano w poniższych przykładach:

WITH HOLDOUT (20 PERCENT) 
WITH HOLDOUT (2000 CASES) 
WITH HOLDOUT (20 PERCENT OR 2000 CASES) 
WITH HOLDOUT (2000 CASES OR 20 PERCENT)

Materiał siewny wstrzymanie kontroluje rozpoczęcie procesu losowo przypisuje przypadkach albo szkolenia lub testowania zestawów danych.Ustawiając nasion wstrzymanie, można zapewnić partycji można powtórzyć.Jeśli nie określisz nasion wstrzymanie, Usługi Analysis Services używa nazwy struktura wyszukiwania tworzenie materiału siewnego.Jeśli zmienisz struktury zmieni wartość początkową.Parametru materiału siewnego wstrzymanie można używać z jednego lub obu innych parametrów wstrzymanie.

Ostrzeżenie

Ponieważ informacji o partycji jest buforowane dane szkolenia, używać wstrzymanie, użytkownik musi zapewnić, że CacheMode Właściwość struktura wyszukiwania jest zestaw do KeepTrainingData.Jest to ustawienie domyślne w Usługi Analysis Services dla nowych struktur górniczych.Zmiana CacheMode Właściwość ClearTrainingCases na istniejącym struktura wyszukiwania zawierający wstrzymanie partycji nie wpłynie na wszystkie modele górnictwa, które zostały przetworzone.Jednakże jeśli MiningStructureCacheMode nie jest zestaw do KeepTrainingData, wstrzymanie parametry będą mieć nie efektu.Oznacza to, że wszystkie źródło danych będzie używany do szkolenia i zestaw testów nie będzie dostępny.Definicja partycji jest buforowany o strukturze; Wyczyszczenie pamięci podręcznej kształcenia przypadkach również wyczyścić pamięć podręczna danych z badań i definicji zestaw wstrzymanie.

Przykłady

W poniższych przykładach pokazano, jak utworzyć struktura wyszukiwania z wstrzymanie za pomocą DMX.

Przykład 1: Dodawanie struktury nie zestaw szkoleń

Poniższy przykład tworzy nowy struktura wyszukiwania o nazwie New Mailing bez tworzenia żadnych modeli skojarzone górnictwa i bez użycia wstrzymanie.Aby dowiedzieć się, jak dodać model wyszukiwania struktury, zobacz ZMIANA STRUKTURY GÓRNICTWA (DMX).

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
)

Przykład 2: Określając procent Holdout i materiału siewnego

Następująca klauzula mogą być dodawane po kolumny listy definicji w celu zdefiniowania zestaw danych, który może służyć do badania wszystkich modeli wyszukiwania skojarzonych z struktura wyszukiwania.Instrukcja spowoduje utworzenie zestaw testów, który wynosi 25 procent całkowitej przypadkach wprowadzania bez limitu maksymalnej liczby przypadków.5000 jest używany jako materiał siewny tworzenia partycji.Po określeniu materiału siewnego tych samych przypadkach zostanie wybrany dla badania każdego zestaw czas przetworzyć struktury górnictwa, tak długo, jak nie zmienia podstawowych danych.

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
) 
WITH HOLDOUT(25 PERCENT) REPEATABLE(5000)

Przykład 3: Określając procent Holdout i przypadków Max

Następującej klauzula utworzy zestaw test, który zawiera 25 procent całkowitej przypadkach wejściowego lub 2000 przypadkach, mniejsza.Ponieważ 0 jest określony jako materiału siewnego, nazwa struktura wyszukiwania jest używany do tworzenia materiału siewnego, używany do rozpoczęcia pobierania próbkowanie wejściowych spraw.

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
) 
WITH HOLDOUT(25 PERCENT OR 2000 CASES) REPEATABLE(0)