Flagi modelowania (wyszukiwania danych)
You can use modeling flags in SQL Server Usługi Analysis Services to provide additional information to a data mining algorithm about the data that is defined in a case table.Algorytm można użyć tych informacji do budowania dokładniejsze dane model wyszukiwania.
Dane górnictwa rozszerzenia (DMX) umożliwia definiowanie flagi modelowania programowo lub można je zdefiniować w projektancie wyszukiwania danych w Business Intelligence Development Studio. Aby uzyskać więcej informacji na temat definiowania tych flag, zobacz Kolumny wyszukiwania modelu.
Niektóre modelowania flagi są zdefiniowane poziom struktura wyszukiwania, inne są zdefiniowane poziom kolumna modelu górniczych.Na przykład NOT NULL modelowania flaga jest używana z struktura wyszukiwania kolumny.Można zdefiniować dodatkowe modelowania flagi model wyszukiwania kolumna.
Poniższa lista zawiera flagi modelowania, które są obsługiwane w Usługi Analysis Services.Aby uzyskać informacje dotyczące modelowania flagi, które są obsługiwane przez określone algorytmy zobacz temat informacje techniczne dla algorytmu.
NOT NULL
Wskazuje, że wartości dla kolumna atrybut nigdy nie powinny zawierać wartość null.Spowoduje błąd, jeśli Usługi Analysis Services napotyka wartość null dla tej kolumna atrybut podczas procesu szkolenia modelu.MODEL_EXISTENCE_ONLY
Wskazuje, że kolumna będą traktowane jako posiadające dwa stany: Missingand Existing.Jeśli wartość jest NULL, jest ona traktowana jako Brak.Ostrzeżenie
Brak jest Państwem specjalne używane przez algorytm i różni się od tekstu wartość "Brak" kolumna.Aby uzyskać więcej informacji, zobacz Brak wartości (Analysis Services - wyszukiwania danych).
Typowym zastosowaniem protokołu modelowania, ta flaga jest wskazanie atrybuty, gdzie NULL Państwo posiada znaczenie niejawne i jawne wartość NOT NULL Państwo może nie być równie ważne jak fakt, że dana kolumna nie ma żadnych wartości.Na przykład kolumna [DateContractSigned] może być NULL Jeśli nigdy nie podpisano kontrakt i NOT NULL , jeśli kontrakt została podpisana.Dlatego, jeśli celem modelu jest przewidzieć, czy zostanie podpisany kontrakt, można użyć flagi MODEL_EXISTENCE_ONLY ignoruje wartość dokładną data w NOT NULL przypadkach i tylko rozróżnić przypadki, gdy wartość jest Missing lub Existing.
REGRESSOR
Wartości dla atrybutu kolumna są mniej istotny niż obecność atrybut.Ta flaga jest zdefiniowany na model wyszukiwania kolumny.
Ostrzeżenie
Dodatki innych firm mogą mieć inne flagi modelowania, oprócz wstępnie zdefiniowane przez Usługi Analysis Services.
Przeglądanie i zmienianie modelowania flag
W projektancie wyszukiwania danych, można wyświetlać i modyfikować flagi modelowania skojarzone z struktura wyszukiwania lub kolumna górnictwa, wyświetlając właściwości modelu lub struktury.
Aby wyświetlić lub zmienić flagę modelowania dla kolumna struktury lub modelu
W BI Development Studio, w oknie Solution Explorer kliknij dwukrotnie struktura wyszukiwania.
Aby zestaw kliknij flagę modelowania NOT NULL Struktury górnictwa kartę.
Do zestaw kliknij flagi REGRESSOR lub MODEL_EXISTENCE_ONLY Górnictwa modelu kartę.
Prawym przyciskiem myszy kolumna, którą chcesz wyświetlić lub zmienić, a następnie wybierz Właściwości.
Aby dodać nową flagę modelowania, kliknij pole tekstowe obok ModelingFlags właściwość i wybierz czeku lub zaznacz pola flagi modelowania, którego chcesz użyć.
Flagi modelowania są wyświetlane tylko wtedy, gdy są one odpowiednie dla typu danych kolumna.
Ostrzeżenie
Po zmianie Flaga modelowania należy ponownie przetwórz model.
Nie można zmienić flagi modelowania w istniejącym model wyszukiwania i struktura przy użyciu DMX.Należy utworzyć nowy model wyszukiwania za pomocą STRUCTURE….ADD górnictwa ALTER model wyszukiwania składni.
Jeśli nie masz pewności, które flagi modelowania są używane w bieżącej struktury, można utworzyć kwerendę zwracającą flagi modelowania przy użyciu następującej składni:
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS
WHERE STRUCTURE_NAME = '<structure name>'
Za pomocą REGRESSOR modelowania flagi
Gdy użytkownik zestaw REGRESSOR modelowania flagi na kolumny, możesz są wskazujący algorytm że kolumna zawiera potencjalne regressors.Rzeczywiste regressors, które są używane w modelu są określane przez algorytm.Potencjalne regressor można usunięte, jeśli nie modelu przewidywalne atrybut.
Podczas tworzenia modelu przy użyciu Kreatora wyszukiwania danych wszystkie ciągłego wprowadzania kolumny są oznaczane jako możliwe regressors.Dlatego nawet jeśli nie są wyraźnie zestaw flagi REGRESSOR na kolumnie kolumna mogą być wykorzystywane jako regressor w końcowym modelu.
Można określić, regressors, które zostały rzeczywiście wykorzystane w końcowym modelu przez wykonanie kwerendy przed zestaw wierszy schematu dla model wyszukiwania, jak pokazano w następującym przykładzie:
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_columnS
WHERE MODEL_NAME = '<model name>'
Uwaga zmodyfikowanie model wyszukiwania i zmienić typ zawartości kolumna z ciągłym dyskretnych, należy ręcznie zmienić flagę na kolumnie górnictwa i ponowne przetworzenie modelu.
Regressors w modelach regresji liniowej
Na podstawie regresja liniowej modele Microsoft algorytm drzewa decyzji.Nawet jeśli nie używasz Microsoft algorytm regresja liniowej wszelkich drzewo decyzyjne model może zawierać drzewa lub węzłów, które reprezentuje regresja na ciągłe atrybut.
Nie trzeba określić, że ciągłego kolumna reprezentuje regressor. Microsoft Algorytm drzewa decyzji będzie partycji danychzestaw w regionach desenie znaczące, nawet jeśli nie zestaw flagi REGRESSOR na kolumna.Różnica jest podczas możesz zestaw flagi modelowania algorytm podejmie próbę znalezienia równania regresja formularza * C1 + b * C2 +... do wzorców w węzłach drzewa.Obliczana jest suma składników resztkowych, i jeśli odchylenie jest zbyt duża, podział jest zmuszony w drzewie.
Na przykład, jeśli są przewidywaniu nabywcy zakupów za pomocą zachowania dochodu jako atrybutu, i zestaw REGRESSOR modelowania flagę w kolumnie, algorytm musiałaby najpierw spróbować dopasować dochodu wartości przy użyciu formuły standardowej regresja.Jeśli odchylenie jest zbyt duża, porzucone formuły regresja i drzewa by podzielić na inne atrybut.Algorytm drzewo decyzyjne czy spróbuj dopasowanie regressor dla dochodów w każdej z branż, które po podziału.
Zagwarantować, że algorytm użyje konkretnego regressor, można użyć parametru FORCED_REGRESSOR.Tego parametru można używać z algorytm drzewa decyzji i algorytm regresji liniowej.