Tworzenie struktury sieci neuronowe i modelu (pośrednie samouczek wyszukiwania danych)
Aby utworzyć dane model wyszukiwania, należy najpierw użyć Kreatora górnictwo danych do utworzenia nowej struktura wyszukiwania na podstawie nowego widok źródło danych.W to zadanie będzie użyj Kreatora tworzenia struktury górnictwa i jednocześnie czas utworzyć model skojarzony górnictwa, oparty na Microsoft sieci neuronowe algorytmu.
Ponieważ sieci neuronowe są wyjątkowo elastyczne i można analizować wiele kombinacji wejść i wyjść, należy wypróbować kilka sposobów przetwarzania danych, aby uzyskać najlepsze wyniki.Na przykład, można dostosować sposób, w jaki dane są binned, lub zgrupowane, aby miejsce docelowe określone wymagania biznesowe.Aby to zrobić, doda nową kolumna struktura wyszukiwania grupuje dane liczbowe w inny sposób, a następnie utwórz model, który używa nowej kolumna.Do wykonania niektórych badań użyje tych modeli wyszukiwania.
Oddzielny model do przewidywanie i oceny punktowej zbudować wreszcie, gdy zapewne z modelu sieci neuronowe, które czynniki mają największy wpływ na pytanie biznesowe.Będzie używać Microsoft regresją algorytmu, który jest oparty na modelu sieci neuronowe, ale jest zoptymalizowany dla znalezienia rozwiązania oparte na określonych nakładów.
Tworzenie struktury domyślne Centrum wywołania
Do tworzenia domyślnej sieci neuronowe struktura wyszukiwania i modelu
W oknie Solution Explorer w Business Intelligence Development Studio, kliknij prawym przyciskiem myszy Górnictwa struktur i wybierz Nowej struktury górnictwa.
Na Zapraszamy kreatora wyszukiwania danych strona, kliknij przycisk Dalej.
Na Wybierz metodę definicji strona upewnij się, że z istniejących relacyjnej bazy danych lub magazyn danych jest zaznaczone, a następnie kliknij Dalej.
Na Tworzenie struktury danych górnictwa strona, sprawdź, czy opcja Tworzenie struktura wyszukiwania z model wyszukiwania jest zaznaczone.
Kliknij listę rozwijaną dla opcji od techniki wyszukiwanie danych chcesz użyć?, następnie wybierz Sieci neuronowe Microsoft.
Ponieważ logistyczne regresja modele są oparte na sieci neuronowe, można użyć ponownie tę samą strukturę i dodać nowy model górnictwa.
Kliknij Dalej.
Widok źródła danych wybierz zostanie wyświetlona strona.
W obszarze Widoki źródło danych dostępne, wybierz opcję Centrum wywołaniei kliknij przycisk Dalej.
Na Określić typy tabel strona, zaznacz przypadku pole wyboru obok FactCallCenter tabela.Kliknij Dalej.
Na Określ dane szkolenia strona, zaznacz klucz obok kolumna FactCallCenterID.
Wybierz Predict i wprowadzania pola wyboru.
Wybierz klucz, wprowadzania, i Predict pola wyboru, jak pokazano w poniższej tabela:
Tabele i kolumny
Klucz/Input/prognozowania
AutomaticResponses
Dane wejściowe
AverageTimePerIssue
Przewidywanie/wprowadzania
Calls
Dane wejściowe
DateKey
Nie należy używać
DayOfWeek
Dane wejściowe
FactCallCenterID
Klucz
IssuesRaised
Dane wejściowe
LevelOneOperators
Przewidywanie/wprowadzania
LevelTwoOperators
Dane wejściowe
Orders
Przewidywanie/wprowadzania
ServiceGrade
Przewidywanie/wprowadzania
Shift
Dane wejściowe
TotalOperators
Nie należy używać
WageType
Dane wejściowe
Na określić kolumny Zawartość i typ danych strona, sprawdź, czy siatka zawiera kolumny, typy zawartości i typy danych, jak pokazano w poniższej tabela, a następnie kliknij Dalej.
kolumny
Typ zawartości
Typy danych
AutomaticResponses
Ciągłe
Długie
AverageTimePerIssue
Ciągłe
Długie
Calls
Ciągłe
Długie
DayOfWeek
Dyskretne
Tekst
FactCallCenterID
Klucz
Długie
IssuesRaised
Ciągłe
Długie
LevelOneOperators
Ciągłe
Długie
LevelTwoOperators
Ciągłe
Długie
Orders
Ciągłe
Długie
ServiceGrade
Ciągłe
Double
Shift
Dyskretne
Tekst
WageType
Dyskretne
Tekst
Na Tworzenie zestaw testów strona, wyczyść pole tekstowe dla opcji, udział procentowy danych testowych.Kliknij Dalej.
Na Kończenie pracy Kreatora strona, dla nazwy struktury górnictwa, typ Centrum wywołanie.
Dla nazwę modelu górnictwa, typu Wywołania NN domyślne Centrum, a następnie kliknij przycisk Zakończ.
Zezwalaj na drążenie wskroś pole jest wyłączone, ponieważ nie można drążyć wskroś danych z modeli sieci neuronowe.
W oknie Solution Explorer kliknij prawym przyciskiem myszy nazwę dane struktura wyszukiwania właśnie utworzonym i wybierz proces.
Opis Discretization
Domyślnie podczas tworzenia modelu sieci neuronowe, który ma atrybut numeryczny przewidywalne algorytm sieci neuronowe Microsoft traktuje jako numer kolejny atrybutu.Na przykład ServiceGrade atrybut jest liczbą teoretycznie zakresy z 0,00 (wszystkie połączenia są odbierane) do 1,00 (wszystkie obiekty wywołujące Rozłącz).W tym zestaw danych, wartości mają następujący podział:
W rezultacie podczas przetwarzania modelu wyjść mogą być pogrupowane inaczej niż oczekujesz.Na przykład domyślny model, który używa klastrowanie Aby znaleźć grupy wartości dzieli ServiceGrade do zakresów, takiej jak to: 0.0748051948 - 0.09716216215.Mimo to grupowanie matematycznie dokładne, takie zakresy może nie być tak istotnych dla użytkowników biznesowych.Inny sposób grupowania wartości liczbowe, można utworzyć kopię lub wiele kopii kolumna danych liczbowych i określić sposób algorytmu wyszukiwanie danych należy przetworzyć wartości.Na przykład określić, że algorytm podzielić wartości na nie więcej niż pięciu pojemników.
Usługi Analysis Services oferuje różne metody binning lub przetwarzania danych liczbowych.W poniższej tabela przedstawiono różnice między wyniki podczas atrybut wyjściowego ServiceGrade została przetworzona trzy różne sposoby:
Traktując je jako numer kolejny
Posiadające algorytm dyskretyzować wartość przez najlepszych możliwych metoda, co się dzieje się klastrowanie
Określanie, że numery być binned przez metoda równe obszary
Domyślny model (ciągłe) |
Binned przezklastrowanie |
Binned przez obszary równe |
---|---|---|
VALUEOBSŁUGA
Brak0
0.09875120
|
VALUEOBSŁUGA
< 0.074805194834
0.0748051948 - 0.0971621621527
0.09716216215 - 0.1329729729539
0.13297297295 - 0.16749999997510
>= 0.16749999997510
|
VALUEOBSŁUGA
< 0.0726
0.07 - 0.0022
0.09 - 0.1136
>= 0.1236
|
W tej tabela kolumna wartość pokazuje, jak numer kolejny została zrealizowana, a kolumna obsługi pokazuje, ile wierszy znaleziono wartość, zakres lub typ wartości.Aby uzyskać więcej informacji dotyczących opcji binning, zobacz Metody discretization (wyszukiwania danych).
Ostrzeżenie
Te statystyki węzeł Statystyka marginalny modelu, można uzyskać po wszystkich przetwarzania danych.Aby uzyskać więcej informacji na temat węzeł Statystyka marginalny Zobacz Model zawartości dla sieci neuronowe modeli górnictwo (Analysis Services - wyszukiwania danych).
Alternatively, rather than using the numeric values, you could add a separate derived column that classifies the service grades into predefined target ranges, such as Best (ServiceGrade <= 0.05), Acceptable (0.10 > ServiceGrade > 0.05), and Poor (ServiceGrade >= 0.10).
Tworząc kopię kolumny i zmiana metody Discretization
W przypadku wyszukiwanie danych usług Analysis Services, można łatwo zmienić sposób, w jaki dane liczbowe jest binned w struktura wyszukiwania poprzez dodanie kopię kolumna zawierające dane miejsce docelowe i zmiana metoda discretization.
Poniższa procedura opisuje sposób kopii kolumna górnictwa, która zawiera atrybut miejsce docelowe ServiceGrade.Można utworzyć wiele kopii dowolnej kolumna w struktura wyszukiwania, włączając przewidywalne atrybut.
Następnie będzie Dostosowywanie grupowanie wartości liczbowe kolumna skopiowane do zmniejszenia złożoności grupowanie.Ten samouczek będzie równe obszary metoda discretization i określić cztery pakiety.Grupowanie, wynikające z tej metoda są dość blisko wartości miejsce docelowe interesu użytkowników biznesowych.
Ostrzeżenie
Podczas początkowej eksploracji danych można również eksperymentować z różnych metod discretization lub spróbuj najpierw klastrowanie danych.
Aby utworzyć dostosowaną kopię kolumna wstruktura wyszukiwania
W oknie Solution Explorer kliknij dwukrotnie struktura wyszukiwania utworzony.
W struktura wyszukiwania , kliknij pozycję Dodaj struktura wyszukiwania kolumny.
W Zaznacz kolumnę okno dialogowe, wybierz ServiceGrade z listy w Kolumna źródłowa, następnie kliknij przycisk OK.
Nowa kolumna zostanie dodana do listy struktura wyszukiwania kolumny.Domyślnie nowa kolumna górnictwo ma taką samą nazwę jak istniejąca kolumna z przyrostkowe numeryczne: na przykład ServiceGrade 1.Można zmienić nazwę kolumna, to być bardziej opisową.
Należy również określić metoda discretization.
Kliknij prawym przyciskiem myszy ServiceGrade 1 i wybierz Właściwości.
W Właściwości okna, zlokalizuj nazwę właściwość i Zmień nazwę, aby wywołać NN Centrum Binned.
Okno dialogowe pojawi się pytaniem, czy chcesz wprowadzić zmiany tej samej nazwy wszystkich powiązanych model wyszukiwania kolumny.Click No.
W Właściwości okna zlokalizować sekcji Typ danych i rozwiń ją, jeśli to konieczne.
Zmień wartość właściwość Content z Continuous do Discretized.
Dostępne są następujące właściwości.Zmiana wartości właściwości, jak pokazano w poniższej tabela:
Właściwość
Wartość domyślna
Nowa wartość
DiscretizationMethod
Continuous
EqualAreas
DiscretizationBucketCount
Brak wartości
4
Ostrzeżenie
Wartość domyślna, DiscretizationBucketCount jest faktycznie 0, co oznacza, że algorytm automatycznie określa optymalną liczbę wiadrach.Dlatego jeśli chcesz przywrócić jego domyślną wartość tej właściwość, wpisz 0.
W projektancie wyszukiwania danych, kliknij przycisk Górnictwa modele kartę.
Zauważ, że podczas dodawania kopię kolumna struktura wyszukiwania Flaga użycia kopii jest automatycznie zestaw do Ignore.Zazwyczaj po dodaniu kolumna kopii struktura wyszukiwania kopii nie należy używać do analizy wraz z oryginalną kolumna lub algorytm znajdzie silne powiązania między dwoma kolumnami, które mogą zasłaniać inne relacje.
Dodawanie nowego modelu górnictwo struktury górnictwo
Utworzono nowy grupowanie dla atrybut miejsce docelowe, należy dodać nowy model wyszukiwania używający discretized kolumna.Po zakończeniu, CallCenter struktura wyszukiwania będzie miał dwa modele górnictwa:
model wyszukiwania, Call Center Default NN, Uchwyty ServiceGrade wartości jak ciągłego zakres.
model wyszukiwania, Call Center Binned NN, Discretizes ServiceGrade wartości na cztery różne pakiety.
Aby dodać model wyszukiwania na podstawie nowej kolumna zdyskretyzowana
W oknie Solution Explorer kliknij prawym przyciskiem myszy struktura wyszukiwania właśnie utworzonym i wybierz Otwórz.
Kliknij Górnictwa modele kartę.
Kliknij Tworzenie powiązanych model wyszukiwania.
W Nowy Model górnictwa okno dialogowe dla nazwę modelu, typ Wywołania NN Centrum Binned.W Nazwa algorytmu listy rozwijanej wybierz Sieci neuronowe Microsoft.
Na liście kolumn zawartych w nowym model wyszukiwania, zlokalizuj ServiceGradei zmień korzystaniu z Predict do Ignore.
Podobnie, zlokalizuj ServiceGrade Binnedi zmień korzystaniu z Ignore do Predict.
Zazwyczaj nie można porównać modeli górnictwa, używających różnych atrybutów przewidywalne.Jednakże w SQL Server 2008, można utworzyć alias dla model wyszukiwania kolumna.Oznacza to, że można zmienić nazwy ServiceGrade Binned kolumna wewnątrz model wyszukiwania tak, aby ma taką samą nazwę jak oryginalne kolumna.Można następnie bezpośrednio porównać te dwa modele wykresie dokładności nawet danych jest discretized inaczej.
Aby dodać alias struktura wyszukiwania kolumn w modelu górnictwo
W Górnictwa modele kartę w struktury, wybierz opcję ServiceGrade Binned.
Należy zauważyć, że Właściwości okno wyświetla właściwości obiektu ScalarMiningStructure kolumna.
kolumna dla model wyszukiwania, ServiceGrade Binned NN, kliknij komórka kolumna odpowiadające ServiceGrade Binned.
Uwaga to teraz Właściwości okno wyświetla właściwości dla obiektu MiningModelColumn.
Zlokalizuj nazwę właściwość i zmień wartość ServiceGrade.
Zlokalizuj Opis właściwość i wpisz alias kolumna tymczasowe.
Właściwości okno powinny zawierać następujące informacje:
Właściwość
Wartość
Opis
Alias kolumna tymczasowe
Identyfikator
ServiceGrade Binned
Modelowanie flag
Nazwa
Klasa usług
Identyfikator elementu SourceColumn
Kategoria usługi 1
Użycie
Przewidywanie
Kliknij w dowolnym miejscu Górnictwa modelu kartę.
Siatka zostanie zaktualizowana, aby wyświetlić nowy alias tymczasową kolumna ServiceGrade, obok użycia kolumna.Siatki, zawierający struktura wyszukiwania i dwóch modeli wyszukiwania powinna wyglądać następująco:
Struktura
Domyślne Centrum obsługi telefonicznej NN
Wywołanie Centrum Binned NN
Microsoft sieci neuronowe
Microsoft sieci neuronowe
AutomaticResponses
Dane wejściowe
Dane wejściowe
AverageTimePerIssue
Przewidywanie
Przewidywanie
Wywołania
Dane wejściowe
Dane wejściowe
DayOfWeek
Dane wejściowe
Dane wejściowe
FactCallCenterID
Klucz
Klucz
IssuesRaised
Dane wejściowe
Dane wejściowe
LevelOneOperators
Dane wejściowe
Dane wejściowe
LevelTwoOperators
Dane wejściowe
Dane wejściowe
Zamówienia
Dane wejściowe
Dane wejściowe
ServceGrade Binned
Ignoruj
Przewidywanie (ServiceGrade)
ServiceGrade
Przewidywanie
Ignoruj
SHIFT
Dane wejściowe
Dane wejściowe
Całkowita operatorów
Dane wejściowe
Dane wejściowe
WageType
Dane wejściowe
Dane wejściowe
Przetwarzanie modelu
Wreszcie, w celu zapewnienia, że modele utworzone są porównywalne, będzie zestaw materiału siewnego parametr domyślny i modele binned.Ustawienie wartości materiału siewnego gwarancji, że każdy model rozpoczyna przetwarzanie danych z tego samego punktu.
Ostrzeżenie
Jeśli nie określisz wartość liczbową parametru materiału siewnego, SQL Server Analysis Services generują materiału siewnego, na podstawie nazwy modelu.Ponieważ model sieci neuronowe i model regresją mają różne nazwy, należy zestaw wartość początkową dla zapewnienia przetwarzania danych w tej samej kolejności.
Aby określić materiał siewny i przetworzyć modele
W Górnictwa modelu kartę, kliknij prawym przyciskiem myszy kolumna dla modelu o nazwie Call Center - LRi wybierz Ustawić parametry algorytmu.
W wierszu dla parametru HOLDOUT_SEED, kliknij puste komórka w obszarze wartość, a następnie wpisz 1.Click OK.Powtórz ten krok dla każdego modelu skojarzonych ze strukturą.
Ostrzeżenie
Wartość wybierz jako materiał siewny nie ma znaczenia, jak użyć tego samego materiału siewnego dla wszystkich powiązanych modeli.
W Górnictwa modele menu wybierz struktury górnictwa proces i wszystkie modele.Kliknij Tak wdrożyć zaktualizowanego wyszukiwanie danych projektu na serwerze.
W Górnictwa Model procesu okno dialogowe, kliknij przycisk uruchomić.
Kliknij zamknąć zamknąć Postępu procesu okno dialogowe, a następnie kliknij zamknąć ponownie Górnictwa Model procesu okno dialogowe.
Teraz, utworzono dwa modele pokrewne górnictwa, będą eksplorować dane wykrywanie relacje w danych.
Kolejnym zadaniem w lekcji
Eksplorowanie modelu Centrum obsługi telefonicznej (samouczek wyszukiwania danych pośrednich)