Udostępnij za pośrednictwem


Algorytm klastrowanie Microsoft sekwencji

The Microsoft Sequence Clustering algorithm is a sequence analysis algorithm provided by Microsoft SQL Server Analysis Services.Dane, które zawiera zdarzenia, które mogą być połączone przez następujące ścieżki przeszukiwać za pomocą tego algorytmu lub Sekwencje.Algorytm znajduje najczęściej sekwencji zgodnie z grupą, lub klastrowanie, sekwencje, które są identyczne.Oto kilka przykładów sekwencji:

  • Dane opisujące ścieżki kliknięcie, które są tworzone, gdy użytkownicy przejść lub przeglądać witryna sieci Web.

  • Dane opisujące kolejności, w którym klient dodaje elementy do koszyka w trybie online punktu sprzedaży detalicznej.

Ten algorytm jest podobne pod wieloma względami do Microsoft Klastrowanie algorytmu. Jednak zamiast znajdowanie klastrów sprawy, które zawierają podobne atrybuty Microsoft Algorytm klastrowanie sekwencji znajduje klastrów spraw, które zawierają podobne ścieżek w sekwencji.

Przykład

AdventureWorks witryna sieci Web zbiera informacje o jakie stron witryny wizyty użytkownikom oraz o kolejności, w którym są odwiedzane strony.Ponieważ firmy zapewnia zamawianie, klienci muszą zalogować się do witryny.Dzięki temu firmy z kliknij przycisk informacje o profilu każdego nabywcy.Za pomocą Microsoft Algorytm klastrowanie sekwencji na tych danych, firmy można znaleźć grupy lub grup, klientów, którzy mają podobne desenie lub sekwencji kliknięć. Firmy mogą następnie używać tych klastrów do analizy, w jaki sposób użytkownicy przenoszą za pośrednictwem witryna sieci Web do identyfikowania stron, które są najbardziej związane z sprzedaży określonego produktu, a do przewidywania, które strony są najczęściej można następnie odwiedził.

Jak działa algorytmu

The Microsoft Sequence klastrowanie algorithm is a hybrid algorithm that combines klastrowanie techniques with Markov chain analysis to identify clusters and their sequences. Jeden z hallmarks z Microsoft Algorytm klastrowanie sekwencji jest używa sekwencji danych. Dane te zazwyczaj reprezentuje serie zdarzeń lub przejść między stanami w zestawie danych, takich jak zakupy serii produktów lub kliknie przycisk sieci Web dla danego użytkownika.Algorytm środków różnice i sprawdza, czy wszystkie prawdopodobieństw przejścia lub odległości między wszystkich sekwencji możliwych do danych, aby określić, które sekwencje są najlepiej używać jako danych wejściowych dla klastrowanie.Algorytm została utworzona lista kandydatów sekwencji używa informacji sekwencji jako dane wejściowe dla metoda EM klastrowanie.

Aby uzyskać szczegółowy opis realizacji zobacz Sekwencja Microsoft klastrowanie algorytm informacje techniczne.

Dane wymagane dla klastrowanie modele sekwencji

Podczas przygotowywania danych do użycia w szkolenia sekwencji klastrowanie modelu, należy zapoznać się wymagania dotyczące określonego algorytmu, potrzebny jest ilości danych i sposobu używania danych.

Wymagania dotyczące sekwencji klastrowanie modelu są następujące:

  • Pojedyncze key kolumna   Klastrowanie modelu sekwencji wymaga klucz, który identyfikuje rekordy.

  • Kolumna sekwencji   W przypadku danych sekwencji modelu muszą mieć zagnieżdżoną tabela zawierającą kolumnę z IDENTYFIKATOREM sekwencji.IDENTYFIKATOR sekwencji może być wszystkie typy danych sortowania.Na przykład służy identyfikator strona sieci Web, liczba całkowita lub ciąg tekstowy, tak długo, jak kolumna identyfikuje zdarzenia w sekwencji.Identyfikator sekwencji tylko jeden jest dozwolona dla każdej sekwencji oraz jest dozwolony tylko jeden typ sekwencji, w każdym modelu.

  • Atrybuty opcjonalne nie sekwencji    Algorytm obsługuje dodawanie innych atrybutów, które nie są związane z sekwencji.Atrybuty te można dołączyć kolumny, zagnieżdżone.

Na przykład w przykładzie wymienionych wcześniej witryny sieci AdventureWorks Web sekwencji klastrowanie modelu może zawierać informacje zamówienia jako tabela przypadek, kryteria demograficzne dotyczące określonego odbiorcy, dla każdego zamówienia jako atrybuty innej niż kolejność i zagnieżdżoną tabelę zawierającą sekwencji, w którym klient przeglądanych w witrynie lub umieszczanie elementów w koszyku, jak informacje dotyczące sekwencji.

Aby uzyskać więcej szczegółowych informacji na temat typów zawartości i typy danych obsługiwane dla sekwencji klastrowanie modeli, należy zapoznać z sekcją Wymagania dotyczące Sekwencja Microsoft klastrowanie algorytm informacje techniczne.

Wyświetlanie sekwencji klastrowanie w modelu

Model wyszukiwania, który tworzy ten algorytm zawiera opisy najczęstszych sekwencji danych.Aby poznać modelu, można użyć Podgląd klastrowania Microsoft sekwencji.Umożliwia wyświetlanie sekwencji klastrowanie modelu Analysis Services Pokazuje klastry, które zawierają wiele przejścia. Można również wyświetlać statystyk związanych.Aby uzyskać więcej informacji zobaczWyświetlanie model wyszukiwania z podglądem klastrowania Microsoft sekwencji.

Jeśli chcesz wiedzieć więcej szczegółów można przeglądać w modelu Podgląd zawartości drzewa rodzajowa firmy Microsoft.Zawartość przechowywaną modelu obejmuje dystrybucji dla wszystkich wartości w każdym węźle, prawdopodobieństwo każdy klaster i szczegółowe informacje dotyczące przejścia.Aby uzyskać więcej informacji zobaczMining Model Content for Sequence Clustering Models (Analysis Services - Data Mining).

Tworzenie prognoz

Model ma został wyszkolony, wyniki są przechowywane jako zbiór wzorców.Opisy najczęstszych sekwencji danych służy do przewidywania następnym krokiem może z nową kolejnością.Jednak ponieważ algorytm zawiera inne kolumny, można użyć modelu wynikowego do identyfikowania relacji między szeregowania danych oraz danych wejściowych, które nie są sekwencyjne.Na przykład jeśli dane demograficzne zostanie dodany do modelu, istnieje możliwość prognoz dla określonych grup odbiorców.Kwerendy przewidywanie można dostosować do zwracania zmienna liczba prognoz lub zwrócić Statystyki opisowe.

Aby uzyskać informacje dotyczące tworzenia kwerend względem model wyszukiwanie danych zobacz Podczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych). Aby zapoznać się z przykładami sekwencji klastrowanie modelu należy użyć kwerendy Zobacz Podczas badania sekwencji klastrowanie w modelu (Analysis Services — wyszukiwanie danych).

Uwagi

  • Nie obsługuje korzystania z przewidywanego modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.

  • Obsługuje przeglądanie szczegółowe.

  • Obsługuje korzystanie z modeli wyszukiwania OLAP i tworzenia wymiary wyszukiwanie danych.