Udostępnij za pośrednictwem


Sprawdzanie poprawności modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych)

Sprawdzanie poprawności to proces oceny, jak wykonać do modeli wyszukiwania dla danych rzeczywistych.Jest rzeczą ważną, aby sprawdzić poprawność do modeli wyszukiwania zrozumienie ich jakości i właściwości, aby je wdrożyć w środowisku produkcyjnym.

Istnieje kilka metod oceny jakości i właściwości model wyszukiwanie danych.Pierwszy zawiera korzystanie z różnych środków ważności statystycznej do ustalenia, czy są problemy w danych lub w modelu.Po drugie danych może być podzielić na szkolenie i testowania zestawy w celu testowania dokładności prognoz.Na koniec użytkownik może poprosić ekspertów firmy dotyczące przeglądania wyniki model wyszukiwanie danych do stwierdzenia, czy wykryte wzorców znaczenie w scenariuszu firmy docelowej.Wszystkie te metody są przydatne w przypadku metody wyszukiwanie danych i są używane iteratively podczas tworzenia, przetestować i dostosować modeli odpowiedzi na określony problem.

This section introduces some basic concepts related to model quality, and introduces the strategies for model validation that are provided in Microsoft SQL Server 2008 Analysis Services.Aby zapoznać się z omówieniem sposobu sprawdzania poprawności modelu jest dopasowywana do większego procesu wyszukiwanie danych zobacz Projekty wyszukiwania danych (Analysis Services — wyszukiwanie danych).

Kryteria pomiarów modeli wyszukiwanie danych

Większości metod sprawdzania poprawności model wyszukiwanie danych nie odpowiedzi na pytania biznesowe bezpośrednio, ale udostępniają miar, które mogą być używane do firmy lub decyzji rozwoju.Brak nie kompleksowe regułę, która może określić gdy model jest wystarczająco dobrze lub gdy użytkownik ma za mało danych.

Środki wyszukiwanie danych dzielą się na ogół na kategorie dokładności, niezawodność i użyteczność.

Dokładność, niezawodności i użyteczności

Dokładność jest miarą tego, jak model całkowicie z atrybutami danych, które zostały przekazane skorelowany wyniku.Istnieją różne środki dokładności, ale wszystkie środki dokładności są zależne od danych, który jest używany.W rzeczywistości wartości mogą zostać utracone lub przybliżone lub może być dane zostały zmienione przez wiele procesów.Szczególnie w fazie badań i rozwoju można zdecydować akceptować pewne błąd w danych, zwłaszcza wtedy, gdy dane są dość jednolite w jego właściwości.Na przykład modelu, który prognozuje sprzedaż w danym magazynie, na podstawie sprzedaży w przeszłości można zdecydowanie skorelowanej i bardzo dokładnych, nawet jeśli danego magazynu używane konsekwentnie Niewłaściwa metoda rozliczania kont.Dlatego pomiarów dokładność musi być zrównoważone przez oceny wiarygodności.

Niezawodność ocenia sposób, który wykonuje model wyszukiwanie danych na różne zestawy danych.model wyszukiwanie danych jest wiarygodna, jeśli generuje ten sam rodzaj prognoz lub znajdzie te same rodzaje ogólne wzorców niezależnie od danych testów, które jest dostarczany.Na przykład modelu, który generuje dla magazynu, który używany niewłaściwy metoda rozliczania kont nie będzie generalize również do innych magazynów, a w związku z tym nie jest niezawodne.

Użyteczność obejmuje różnych miar, informujące, czy model dostarcza użytecznych informacji.Na przykład model wyszukiwanie danych, aby correlates przechowywać lokalizacji sprzedaży może być zarówno dokładne, jak i niezawodny, ale może nie być przydatne, ponieważ wynik nie generalize, dodając więcej są przechowywane w tej samej lokalizacji.Ponadto nie odpowiada pytanie podstawowe biznesowych, dlaczego określonych lokalizacji mają więcej sprzedaży.Można także stwierdzić, że modelu, który pojawia się w rzeczywistości pomyślne jest znaczenia, ponieważ jest on oparty na korelacji między w danych.

Microsoft wyszukiwanie danych Framework

OSTRE DM jest dobrze znanych metodologię, która w tym artykule opisano kroki w celu zdefiniowania, opracowywania i realizacji projektu wyszukiwanie danych.OSTRE DM jest jednak informacje o pojęciach RAM, które nie oferuje wskazówki w sposób zakres i harmonogramu projektu.Aby lepiej spełniać określonych potrzeb użytkowników biznesowych, którzy są zainteresowani wyszukiwanie danych, ale nie wiadomo, gdzie należy rozpocząć planowanie i potrzeb deweloperów, którzy mogą być wykwalifikowanych przy projektowaniu aplikacji .NET, ale zostały wprowadzone do wyszukiwanie danych Microsoft opracowała metoda wprowadzania projekt wyszukiwanie danych, który zawiera obszerny system oceny.

Aby uzyskać więcej informacji, zobacz temat Strona zasoby wyszukiwanie danych firmy Microsoft.

Metody sprawdzania poprawności model wyszukiwania w usługach Analysis Services programu SQL Server

SQL Server 2008 obsługuje wiele metod do sprawdzania poprawności wyszukiwanie danych rozwiązania, które obsługują wszystkie fazy wyszukiwanie danych metodologii rozwoju.

partycjonowanie do szkolenia i testowanie zestawów danych

partycjonowanie danych do szkolenia i testowania zestawów jest ustanowione technikę dotyczące przygotowywania danych do oceny.Niektóre części danych z zestaw szkolenia jest zarezerwowana do testowania, a pozostała część danych jest używany do szkolenia.Po zakończeniu modelu model używany jest dokonanie prognoz dla zestaw testów.Ponieważ dane zestaw szkolenia jest losowo z tych samych danych, używany do szkolenia, metryki dokładności, które wynikają z testów jest mniej prawdopodobne dotyczy rozbieżności danych i w związku z tym lepiej odzwierciedlają właściwości modelu.

Aby uzyskać więcej informacji zobaczPartycjonowanie danych do szkolenia i testowanie zestawy (Analysis Services — wyszukiwanie danych).

krzyżowe sprawdzanie poprawności z modeli wyszukiwania

Cross-validation lets you partition a dataset into many smaller cross-sections, and create multiple models on the cross-sections to test the validity of the complete data set.Analysis Services then generates detailed accuracy metrics for each partition.Za pomocą tych informacji, poprawić jakość w przypadku pojedynczego modelu lub określić najlepszą modeli dla określonego zestaw danych.

Aby uzyskać więcej informacji zobaczkrzyżowe sprawdzanie poprawności (Analysis Services — wyszukiwanie danych).

Dokładność model wyszukiwania wykresów

Microsoft SQL Server Analysis Services zapewnia narzędzia ułatwiające dokładności przewidywanie na wykresie, testowanie modelu dla nowych lub istniejących danych lub porównać wiele modeli w wykresy i raporty.

A wykres wzrostu jest metodą wizualizacji udoskonalenia, które można uzyskać z przy użyciu model wyszukiwanie danych podczas porównywania do zgadywanie losowe.Można również utworzyć wykresy zysku Kojarzenie zysk finansowy lub kosztów za pomocą modelu górnictwo a Wykresy punktowe modeli regresja.A Klasyfikacja macierzy jest to metoda sortowania dobrych i złych prób do tabela, dzięki czemu użytkownik może szybko i łatwo ocenić sposób dokładnie modelu Prognozuje wartości miejsce docelowe.

Aby uzyskać więcej informacji, Narzędzia do wykresy dokładność modelu (Analysis Services — wyszukiwanie danych).

Można także filtrować modeli na różne sposoby szkolić i testowania różnych kombinacji tych samych danych źródłowych.Aby uzyskać więcej informacji zobaczPomiar dokładność model wyszukiwania (Analysis Services — wyszukiwanie danych).

Przeglądanie i kwerenda model zawartości i sprawy

Usługi Analysis Services zawiera zbiór danych wyszukiwania przeglądarki do przeglądania i eksplorowania modelu.Można również utworzyć zawartości, kwerendy, które pomagają lepiej zrozumieć modelu i znaleźć nieoczekiwane problemy w swoje podejście lub danych.Po utworzeniu kwerendy zawartości przy użyciu rozszerzenia wyszukiwanie danych (DMX), można pobrać informacje statystyczne o wykryte przez model wyszukiwania wzorców lub pobrać sprawy, które obsługują określone wzorce znalezionych przez model.Można również może przejść za pomocą szczegółów w podstawowej struktura wyszukiwania, aby znaleźć lub przedstawia szczegółowe informacje, które nie zostały uwzględnione w modelu lub zająć się wzorce w danych.

Aby uzyskać więcej informacji na temat kwerendy model zawartości zobacz Podczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych).

Aby uzyskać więcej informacji na temat przeglądania zawartości modelu zobacz Wyświetlanie modelu wyszukiwanie danych.

Aby uzyskać więcej informacji dotyczących sposobu interpretowania zawartości modelu dla określonych algorytmów zobacz Algorytmy wyszukiwania danych (Analysis Services — wyszukiwanie danych).