Учебник по основам интеллектуального анализа данных
Добро пожаловать в учебник по базовому интеллектуальному анализу данных служб Microsoft Analysis Services. Microsoft SQL Server предоставляет интегрированную среду для создания моделей интеллектуального анализа данных и прогнозирования. В этом учебнике предлагается выполнить сценарий кампании целевой рассылки, в которой используется машинное обучение для анализа и прогнозирования поведения заказчика. Он демонстрирует использование трех наиболее важных алгоритмов интеллектуального анализа данных: кластеризации, деревьев принятия решений и упрощенного алгоритма Байеса. Вы также узнаете, как анализировать результаты с помощью средств просмотра моделей интеллектуального анализа данных, а также создавать прогнозы и диаграммы точности с помощью средств интеллектуального анализа данных, включенных в microsoft SQL Server Analysis Services. Для всех примеров используется вымышленная компания Adventure Works Cycles.
Если вам удобно использовать средства интеллектуального анализа данных, рекомендуется также выполнить учебник по промежуточному интеллектуальному анализу данных (службы Analysis Services — интеллектуальный анализ данных). Эти занятия показывают, как использовать прогнозирование, анализ покупательского поведения, временные ряды, модели взаимосвязей, вложенные таблицы и кластеризацию последовательностей.
Сценарий учебника
В этом руководстве вы являетесь сотрудником Adventure Works Cycles, которому было поручено узнать больше о клиентах компании на основе исторических покупок, а затем использовать эти исторические данные для создания прогнозов, которые можно использовать в маркетинге. Компания прежде не занималась интеллектуальным анализом данных, поэтому необходимо создать новую базу данных, специально предназначенную для интеллектуального анализа данных, и настроить несколько моделей интеллектуального анализа данных.
Обзор учебника
Этот учебник поможет освоить создание и работу с методами машинного обучения нескольких различных типов. Кроме того, будет показано, как создать копию модели интеллектуального анализа данных и применить фильтр к входным данным для получения других результатов. Затем можно сравнить результаты обеих моделей с помощью диаграммы точности прогнозов. Наконец, вы воспользуетесь детализацией для получения дополнительных данных на основе базовой структуры интеллектуального анализа данных.
Интеллектуальный анализ данных служб Microsoft Analysis Services включает следующие функции, которые помогают легко разрабатывать и сравнивать несколько прогнозных моделей, а затем выполнять действия с результатами.
Тестовые наборы с удержанием —При создании структуры интеллектуального анализа данных теперь можно разделить данные в структуре интеллектуального анализа данных на обучающие и проверочные наборы. Позволяет тестировать модели на схожих наборах данных и сравнивать точность связанных моделей.
Фильтры модели интеллектуального анализа данных —Теперь вы можете присоединять фильтры к модели интеллектуального анализа данных и применять их во время обучения и тестирования. Позволяет легко создавать связанные модели для различных подмножеств данных.
Детализация вариантов структуры и столбцов структуры — Теперь вы можете легко перейти от общих шаблонов в модели интеллектуального анализа данных к практическим деталям в источнике данных.
Учебник содержит следующие занятия:
Занятие 1. Подготовка базы данных служб Analysis Services (учебник по интеллектуальному анализу данных — начальный уровень)
На этом занятии вы узнаете, как создать новую базу данных служб Analysis Services, добавить источник данных и представление источника данных, а также подготовить новую базу данных для использования с интеллектуальным анализом данных.
Урок 2. Создание целевой структуры рассылки (учебник по базовому интеллектуальному анализу данных)
На этом занятии рассматривается создание структур моделей интеллектуального анализа данных, которые могут быть использованы в сценарии прямой почтовой рассылки.
Урок 3. Добавление и обработка моделей
На этом занятии будет рассмотрено добавление модели в структуру. Создаваемые модели построены на основе следующих алгоритмов.
Алгоритм дерева принятия решений Майкрософт
Алгоритм кластеризации Майкрософт
Упрощенный алгоритм Байеса (Майкрософт)
Урок 4. Изучение моделей целевой рассылки (учебник по базовому интеллектуальному анализу данных)
На этом занятии будут рассмотрены анализ и интерпретация результатов каждой модели с использованием средств просмотра.
Урок 5. Тестирование моделей (учебник по базовому интеллектуальному анализу данных)
На этом занятии выполняется копия одной из моделей целевой рассылки, добавляется фильтр модели интеллектуального анализа данных для ограничения обучающих данных определенным набором клиентов, а затем производится оценка устойчивости модели.
Урок 6. Создание прогнозов и работа с ними (учебник по базовому интеллектуальному анализу данных)
На этом последнем занятии учебника по интеллектуальному анализу данных (начальный уровень) используется модель, которая позволяет прогнозировать, какие клиенты с наибольшей вероятностью купят велосипед. Затем производится детализация до базовых вариантов для получения контактных данных.
Требования
Убедитесь, что установлены следующие компоненты:
Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services в многомерном режиме
База данных AdventureWorksDW2012 .
Для повышения безопасности образцы баз данных не устанавливаются с SQL Server. Чтобы установить официальные базы данных для Microsoft SQL Server, перейдите на страницу Примеры баз данных Microsoft SQL и выберите SQL Server 2014.
Примечание
При работе с учебником вам может быть проще перемещаться между шагами, если добавить кнопки Следующий раздел и Предыдущий раздел на панель инструментов средства просмотра документов.
См. также:
Решения для интеллектуального анализа данных
Задачи и инструкции по модели интеллектуального анализа данных
Создание и запрос моделей интеллектуального анализа данных с помощью расширений интеллектуального анализа данных: учебники (службы Analysis Services — интеллектуальный анализ данных)