Модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
В этом разделе содержится описание базовой архитектуры модели интеллектуального анализа данных, общие сведения о свойствах модели интеллектуального анализа данных и способы создания модели и работы с моделями интеллектуального анализа данных.
Mining Model Architecture
Defining Mining Models
Mining Model Properties
Mining Model Columns
Processing Mining Models
Viewing and Querying Mining Models
Архитектура модели интеллектуального анализа данных
Модель интеллектуального анализа данных получает данные из структуры интеллектуального анализа данных и анализирует их, применяя алгоритм интеллектуального анализа данных. Структура интеллектуального анализа данных и модель интеллектуального анализа данных являются отдельными объектами. В структуре интеллектуального анализа данных хранятся сведения, определяющие источник данных. Модель интеллектуального анализа данных содержит сведения, полученные по итогам статистической обработки данных, например закономерности, обнаруженные в результате анализа.
Модель интеллектуального анализа данных будет пуста до тех пор, пока не будут обработаны и проанализированы данные, переданные структурой интеллектуального анализа данных. После обработки модель интеллектуального анализа данных содержит метаданные, результаты и привязки к структуре интеллектуального анализа данных.
Метаданные определяют имя модели и сервер, где она хранится, а также определение модели, включая список столбцов из структуры интеллектуального анализа данных, которые использовались для построения модели, определения дополнительных фильтров, применявшихся в обработке модели, и алгоритм, который использовался для анализа данных. На результаты анализа в значительной степени влияет выбор столбцов, фильтров и алгоритма. Например, если на основе одних и тех же данных создать модель кластеризации и модель дерева принятия решений, то различия в содержимом этих моделей могут оказаться значительными, поскольку в них используются разные алгоритмы и фильтры. Дополнительные сведения см. в разделе Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
Для различных алгоритмов в модели хранятся различные результаты. Они могут включать закономерности, наборы элементов, правила и формулы. Эти результаты можно использовать для формирования прогнозов.
Привязки, которые хранятся в модели, указывают на данные, помещенные в кэш в структуре интеллектуального анализа данных. Если в процессе обработки структуры данные были помещены в кэш и не были удалены из него, то эти привязки позволят выполнять детализацию от результатов к вариантам, образующим несущее множество этих результатов. Фактические данные при этом хранятся в кэше структуры, а не в модели.
[В начало]
Определение моделей интеллектуального анализа данных
Чтобы создать модель интеллектуального анализа данных, выполните следующие действия.
Создайте базовую структуру интеллектуального анализа данных.
Выберите алгоритм.
Укажите для модели столбцы и их использование.
Задайте дополнительные параметры для тонкой настройки обработки, проводимой алгоритмом.
Выполните обработку модели.
Службы Analysis Services предоставляют следующие средства, облегчающие работу с моделями интеллектуального анализа данных.
Мастер интеллектуального анализа данных помогает создать структуру и связанную с ней модель интеллектуального анализа данных. Это самый простой способ. Мастер автоматически создает необходимую структуру интеллектуального анализа данных и помогает настроить важные параметры.
Определение модели можно выполнить с помощью DMX-инструкции CREATE MODEL. В процессе этого автоматически создается необходимая структура. Поэтому данный метод не позволяет повторно использовать существующую структуру. Этот метод следует применять только в том случае, если точно известно, какую модель нужно будет создать.
Добавить новую модель интеллектуального анализа данных в существующую структуру можно с помощью DMX-инструкции ALTER STRUCTURE ADD MODEL. Этот метод хорошо подходит для экспериментов с различными моделями, построенными на одном наборе данных.
Модели интеллектуального анализа данных также можно создавать программным образом с помощью объектов AMO или XML для аналитики, а также клиента интеллектуального анализа данных для Excel и других клиентов. Дополнительные сведения см. в следующих разделах.
[В начало]
Свойства модели интеллектуального анализа данных
Каждая модель интеллектуального анализа данных обладает свойствами, которые определяют модель и ее метаданные. К свойствам могут относиться имя, описание, дата последней обработки модели, разрешения на модель, а также все фильтры для данных, которые использовались для обучения.
Каждая модель интеллектуального анализа данных также содержит свойства, унаследованные от структуры интеллектуального анализа данных, которые описывают используемые в модели столбцы данных. Если столбец является вложенной таблицей, то к нему также может применяться отдельный фильтр.
Кроме того, каждая модель интеллектуального анализа данных имеет два специальных свойства: Algorithm и Usage.
Свойство Algorithm определяет алгоритм, используемый для создания модели. Набор доступных алгоритмов зависит от используемого поставщика. Список алгоритмов, входящих в состав служб SQL ServerAnalysis Services, см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Свойство Algorithm применяется к модели интеллектуального анализа данных; его можно задать только один раз для каждой модели. Можно изменить алгоритм позднее, но некоторые столбцы в модели интеллектуального анализа данных могут стать недопустимыми, если они не поддерживаются выбранным алгоритмом. Более того, необходимо повторно обработать модель в соответствии с изменениями.
**Свойство Usage **определяет, какие столбцы будут использованы моделью. Можно определить используемый столбец как Input, Predict, Predict Only или Key. Свойство Usage применяется к отдельным столбцам модели интеллектуального анализа данных и должно задаваться отдельно для каждого столбца, включенного в модель. Если структура содержит столбец, который не используется в модели, то свойству usage задается значение Ignore.
Значения свойств модели интеллектуального анализа данных можно изменить после создания модели. Однако после любого изменения, даже если оно касалось только имени модели интеллектуального анализа данных, необходимо выполнить повторную обработку модели. После повторной обработки модели можно получить другие результаты.
[В начало]
Столбцы модели интеллектуального анализа данных
Модель интеллектуального анализа данных, как и структура интеллектуального анализа данных, содержит столбцы. Можно выбрать, какие из столбцов из структуры интеллектуального анализа данных будут использоваться в модели. Помимо столбцов, находящихся в базовой структуре интеллектуального анализа данных, столбцы структуры интеллектуального анализа данных можно скопировать и переименовать или изменить метод их использования.
В зависимости от выбранного алгоритма некоторые столбцы в структуре интеллектуального анализа данных могут оказаться несовместимыми с моделью, что может привести к ухудшению результата. Следует тщательно проверить данные в структуре и включить в модель только те столбцы, которые содержат полезные для анализа данные. Если столбец не подходит для использования, его не нужно удалять из структуры или модели интеллектуального анализа данных. Можно просто установить для столбца флаг, указывающий, что столбец должен пропускаться во время построения модели. Это означает, что столбец останется в структуре интеллектуального анализа данных, но не будет использоваться в модели интеллектуального анализа данных. При этом, если включена детализация из модели в структуру, в дальнейшем сохранится возможность получения данных из этого столбца.
После создания модели можно вносить изменения, например добавлять или удалять столбцы или изменять имя модели. Однако после любого изменения, даже если оно касалось только метаданных модели, необходимо выполнить повторную обработку модели.
Дополнительные сведения см. в разделах Столбцы структуры интеллектуального анализа данных и Столбцы модели интеллектуального анализа данных.
[В начало]
Обработка моделей интеллектуального анализа данных
Модель интеллектуального анализа данных до обработки представляет собой пустой объект. Во время обработки модели данные, которые были помещены в кэш структурой, передаются через фильтр, если он был определен в модели, и подвергаются анализу в соответствии с заданным алгоритмом. Алгоритм выявляет правила и закономерности в данных, а затем на основе правил и закономерностей производит заполнение модели. Дополнительные сведения об использовании алгоритмов для создания моделей интеллектуального анализа данных см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
После обработки модель интеллектуального анализа данных также хранит сведения о результатах анализа. Дополнительные сведения о типах данных, хранящихся в модели интеллектуального анализа данных, см. в разделе Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
[В начало]
Просмотр и запросы моделей интеллектуального анализа данных
После обработки модели ее можно просмотреть с помощью пользовательских средств просмотра, входящих в состав среды Business Intelligence Development Studio и SQL Server Management Studio. Дополнительные сведения о пользовательских средствах просмотра в службах Analysis Services см. в разделе Просмотр модели интеллектуального анализа данных.
Запросы к модели интеллектуального анализа данных позволяют создавать прогнозы и получать метаданные модели или закономерности, созданные моделью. Для создания запросов используется язык DMX. Сведения о различных типах запросов, доступных для модели интеллектуального анализа данных, см. в разделе Запрос моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
См. также