Partilhar via


Distribuições (DMX)

No MicrosoftSQL ServerAnalysis Services, defina o conteúdo de colunas em uma estrutura de mineração para simular como os algoritmos processam os dados naquelas colunas no momento da criação de modelos de mineração. Com relação a certos algoritmos, é útil definir a distribuição de colunas contínuas antes de processar o modelo, principalmente quando se sabe que as colunas contêm distribuições comuns de valores. Se as distribuições não estiverem definidas, os modelos de mineração resultantes poderão produzir previsões menos precisas do que se as distribuições estiverem definidas, uma vez que os algoritmos terão menos informações com as quais interpretar dados.

Os algoritmos de mineração de dados do Microsoft oferecem suporte aos seguintes tipos de distribuição:

  • NORMAL
    Os valores para a coluna contínua formam um histograma com uma distribuição Gaussiana normal.

  • Log Normal
    Os valores da coluna contínua formam um histograma, onde o logaritmo dos valores é normalmente distribuído.

  • UNIFORM
    Os valores para a coluna contínua formam uma curva plana, na qual todos os valores são igualmente prováveis.

Para obter mais informações sobre os algoritmos de mineração de dados do Microsoft consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados). Provedores de algoritmo de terceiros podem oferecer suporte a tipos de distribuição adicionais. Para determinar os tipos de distribuição aos quais um algoritmo oferece suporte, use o conjunto de linhas de esquema SUPPORTED_DISTRIBUTION_FLAGS.

Para obter mais informações sobre os tipos de distribuição, consulte Distribuições de colunas (mineração de dados).