Adicionando uma exibição da fonte de dados aos dados de call center (Tutorial de mineração de dados intermediário)
Publicado: dezembro de 2016
Aplicável a: SQL Server 2016 Preview
Nesta tarefa, você adiciona uma exibição da fonte de dados que será usada para acessar os dados do call center. Os mesmos dados serão usados para criar o modelo de rede neural inicial para exploração e o modelo de regressão logística que você usará para fazer recomendações.
Você também usará o Designer de Exibição da Fonte de Dados para adicionar uma coluna para o dia da semana. Isso é porque, embora os dados de origem acompanhem os dados do call center por datas, sua experiência diz que há padrões recorrentes em termos de volume de chamadas e qualidade de serviço, dependendo se o dia for um fim de semana ou um dia útil.
Procedimentos
Para adicionar uma exibição da fonte de dados
Em Solution Explorer, clique com botão direito exibições da fonte de dados, e selecione novo modo de exibição de fonte de dados.
O Assistente de Exibição da Fonte de Dados é exibido.
Na página Bem-vindo ao Assistente de Exibição da Fonte de Dados, clique em Avançar.
Sobre o Selecionar uma fonte de dados página, em fontes de dados relacionais, selecione o Adventure Works DW Multidimensional 2012 fonte de dados. Se você não tiver essa fonte de dados, consulte Tutorial básico de mineração de dados. Clique em Avançar.
Sobre o Selecionar tabelas e exibições página, selecione a tabela a seguir e, em seguida, clique na seta à direita para adicioná-lo à exibição de fonte de dados:
FactCallCenter (dbo)
DimDate
Clique em Avançar.
Sobre o Concluindo o assistente página, por padrão, o modo de exibição de fonte de dados é denominado Adventure Works DW Multidimensional 2012. Altere o nome para CallCenter, e, em seguida, clique em Concluir.
Designer de exibição de fonte de dados é aberta para exibir o CallCenter exibição da fonte de dados.
Clique com botão direito dentro do painel de exibição da fonte de dados e selecione Adicionar/remover tabelas. Selecione a tabela, DimDate e clique em OK.
Uma relação deve ser adicionada automaticamente entre o DateKey colunas em cada tabela. Você usará essa relação para a coluna EnglishDayNameOfWeek, do DimDate tabela e usá-lo em seu modelo.
No designer de exibição da fonte de dados, clique na tabela, FactCallCenter, e selecione novo cálculo nomeado.
No criar cálculo nomeado caixa de diálogo, digite os seguintes valores:
Nome da coluna DayOfWeek Description Obter dia de semana da tabela DimDate Expressão (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
Para verificar se a expressão cria os dados você precisa, clique a tabela FactCallCenter, e, em seguida, selecione explorar dados.
Reserve um minuto para revisar os dados disponíveis, para que você possa entender como são usados na mineração de dados:
Nome da coluna | Contém |
---|---|
FactCallCenterID | Uma chave arbitrária criada durante a importação dos dados para o data warehouse. Esta coluna identifica registros exclusivos e deve ser usada como o chave de caso para o modelo de mineração de dados. |
DateKey | A data da operação do call center, expressa como um inteiro. Chaves de datas em valores inteiros são usadas frequentemente em data warehouses, mas você pode obter a data no formato data/hora se agrupar por valores de data. Observe que as datas não são exclusivas porque o fornecedor oferece um relatório separado para cada turno em cada dia de operação. |
WageType | Indica se o dia foi um dia da semana, um final de semana ou feriado. É possível que haja uma diferença na qualidade do atendimento ao cliente nos finais de semana versus dias da semana para que você usará esta coluna como entrada. |
Turno | Indica o turno para o qual as chamadas são registradas. Esse call center divide o dia de trabalho em quatro turnos: AM, PM1, PM2 e Meia-noite. É possível que o turno influencie na qualidade de atendimento ao consumidor; então, você usará isso como entrada. |
LevelOneOperators | Indica o número de operadores de nível 1 no imposto. Os funcionários do call center começam no Nível 1. Então, esses funcionários são menos experientes. |
LevelTwoOperators | Indica o número de operadores de Nível 2 em serviço. Um funcionário deve registrar um certo número de horas de serviço para ser qualificado como operador de Nível 2. |
TotalOperators | O número total de operadores presentes durante o turno. |
Chamadas | O número de chamadas recebidas durante o turno. |
AutomaticResponses | O número de chamadas administradas totalmente pelo processamento de chamada automatizado (Resposta Interativa de Voz ou IVR). |
Orders | O número de pedidos resultantes das chamadas. |
IssuesRaised | O número de emissões geradas pelas chamadas que exigem acompanhamento. |
AverageTimePerIssue | O tempo médio necessário para responder a uma chamada de entrada. |
ServiceGrade | Medida de uma métrica que indica a qualidade geral do serviço, como o taxa de abandono para o turno inteiro. Quanto maior a taxa de abandono, maior a probabilidade de insatisfação dos clientes e de perda dos pedidos em potencial. |
Observe que os dados incluem quatro colunas diferentes com base em uma única coluna de data: WageType, DayOfWeek, Shift, e DateKey. Normalmente, na mineração de dados não é uma boa ideia usar várias colunas derivadas dos mesmos dados, já que os valores se correlacionam entre si muito fortemente e podem ofuscar outros padrões.
No entanto, não usaremos DateKey no modelo porque ela contém muitos valores exclusivos. Não há nenhuma relação direta entre Shift e DayOfWeek, e WageType e DayOfWeek são parcialmente relacionados apenas. Se você estivesse preocupado com a colinearidade, poderia criar a estrutura usando todas as colunas disponíveis e depois ignorar colunas diferentes em cada modelo e testar o efeito.
Próxima tarefa da lição
Criando uma estrutura de rede Neural e modelo &40; Tutorial de mineração de dados intermediário &41;