Analise um cenário e mapeie-o para uma opção de configuração do HDInsight.
Leia o estudo de caso a seguir e responda às perguntas para mapear um cenário para uma configuração de cluster HDInsight.
Estudo de caso – Ciclos AdventureWorks
A AdventureWorks vende bicicletas e peças de bicicletas diretamente para clientes e distribuidores. A empresa tem atualmente um único escritório na Holanda. Eles têm vendido bicicletas nos Estados Unidos, Alemanha e Espanha através de uma cadeia de distribuidores e através de vendas on-line em seu site. O cumprimento da entrega é feito por centros de distribuição locais.
A empresa está a planear expandir-se através da criação de novos escritórios porque o crescimento das vendas nestes países/regiões tem vindo a aumentar nos últimos três anos. Os locais são:
- Tóquio, Japão
- Seattle, Estados Unidos
- Chicago, Estados Unidos
- Berlim, Alemanha
- Barcelona, Espanha
- Paris, França
A AdventureWorks está em um mercado altamente competitivo há 15 anos. Eles querem se tornar a empresa de bicicletas mais inovadora, fornecendo aos atuais e futuros proprietários de bicicletas a melhor tecnologia e serviços da classe. O departamento de Pesquisa e Desenvolvimento da AdventureWorks concebeu com sucesso a próxima onda de produtos inovadores. Eles estão contando com engenheiros de dados, engenheiros de IA e cientistas de dados para ajudar no projeto e na implementação da solução.
Dado o aumento do nível de vendas e expansão em escala global, a infraestrutura de dados existente não atenderá aos requisitos gerais de negócios nem ao crescimento futuro que a AdventureWorks aspira. Os diretores de informação e tecnologia expressaram o desejo de abandonar os sistemas locais existentes e migrar para a nuvem para atender ao crescimento esperado. Este plano é apoiado pelo CFO, uma vez que houve um pedido de substituição de hardware à medida que a infraestrutura existente chega ao fim da sua vida útil. O CFO está ciente de que a nuvem pode oferecer alternativas mais eficientes em termos de custos.
Como Engenheiro de Dados Sênior, você ajudará a AdventureWorks no projeto e implementação de soluções. Isso os ajudará a atender aos requisitos de negócios, funcionais e técnicos estabelecidos para estratégias de crescimento, expansão e inovação. Você executará esse plano de uma forma que minimize os custos operacionais e possa ser monitorado quanto à eficácia.
Em um workshop de descoberta, você determina as seguintes informações:
Análise de dados
Atualmente, os relatórios de negócios estão sendo fornecidos por um único banco de dados local configurado como um data warehouse. Ele possui um banco de dados chamado AdventureWorksDW, que é usado para fornecer relatórios históricos e análises descritivas. Nos últimos tempos, esse servidor tem lutado para processar os dados de relatório rapidamente, sua equipe deve garantir que o acesso aos dados seja restrito.
A AdventureWorks também gostaria de levar sua análise de dados mais longe e começar a utilizar recursos de análise preditiva. Esta atividade não está atualmente a ser realizada. A organização entende que uma recomendação ou um mecanismo de análise de texto pode ser construído. Eles gostariam que você os orientasse sobre qual seria a melhor tecnologia e abordagem a adotar na implementação de uma solução que também seja resiliente e de alto desempenho.
Análise de redes sociais
Nos últimos anos, o departamento de marketing da organização tem realizado uma grande variedade de campanhas X em várias épocas do ano. Eles estão interessados em medir o impacto de seu trabalho rastreando ativos de mídia social, como hashtags, durante essas campanhas. Eles gostariam de ter a capacidade de rastrear qualquer hashtag de qualquer nome.
Bicicleta conectada
As bicicletas AdventureWorks podem ser equipadas com um inovador computador de bicicleta integrado. Este computador consiste em recursos de bloqueio automático da bicicleta, bem como status operacional. As informações capturadas por este computador de bicicleta incluem:
- Modelo da bicicleta, número de série e proprietário registado
- Localização da bicicleta (latitude longitude)
- Estado atual (estacionário, em movimento)
- Velocidade atual em quilômetros por hora
- Bicicleta Bloqueada / Desbloqueada
- Informações sobre peças e componentes de bicicletas (em bicicletas elétricas)
Aplicativos próprios e de terceiros podem ter acesso às informações do computador da bicicleta que devem ser seguras. Essas informações podem ser usadas para a integração em aplicativos móveis, exibição em tempo real da localização e compartilhamento de informações de passeio de bicicleta. Além disso, os dados de resumo diário podem ser salvos em arquivos simples. Estes dados incluem o modelo da bicicleta, o número de série, o proprietário registado, um resumo do total de quilómetros percorridos por dia e a velocidade média.
Serviços de manutenção de bicicletas
Os proprietários de bicicletas existentes podem optar por receber notificações sobre quando a sua bicicleta precisa de reparação, com base em:
- Telemetria da bicicleta elétrica baseada em dados do sensor
- Informações sobre o uso da bicicleta provenientes dos computadores de bicicleta embutidos com base na quilometragem média / desgaste
- Este cenário de manutenção preditiva é um serviço no qual os proprietários de bicicletas podem optar, oferecido como um serviço pago.
Perguntas
Com base no seguinte estudo de caso, responda às seguintes perguntas