Analisi di uno scenario ed esecuzione del mapping a un'opzione di configurazione di HDInsight.

Completato

Leggere il case study seguente e rispondere alle domande per eseguire il mapping di uno scenario a una configurazione del cluster di HDInsight.

Case study - Cicli di AdventureWorks

AdventureWorks vende biciclette e pezzi di ricambio direttamente ai clienti e ai distributori. L'azienda dispone attualmente di un unico ufficio nei Paesi Bassi. Vendono biciclette in Stati Uniti, Germania e Spagna tramite una catena di distributori e vendite online nel proprio sito Web. L'evasione delle consegne viene eseguita dai centri di distribuzione locali.

L'azienda sta pianificando un ampliamento con la creazione di nuovi uffici perché la crescita delle vendite in questi paesi/aree geografiche negli ultimi tre anni è stata costante. Le posizioni sono:

  • Tokyo, Giappone
  • Seattle, USA
  • Chicago, USA
  • Berlino, Germania
  • Barcellona, Spagna
  • Parigi, Francia

AdventureWorks ha operato in un mercato altamente competitivo negli ultimi 15 anni. Vogliono diventare la società di biciclette più innovativa che fornisce ai proprietari di biciclette attuali e futuri la tecnologia e i servizi migliori sul mercato. Il reparto di Ricerca e Sviluppo di AdventureWorks ha completato l'ideazione della prossima ondata di prodotti innovativi. L'azienda si basa sul contributo di ingegneri dei dati, tecnici AI e scienziati dei dati sia nella progettazione che nell'implementazione della soluzione.

Dati l'aumento delle vendite e l'espansione su scala globale, l'infrastruttura di dati esistente non soddisferà i requisiti aziendali complessivi o la crescita futura a cui AdventureWorks aspira. Il direttore informatico e il direttore tecnico hanno espresso il desiderio di abbandonare i sistemi locali esistenti e di passare al cloud per ottenere la crescita prevista. Questo piano è supportato dal CFO visto che è stata richiesta la sostituzione dell'hardware, perché l'infrastruttura esistente ha raggiunto la fine del ciclo di vita. Il CFO sa che il cloud potrebbe offrire alternative più convenienti.

In qualità di ingegnere dei dati senior, l'utente assisterà AdventureWorks nella progettazione e nell'implementazione della soluzione. Questo aiuterà l'azienda a soddisfare i requisiti aziendali, funzionali e tecnici stabiliti per le strategie di crescita, espansione e innovazione. Il piano verrà eseguito in modo da ridurre al minimo i costi operativi e la sua efficacia potrà essere monitorata.

In un workshop esplorativo si stabiliscono le seguenti informazioni:

Analisi dei dati

La creazione di report aziendali è attualmente fornita da un singolo database locale configurato come data warehouse. Questo contiene un database denominato AdventureWorksDW, che viene usato per fornire report cronologici e analisi descrittive. Negli ultimi tempi, poiché quel server ha avuto difficoltà a elaborare rapidamente i dati dei report, il team deve garantire che l'accesso ai dati sia limitato.

AdventureWorks vuole anche fare un passo avanti nell'analisi dei dati e iniziare a usare le funzionalità di analisi predittiva. Questa attività attualmente non viene svolta. L'organizzazione riconosce che è possibile creare un motore di raccomandazione o di analisi del testo. Vorrebbero che l'utente li guidasse verso la tecnologia e l'approccio migliori da avere per implementare una soluzione che sia anche resiliente ed efficiente.

Analisi dei social media

Negli ultimi anni, il reparto di marketing dell'organizzazione ha lanciato numerose campagne X in diversi momenti dell'anno. Questo vorrebbe misurare l'effetto del proprio lavoro tenendo traccia degli asset dei social media, ad esempio degli hashtag, durante tali campagne. Vorrebbe avere la possibilità di tenere traccia di qualsiasi hashtag di qualsiasi nome.

Bicicletta connessa

Le biciclette di AdventureWorks possono essere dotate di un innovativo computer incorporato per biciclette. Questo computer offre funzionalità di blocco automatico della bicicletta e lo stato operativo. Le informazioni acquisite da questo computer per bicicletta includono:

  • Modello, numero di serie e proprietario registrato della bicicletta
  • Posizione della bicicletta (longitudine e latitudine)
  • Stato attuale (stazionaria, in movimento)
  • Velocità attuale in chilometri orari
  • Bicicletta bloccata/sbloccata
  • Informazioni sui componenti e sui pezzi delle biciclette (sulle biciclette elettriche)

Le applicazioni del produttore e di terze parti possono accedere alle informazioni da proteggere contenute nel computer della bicicletta. Queste informazioni possono essere usate per l'integrazione in applicazioni per dispositivi mobili, la visualizzazione in tempo reale della posizione e le informazioni di bike sharing. Inoltre, i dati di riepilogo giornalieri possono essere salvati in file flat. Questi dati includono il modello, il numero di serie e il proprietario registrato della bicicletta, un riepilogo dei chilometri totali percorsi al giorno e la velocità media.

Servizi di manutenzione delle biciclette

I proprietari esistenti di biciclette possono acconsentire esplicitamente a ricevere notifiche quando la bicicletta ha bisogno di riparazioni sulla base di:

  • Telemetria dalla bicicletta elettrica in base ai dati dei sensori
  • Informazioni sull'utilizzo della bicicletta provenienti dai computer incorporati della bicicletta in base a chilometraggio/usura medi
  • Questo scenario di manutenzione predittiva è un servizio a cui i proprietari di biciclette possono acconsentire esplicitamente e viene offerto come servizio a pagamento.

Domande

In base al case study seguente, rispondere alle domande seguenti


Verifica delle conoscenze

1.

Quale tipo di configurazione del cluster di HDInsight sarebbe appropriato per soddisfare i requisiti di streaming necessari per lo scenario della bicicletta connessa?

2.

Quale tipo di configurazione del cluster di HDInsight sarebbe appropriato per ospitare l'analisi dei dati eseguita dal data warehouse nell'SQL Server locale?

3.

Quale tipo di configurazione del cluster di HDInsight sarebbe appropriato per eseguire il lavoro di manutenzione predittiva nel servizio di manutenzione delle biciclette?

4.

Per soddisfare tutti gli scenari descritti nelle domande precedenti, quale tipo di archiviazione dei dati deve essere usato per gestire tutti questi carichi di lavoro?