Determinare le esigenze operative
Dopo l'identificazione del tipo di dati da archiviare (strutturati, semistrutturati o non strutturati), il passaggio successivo consiste nel determinare come verranno usati i dati. Un rivenditore online, ad esempio, sa che i clienti devono poter accedere rapidamente ai dati dei prodotti e che gli utenti aziendali devono eseguire query analitiche complesse. Durante l'esame di questi requisiti, tenendo conto della classificazione dei dati, si può iniziare a pianificare una soluzione di archiviazione dei dati.
Di seguito si risponderà ad alcune domande per determinare cosa fare con i dati.
Operazioni e latenza
Quali sono le principali operazioni che verranno eseguite su ogni tipo di dati e quali sono i requisiti relativi alle prestazioni per i dati?
Porre queste domande sui dati:
- Verranno eseguite semplici ricerche usando un campo ID?
- È necessario eseguire query sul database per uno o più campi?
- Quante operazioni di creazione, aggiornamento ed eliminazione si prevede che verranno eseguite?
- È necessario eseguire query analitiche complesse?
- Con quale velocità devono essere elaborate queste operazioni?
Le risposte a queste domande aiuteranno a scegliere la soluzione di archiviazione più adatta per i dati.
Operazioni e latenza: valutare i tipi di dati
Tenendo in mente queste domande, ora verranno analizzati i singoli set di dati e discussi i requisiti.
Dati del catalogo prodotti
Per i dati del catalogo prodotti in uno scenario di vendita online, le esigenze del cliente costituiscono la massima priorità. I clienti vogliono eseguire una query nel catalogo prodotti per trovare un articolo o una categoria che hanno in mente. Ad esempio, un cliente potrebbe eseguire una query per visualizzare tutte le scarpe da tennis, quindi le scarpe da tennis in offerta e quindi le scarpe da tennis in offerta di una misura specifica. Le esigenze dei clienti potrebbero richiedere molte operazioni di lettura e i clienti devono avere la possibilità di eseguire query in base a campi specifici.
Quando un cliente inserisce un ordine, l'applicazione deve aggiornare le quantità di prodotto. Le operazioni di aggiornamento devono essere rapide quanto le operazioni di lettura, in modo tale che gli utenti non possano inserire nel carrello un articolo appena esaurito. Questo non solo comporterà un gran numero di operazioni di lettura, ma richiede anche un aumento delle operazioni di scrittura per i dati del catalogo prodotti. Assicurarsi di determinare le priorità di tutti gli utenti del database, non solo di quelli principali.
Foto e video
Le foto e i video visualizzati nelle pagine dei prodotti hanno requisiti diversi. Necessitano di tempi di recupero rapidi in modo che siano visualizzati nel sito contemporaneamente ai dati del catalogo prodotti, ma non è necessario poter eseguire query indipendenti su di essi. È invece possibile fare affidamento sui risultati della query del prodotto e includere l'ID o l'URL del video come proprietà nei dati del prodotto. È necessario recuperare foto e video usando solo i relativi ID.
I clienti non effettueranno aggiornamenti alle foto o ai video esistenti, ma potranno aggiungere nuove foto per le recensioni dei prodotti. Un utente potrebbe ad esempio caricare una foto in cui indossa le nuove scarpe.
I dipendenti possono caricare ed eliminare foto dei prodotti rese disponibili dai fornitori. Non è però necessario che questi aggiornamenti vengano applicati rapidamente come gli altri aggiornamenti dei dati del prodotto.
In sintesi, è possibile eseguire query su foto e video in base all'ID per restituire l'intero file. Tuttavia, le operazioni di creazione e aggiornamento sono meno frequenti e hanno una priorità più bassa.
Dati di business
Per l'analisi dei dati l'azienda usa solo i dati cronologici. I dati originali non vengono aggiornati in base all'analisi, quindi i dati di business sono di sola lettura. Gli utenti non si aspettano che le analisi complesse vengano eseguite istantaneamente, quindi una certa latenza nei risultati è accettabile.
I dati aziendali vengono archiviati in più set di dati. Non tutti gli analisti aziendali devono avere accesso in scrittura a tutti i set di dati, ma tutti gli analisti aziendali possono leggere da tutti i set di dati.