Condividi tramite


Tipi di sql warehouse

Databricks SQL supporta i tipi serverless, pro e classico. Questo articolo descrive le funzionalità disponibili per ogni tipo e confronta le prestazioni e le funzionalità.

Funzionalità delle prestazioni per tipo

Ogni tipo di sql warehouse ha funzionalità di prestazioni diverse. La seguente table mostra le caratteristiche di prestazione supportate da ciascun tipo di magazzino SQL.

Tipo di magazzino Motore Photon I/O predittivo Gestione del carico di lavoro intelligente
Senza server X X X
Pro X X
Classico X

La seguente list descrive ciascuna caratteristica delle prestazioni:

  • Photon: motore di query vettorializzato integrato in Databricks. Rende le chiamate API SQL e DataFrame esistenti più veloci e riduce il costo totale per ogni carico di lavoro.

  • I/O predittivo: una suite di funzionalità per velocizzare le operazioni di scansione selettiva nelle query SQL. L'I/O predittivo può offrire un'ampia gamma di aumenti di velocità.

  • IWM (Intelligent Workload Management): set di funzionalità che migliorano la capacità di Databricks SQL Serverless di elaborare un numero elevato di query rapidamente ed economicamente. Usando le tecniche di previsione e gestione dinamica basate sull'intelligenza artificiale, IWM funziona per verificare che i carichi di lavoro abbiano rapidamente la giusta quantità di risorse. La differenza principale consiste nelle funzionalità di intelligenza artificiale in Databricks SQL per rispondere in modo dinamico alle richieste del carico di lavoro anziché usare soglie statiche.

    Nota

    Per i prezzi per ogni tipo di warehouse e un confronto dettagliato delle funzionalità, vedere Databricks SQL. Per informazioni sulle funzionalità più recenti di Databricks SQL, vedere note di rilascio di Databricks SQL.

Differenze di prestazioni tra i tipi di SQL Warehouse

Ogni tipo di sql warehouse presenta caratteristiche di prestazioni diverse.

Serverless SQL Warehouses

Usando l'architettura serverless di Azure Databricks , sql warehouse serverless supporta tutte le funzionalità di prestazioni di Databricks SQL. Con un magazzino SQL senza server e le sue funzionalità di performance, si è get:

  • Tempo di avvio rapido (in genere compreso tra 2 e 6 secondi).
  • Scalabilità rapida per acquisire più calcolo quando necessario per mantenere bassa latenza.
  • L'ammissione di query è più vicina alla limitazione dell'hardware rispetto alla macchina virtuale.
  • Ridimensionamento rapido per ridurre al minimo i costi quando la domanda è bassa, offrendo prestazioni coerenti con costi e risorse ottimizzati.

Scegli un magazzino SQL serverless per ottenere le migliori prestazioni di avvio, l'I/O più efficiente, una gestione più intelligente delle richieste di query che variano notevolmente nel tempo e una rapida scalabilità automatica quando si verifica l'accodamento delle query. Consulta la scalabilità automatica serverless e l'accodamento delle query.

Un serverless SQL Warehouse offre prestazioni elevate con questi tipi di carichi di lavoro:

  • ETL
  • Intelligenza aziendale
  • Analisi esplorativa

Importante

I warehouse SQL non supportano il pass-through delle credenziali . Databricks consiglia di usare unity Catalog per la governance dei dati. Vedi Che cos'è Unity Catalog?.

Pro SQL Magazzini

Un Pro SQL Warehouse supporta Photon e Predictive IO, ma non supporta l'Intelligent Workload Management. Con un SQL Warehouse pro (a differenza di un SQL Warehouse serverless), il livello di calcolo esiste nel tuo account di sottoscrizione di Azure anziché nel tuo account di Azure Databricks. Senza Intelligent Workload Management, i magazzini sono meno reattivi alla domanda di query che varia notevolmente nel tempo e non possono essere ridimensionati rapidamente come un magazzino SQL senza server. L'avvio di un magazzino SQL professionale richiede diversi minuti (in genere circa 4 minuti) e si espande e si riduce con meno reattività rispetto a un magazzino SQL serverless. Vedere Accodamento e scalabilità automatica per i data warehouse SQL classici e pro.

Utilizzare un SQL Warehouse professionale quando:

  • I magazzini SQL serverless non sono disponibili in una regione.
  • Hai definito una rete personalizzata e desideri connetterti ai database nella tua rete nel cloud o on-premise per la federazione o un'architettura di tipo ibrido. Ad esempio, usare un pro SQL Warehouse se si vogliono inserire altri servizi nella rete, ad esempio un bus di eventi o database, oppure si vuole connettere la rete alla rete locale.

Sql Warehouse classici

Un'istanza classica di SQL Warehouse supporta Photon, ma non supporta I/O predittivi o la gestione intelligente dei carichi di lavoro. Con un sql warehouse classico (a differenza di un serverless SQL Warehouse), il livello di calcolo esiste nell'account di sottoscrizione di Azure anziché nell'account Azure Databricks. Senza supporto per I/O predittivo o gestione intelligente del carico di lavoro, un magazzino dati SQL classico offre solo prestazioni di livello base e prestazioni inferiori rispetto a un magazzino dati serverless o un magazzino dati SQL pro. L'avvio di un SQL Warehouse classico richiede anche diversi minuti (in genere circa 4 minuti) e scala su e giù con meno reattività rispetto a un SQL Warehouse serverless. Consultare Messa in coda e scalabilità automatica per i data warehouse SQL classici e pro.

Usare un SQL Warehouse classico per eseguire query interattive per l'esplorazione dei dati con prestazioni di base e le caratteristiche SQL di Databricks.

Nota

Per informazioni sul dimensionamento di SQL Warehouse e sulla relativa scalabilità in risposta all'accodamento delle query, vedere Accodamento e scalabilità automatica per i data warehouse SQL pro e classici.

Quali sono le impostazioni predefinite per il tipo di magazzino?

Per le aree di lavoro nelle regioni che supportano i warehouse SQL serverless e soddisfano i requisiti :

  • Usando l'interfaccia utente, il tipo di data warehouse SQL predefinito è di tipo serverless.
  • Quando si utilizza l'API di SQL Warehouses con le impostazioni predefinite parameters, il tipo di warehouse SQL assegnato è quello classico. Per usare serverless, set il parametro enable_serverless_compute per true e warehouse_type per pro. Se questa area di lavoro usa l'API SQL warehouses per creare un warehouse tra il 1° novembre 2022 e il 19 maggio 2023, e soddisfa i requisiti per i SQL warehouses serverless, l'impostazione predefinita rimane set a true. Per evitare ambiguità, soprattutto per le organizzazioni con molte aree di lavoro, Databricks consiglia di impostare sempre questo campo.
  • Se l’area di lavoro utilizza un metastore Hive esterno legacy , gli archivi SQL serverless non sono supportati. Il tipo predefinito di SQL warehouse è lo stesso come se il calcolo serverless fosse disattivato, ovvero "pro" nell'interfaccia utente e "classico" quando si utilizza l'API. Per ulteriori informazioni su Unity Catalog o altre opzioni, contattare anche il team di Azure Databricks.

Per le aree di lavoro che non supportano i warehouse SQL serverless:

  • Usando l'UI, il tipo di SQL warehouse predefinito è pro.
  • L'API SQL Warehouses, quando utilizzata con l'impostazione predefinita parameters, imposta il tipo di warehouse SQL su classico.