maggio 2018
Le versioni vengono distribuite gradualmente. L'account Azure Databricks può non essere aggiornato fino a una settimana dopo la data di rilascio iniziale.
Regolamento Generale sulla Protezione dei Dati (GDPR)
24 maggio 2018: Versione 2.72
Per soddisfare i requisiti del Regolamento generale sulla protezione dei dati dell'Unione europea (GDPR), che entra in vigore il 25 maggio 2018, abbiamo apportato una serie di modifiche alla piattaforma Azure Databricks per offrire un maggiore controllo della conservazione dei dati sia a livello di account che di utente. Gli aggiornamenti includono:
- Eliminazione del cluster: eliminare definitivamente una configurazione del cluster usando l'interfaccia utente o l'API Clusters. Vedere Eliminare un calcolo.
- Eliminazione dell'area di lavoro (rilasciata nella versione 2.71): eliminare definitivamente gli oggetti dell'area di lavoro, ad esempio interi notebook, singole celle del notebook, singoli commenti del notebook e cronologia delle revisioni del notebook. Vedere Ripulire l'archiviazione dell'area di lavoro.
- Eliminazione della cronologia delle revisioni del notebook:
- Eliminare definitivamente la cronologia delle revisioni di tutti i notebook in un'area di lavoro per un intervallo di tempo definito. Vedere Ripulire l'archiviazione dell'area di lavoro.
- Eliminare definitivamente una singola revisione del notebook o l'intera cronologia delle revisioni di un notebook. Vedere Cronologia delle versioni.
Per informazioni sull'eliminazione del servizio Azure Databricks o sull'annullamento dell'account Azure, vedere Gestire la sottoscrizione.
Gli utenti di Azure Databricks devono appartenere al tenant di Microsoft Entra ID
24 maggio 2018: Versione 2.72
Gli utenti possono ora accedere ad Azure Databricks solo se appartengono al tenant Microsoft Entra ID (in precedenza Azure Active Directory) dell'area di lavoro di Azure Databricks. Se si dispone di utenti che non appartengono al tenant di Microsoft Entra ID, è possibile aggiungerli come utenti standard o guest.
HorovodEstimator
29 maggio 2018: Versione 2.72
Aggiunta della documentazione e di un notebook per HorovodEstimator, un'API estimator di tipo MLlib che sfrutta il framework Horovod di Uber. HorovodEstimator facilita il training distribuito e multi-GPU di reti neurali profonde nei dataframe Spark, semplificando l'integrazione di ETL in Spark con il training del modello in TensorFlow.
Esportazione del modello di ML MLeap
24 maggio 2018: Versione 2.72
Aggiunta di documentazione e notebook sull'uso di MLeap in Azure Databricks. MLeap consente di distribuire pipeline di Machine Learning da Apache Spark e scikit-learn in un formato portatile e un motore di esecuzione. Vedere Esportazione del modello MLeap ML.
Ulteriori tipi di cluster GPU
24 maggio 2018: Versione 2.72
Oltre ai tipi di istanza nc di Azure (NC12 e NC24) aggiunti nella versione 2.71, è ora supportata la serie di tipi di istanza NCv3 (NC6s_v3, NC12s_v3 e NC24s_v3) nei cluster Azure Databricks. Le istanze NC e NCv3 forniscono GPU per l'elaborazione delle immagini, l'analisi del testo e altre attività di Machine Learning e Deep Learning che sono impegnative e richiedono prestazioni superiori a livello di calcolo.
Vedere Calcolo abilitato per GPU.
Nascondere e mostrare le celle del notebook
24 maggio 2018: Versione 2.72
I nuovi indicatori e la messaggistica semplificano la visualizzazione del contenuto delle celle del notebook dopo che sono stati nascosti. Vedere Nascondere e visualizzare il contenuto della cella.
Ricerca nel sito della documentazione
22 maggio 2018
La ricerca del sito doc è stata sostituita con uno strumento di ricerca migliore. Nelle prossime settimane verranno visualizzati altri miglioramenti per la ricerca.
Nota
La ricerca potrebbe risultare interrotta se si prova subito dopo la distribuzione della nuova ricerca. È sufficiente cancellare la cache del browser per visualizzare la nuova esperienza di ricerca.
Databricks Runtime 4.1 ML per Machine Learning (beta)
17 maggio 2018
Databricks Runtime ML (Beta) offre un ambiente pronto per l'apprendimento automatico e l'analisi scientifica dei dati. Contiene più librerie comuni, tra cui TensorFlow, Keras e XGBoost.
Databricks Runtime ML consente di avviare un cluster Databricks con tutte le librerie necessarie per il training di TensorFlow distribuito. Garantisce la compatibilità delle librerie incluse nel cluster (tra TensorFlow e CUDA/cuDNN, ad esempio) e riduce notevolmente il tempo di avvio del cluster rispetto all'uso di script init.
Nota
Databricks Runtime 4.1 ML è disponibile solo nello SKU Premium.
Vedere le note sulla versione complete per Databricks Runtime 4.1 ML (EoS).
Databricks Delta
17 maggio 2018
Databricks Delta è ora disponibile in anteprima privata per gli utenti di Azure Databricks. Contattare il proprio account manager o iscriversi all'indirizzo https://databricks.com/product/databricks-delta. Questa versione rappresenta una versione candidata in previsione della prossima versione disponibile a livello generale.
Per altre informazioni, vedere Databricks Runtime 4.1 (EoS) e Che cos'è Delta Lake?.
Supporto display() per i tipi di dati image
17 maggio 2018
In Databricks Runtime 4.1 ora display()
esegue il rendering di colonne contenenti tipi di dati immagine come HTML avanzato.
Vedere Visualizzazioni nei notebook di Databricks.
Tipi di cluster GPU
15 maggio 2018: Versione 2.71
Microsoft è lieta di annunciare il supporto per i tipi di istanze nc di Azure (NC12 e NC24) nei cluster Di Azure Databricks. Le istanze nc forniscono GPU per l'elaborazione delle immagini, l'analisi del testo e altre attività di Apprendimento automatico e Deep Learning che sono complesse dal calcolo e richiedono prestazioni superiori.
Azure Databricks fornisce anche driver e librerie NVIDIA preinstallati configurati per LE GPU, oltre a materiale per iniziare a usare diverse librerie di Deep Learning più diffuse.
Vedere anche:
Disponibilità a livello generale della gestione dei segreti
15 maggio 2018: Versione 2.71
La gestione dei segreti, che era stata in anteprima privata, è ora disponibile a livello generale. Offre strumenti avanzati per la gestione delle credenziali necessarie per l'autenticazione in origini dati esterne. Anziché digitare le credenziali direttamente in un notebook, usare la gestione dei segreti di Databricks per archiviare e fare riferimento alle credenziali nei notebook e nei processi. Per gestire i segreti, è possibile usare l'interfaccia della riga di comando dei segreti (legacy) per accedere all'API Segreti.
Nota
La gestione dei segreti richiede Databricks Runtime 4.0 o versione successiva e l'interfaccia della riga di comando di Databricks 0.7.1 o versione successiva.
Vedere Gestione dei segreti.
Modifiche degli endpoint dell’API segreti e dei comandi dell’interfaccia della riga di comando
15 maggio 2018: Versione 2.71
Sono state apportate le modifiche seguenti agli endpoint dell'API Segreti:
- Per tutti gli endpoint, il percorso radice è stato modificato da
/secret
a/secrets
. - Per l'endpoint dei segreti, l'oggetto
/secret/secrets
è stato compresso in/secrets/
. - Il metodo
write
è stato modificato input
.
L'interfaccia della riga di comando di Databricks 0.7.1 include aggiornamenti ai comandi segreti per allinearsi a questi endpoint API aggiornati.
Vedere Api Segreti e Gestione dei segreti.
Aggiunta di un cluster
15 maggio 2018: Versione 2.71
È ora possibile aggiungere un cluster all'elenco Cluster. In questo modo è possibile mantenere la configurazione dei cluster terminati oltre 30 giorni prima.
Inoltre, la pagina Cluster visualizza ora tutti i cluster che sono stati terminati entro 30 giorni (maggiorato di 7 giorni).
Vedere Associare un ambiente di calcolo.
Avvio automatico del cluster
15 maggio 2018: Versione 2.71
Prima di questa versione, i processi pianificati per l'esecuzione nei cluster Terminated
non sono riusciti. Per i cluster creati in Azure Databricks versione 2.71 e successive, i comandi di un'interfaccia JDBC/ODBC o un'esecuzione di processo assegnata a un cluster terminato esistente riavviano automaticamente il cluster. Vedere Connessione JDBC e Configurare e modificare processi di Databricks.
L'avvio automatico consente di configurare i cluster in modo da terminare automaticamente, senza richiedere l'intervento manuale per riavviare i cluster per i processi pianificati. Inoltre, è possibile pianificare l'inizializzazione del cluster pianificando un processo che riavvia i cluster terminati in un determinato momento.
Il controllo di accesso del cluster viene applicato e le autorizzazioni del proprietario del processo vengono controllate come di consueto.
Pulizia dell’area di lavoro
15 maggio 2018: Versione 2.71
Nell'ambito del nostro impegno continuo per rispettare il Regolamento generale sulla protezione dei dati dell'Unione europea (GDPR), è stata aggiunta la possibilità di ripulire gli oggetti dell'area di lavoro, ad esempio interi notebook, singole celle di notebook, commenti singoli notebook e cronologia delle revisioni dei notebook. Nelle prossime settimane verranno rilasciate altre funzionalità e documentazione per supportare la conformità al GDPR.
Vedere Ripulire l'archiviazione dell'area di lavoro.
Interfaccia della riga di comando di Databricks 0.7.1
10 maggio 2018
L'interfaccia della riga di comando di Databricks 0.7.1 include aggiornamenti ai comandi segreti per allinearsi agli endpoint API aggiornati.
Vedere l'interfaccia della riga di comando di Databricks (legacy) e la gestione dei segreti.