Luglio 2020

Articolo
01/28/2025

Queste funzionalità e i miglioramenti della piattaforma Azure Databricks sono stati rilasciati a luglio 2020.

Nota

Le versioni vengono gestite in staging. L'account Azure Databricks potrebbe non essere aggiornato fino a una settimana dopo la data di rilascio iniziale.

Terminale Web (anteprima pubblica)

29 luglio-4 agosto 2020: versione 3.25

Il terminale Web offre un modo comodo e altamente interattivo per gli utenti con autorizzazione CAN ATTACH TO su un cluster per eseguire comandi di shell, compresi editor come Vim o Emacs. Esempi di utilizzo del terminale web sono il monitoraggio dell'utilizzo delle risorse e l'installazione di pacchetti Linux.

Per informazioni dettagliate, consultare Eseguire i comandi della shell nel terminale Web di Azure Databricks.

Nuovo framework globale di script init più sicuro (anteprima pubblica)

29 luglio - 4 agosto 2020: versione 3.25

Il nuovo framework per gli script di avvio globale apporta miglioramenti significativi rispetto agli script di avvio globale di legacy:

Gli script di avvio sono più sicuri e richiedono autorizzazioni di amministratore per creare, visualizzare ed eliminare.
Vengono registrati errori di avvio correlati allo script.
È possibile impostare l'ordine di esecuzione di più script init.
Gli script di avvio possono fare riferimento alle variabili di ambiente correlate al cluster.
Gli script di avvio possono essere creati e gestiti usando la pagina delle impostazioni di amministrazione o la nuova API REST Script Init globali.

Databricks consiglia di eseguire la migrazione di script init globali di legacy esistenti al nuovo framework per sfruttare questi miglioramenti.

Per informazioni dettagliate, vedere Script init globali.

Elenchi di accesso IP ora in disponibilità generale

29 luglio - 4 agosto 2020: versione 3.25

L'API Elenco di Accesso IP è ora generalmente disponibile.

La versione ga include una modifica, ovvero la ridenominazione dei valori list_type:

WHITELIST a ALLOW
BLACKLIST a BLOCK

Usare l'API elenco di accesso IP per configurare le aree di lavoro di Azure Databricks in modo che gli utenti si connettano al servizio solo tramite reti aziendali esistenti con un perimetro sicuro. Gli amministratori di Azure Databricks possono usare l'API Elenco di accesso IP per definire un set di indirizzi IP approvati, inclusi gli elenchi di indirizzi consentiti e bloccati. Tutti gli accessi in entrata all'applicazione web e alle API REST richiedono che l'utente si connetta da un indirizzo IP autorizzato, garantendo che gli spazi di lavoro non siano accessibili da una rete pubblica come un bar o un aeroporto, a meno che gli utenti non utilizzino una VPN.

Questa funzionalità richiede il Piano Premium.

Per ulteriori informazioni, consultare Configurazione degli elenchi di accesso IP per le aree di lavoro.

Nuova finestra di dialogo di caricamento file

29 luglio - 4 agosto 2020: versione 3.25

Adesso è possibile caricare file di dati tabulari di piccole dimensioni (ad esempio i volumi condivisi cluster) e accedervi da un notebook selezionando Aggiungi dati dal menuFile del notebook. Il codice generato illustra come caricare i dati in Pandas o dataframe. Gli amministratori possono disattivare questa funzione nella scheda Avanzate della console amministrativa.

Per altre informazioni, consultare Esplorare i file in DBFS.

Miglioramenti apportati a filtro e ordinamento dell’API SCIM

29 luglio - 4 agosto 2020: versione 3.25

L'API SCIM adesso include questi miglioramenti per il filtro e l'ordinamento:

Gli utenti amministratori possono filtrare gli utenti in base all'attributo active.
Tutti gli utenti possono ordinare i risultati usando i parametri di query sortBy e sortOrder. L'opzione predefinita è l'ordinamento per ID.

Aggiunte aree di Azure per enti pubblici

25 luglio 2020

Azure Databricks di recente è diventato disponibile nelle aree US Gov Arizona e US Gov Virginia per le entità governative degli Stati Uniti e i relativi partner.

Databricks Runtime 7.1 in disponibilità generale

21 luglio 2020

Databricks Runtime 7.1 offre molte funzionalità e miglioramenti aggiuntivi rispetto a Databricks Runtime 7.0, tra cui:

Connettore Google BigQuery
Comandi %pip per gestire le librerie Python installate in una sessione di notebook
Koalas installato
Molti miglioramenti di Delta Lake, tra cui:
- Impostazione dei metadati di commit definiti dall'utente
- Recupero della versione dell'ultimo commit scritto dall'oggetto corrente SparkSession
- Conversione di tabelle Parquet create da Structured Streaming tramite il log delle transazioni _spark_metadata
- Miglioramenti delle prestazioni MERGE INTO

Per informazioni dettagliate, consultare le note sulla versione complete per Databricks Runtime 7.1 (EoS).

Databricks Runtime 7.1 ML in disponibilità generale

21 luglio 2020

Databricks Runtime 7.1 per Machine Learning si basa su Databricks Runtime 7.1 e apporta le nuove funzionalità e le modifiche alla libreria riportate di seguito:

Comandi magic pip e conda abilitati per impostazione predefinita
spark-tensorflow-distributor: 0.1.0
pillow 7.0.0 -> 7.1.0
pytorch 1.5.0 -> 1.5.1
torchvision 0.6.0 -> 0.6.1
horovod 0.19.1 -> 0.19.5
mlflow 1.8.0 -> 1.9.1

Per informazioni dettagliate, consultare le note sulla versione complete per Databricks Runtime 7.1 per ML (EoS).

Databricks Runtime 7.1 Genomica in disponibilità generale

21 luglio 2020

Databricks Runtime 7.1 per Genomica si basa su Databricks Runtime 7.1 e apporta le nuove funzionalità riportate di seguito:

Trasformazione LOCO
Funzione di rimodellamento dell'output GloWGR
RNASeq produce allineamenti non accoppiati