Eseguire script U-SQL nel computer locale
Importante
Azure Data Lake Analytics è stato ritirato il 29 febbraio 2024. Per altre informazioni, vedere questo annuncio.
Per l'analisi dei dati, l'organizzazione può usare Azure Synapse Analytics o Microsoft Fabric.
Quando si sviluppano script U-SQL, è possibile risparmiare tempo e spese eseguendo gli script in locale. Azure Data Lake Tools per Visual Studio supporta l'esecuzione di script U-SQL nel computer locale.
Concetti di base per le esecuzioni locali
Il grafico seguente mostra i componenti per l'esecuzione locale e il mapping di questi componenti all'esecuzione cloud.
Componente | Esecuzione locale | Esecuzione nel cloud |
---|---|---|
Immagazzinamento | Cartella radice dati locale | Account predefinito di Azure Data Lake Store |
Calcolo | Motore di esecuzione locale U-SQL | Servizio Azure Data Lake Analytics |
Ambiente di esecuzione | Directory di lavoro nel computer locale | Cluster di Azure Data Lake Analytics |
Le sezioni seguenti forniscono altre informazioni sui componenti di esecuzione locali.
Cartelle principali dei dati locali
Una cartella radice dati locale è un archivio locale per l'account di calcolo locale. Qualsiasi cartella nel file system locale nel computer locale può essere una cartella radice dei dati locale. Equivale all'account predefinito di Azure Data Lake Store di un account Data Lake Analytics. Il passaggio a una cartella radice dei dati diversa equivale al passaggio a un account di archivio predefinito diverso.
La cartella radice dei dati viene usata come segue:
- Memorizza i metadati. Esempi sono database, tabelle, funzioni con valori di tabella e assembly.
- Cercare i percorsi di input e output definiti come percorsi relativi negli script U-SQL. Usando percorsi relativi, è più facile distribuire gli script U-SQL in Azure.
Motori di esecuzione locali U-SQL
Un motore di esecuzione locale U-SQL è un account di calcolo locale per i processi U-SQL. Gli utenti possono eseguire processi U-SQL in locale tramite Azure Data Lake Tools per Visual Studio. Le esecuzioni locali sono supportate anche tramite la riga di comando e le interfacce di programmazione di Azure Data Lake U-SQL SDK. Altre informazioni su Azure Data Lake U-SQL SDK.
Cartelle di lavoro
Quando si esegue uno script U-SQL, è necessaria una cartella della directory di lavoro per memorizzare nella cache i risultati della compilazione, eseguire i log ed eseguire altre funzioni. In Azure Data Lake Tools per Visual Studio la directory di lavoro è la directory di lavoro del progetto U-SQL. Si trova sotto <U-SQL project root path>/bin/debug>
. La directory di lavoro viene ripulita ogni volta che viene attivata una nuova esecuzione.
Esecuzioni locali in Microsoft Visual Studio
Azure Data Lake Tools per Visual Studio dispone di un motore di esecuzione locale predefinito. Gli strumenti mettono a disposizione il motore come account di calcolo locale. Per eseguire uno script U-SQL in locale, selezionare l'account Local-machine o Local-project nel menu a discesa margine dell'editor dello script. Selezionare quindi Invia.
Esecuzioni locali con un account macchina locale
Un account Local-machine è un account di calcolo locale condiviso con una singola cartella radice dati locale utilizzata come account di archiviazione locale. Per impostazione predefinita, la cartella radice dei dati si trova in C:\Users<username>\AppData\Local\USQLDataRoot. È anche configurabile tramite Strumenti>Opzioni e impostazionidi Data Lake>.
Per un'esecuzione locale è necessario un progetto U-SQL. La directory di lavoro del progetto U-SQL è utilizzata come directory di lavoro per l'esecuzione locale di U-SQL. I risultati della compilazione, i log di esecuzione e altri file correlati all'esecuzione del processo vengono generati e archiviati nella cartella della directory di lavoro durante l'esecuzione locale. Ogni volta che si esegue nuovamente lo script, tutti i file nella directory di lavoro vengono puliti e rigenerati.
Esecuzioni su Local con un account Local-project
Un account di progetto locale è un account di calcolo locale isolato dal progetto per ogni progetto con una cartella radice dei dati locale isolata. Ogni progetto U-SQL attivo aperto in Esplora soluzioni dentro Visual Studio ha un account corrispondente (Local-project: <project name>)
. Gli account sono elencati sia in Esplora server in Visual Studio che nel margine dell'editor di script U-SQL.
L'account Local-project fornisce un ambiente di sviluppo pulito e isolato. Un account computer locale ha una cartella radice dei dati locale condivisa che archivia i metadati e i dati di input e output per tutti i processi locali. Un account local-project crea tuttavia una cartella radice dei dati locale temporanea in una directory di lavoro del progetto U-SQL ogni volta che viene eseguito uno script U-SQL. Questa cartella radice dei dati temporanea viene pulita quando si verifica una ricompilazione o una riesecuzione.
Un progetto U-SQL gestisce l'ambiente di esecuzione locale isolato tramite un riferimento e una proprietà del progetto. È possibile configurare le origini dati di input per gli script U-SQL sia nel progetto che negli ambienti di database a cui si fa riferimento.
Gestire l'origine dei dati di input per un account Local-project
Un progetto U-SQL crea una cartella radice dei dati locale e configura i dati per un account local-project . Una cartella radice dei dati temporanea viene pulita e ricreata nella directory di lavoro del progetto U-SQL ogni volta che si verifica una ricompilazione e un'esecuzione locale. Tutte le origini dati configurate dal progetto U-SQL vengono copiate in questa cartella radice dati locale temporanea prima dell'esecuzione del processo locale.
È possibile configurare la cartella radice delle origini dati. Fare clic con il pulsante destro del mouse su progetto U-SQL>Proprietà>Origine dati di test. Quando si esegue uno script U-SQL in un account local-project , tutti i file e le sottocartelle nella cartella Origine dati di test vengono copiati nella cartella radice dei dati locale temporanea. I file nelle sottocartelle sono inclusi. Dopo l'esecuzione di un processo locale, i risultati di output sono disponibili anche nella cartella radice dei dati locale temporanea nella directory di lavoro del progetto. Tutto questo output viene eliminato e ripulito quando il progetto viene ricompilato e svuotato.
Gestire un ambiente di database a cui si fa riferimento per un account local-project
Se una query U-SQL usa o esegue query con oggetti di database U-SQL, è necessario rendere gli ambienti di database pronti localmente prima di eseguire lo script U-SQL in locale. Per un account local-project , le dipendenze del database U-SQL possono essere gestite dai riferimenti al progetto U-SQL. È possibile aggiungere riferimenti al progetto di database U-SQL al progetto U-SQL. Prima di eseguire script U-SQL in un account local-project , tutti i database a cui si fa riferimento vengono distribuiti nella cartella radice dei dati locale temporanea. E per ogni esecuzione, la cartella radice dei dati temporanei viene pulita, creando un nuovo ambiente isolato.
Vedere questo articolo correlato:
- Informazioni su come gestire definizioni e riferimenti di database U-SQL nei progetti di database U-SQL.
Differenza tra account local-machine e local-project
Un account computer locale simula un account di Azure Data Lake Analytics nei computer locali degli utenti. Condivide la stessa esperienza con un account Di Azure Data Lake Analytics. Un account Local-project fornisce un ambiente di sviluppo locale facile da usare. Questo ambiente consente agli utenti di distribuire i riferimenti al database e i dati di input prima di eseguire script in locale. Un account computer locale fornisce un ambiente permanente condiviso accessibile tramite tutti i progetti. Un account local-project fornisce un ambiente di sviluppo isolato per ogni progetto. Viene aggiornato per ogni esecuzione. Un account local-project offre un'esperienza di sviluppo più rapida applicando rapidamente nuove modifiche.
Altre differenze tra gli account Local-machine e Local-project sono illustrate nella tabella seguente:
Angolo di differenza | Macchina locale | Progetto locale |
---|---|---|
Accesso locale | È possibile accedere a tutti i progetti. | Solo il progetto corrispondente può accedere a questo account. |
Cartella radice dati locale | Cartella locale permanente. Configurato tramite Strumenti>Opzioni e impostazionidi Data Lake>. | Cartella temporanea creata per ogni esecuzione locale nella directory di lavoro del progetto U-SQL. La cartella viene pulita quando si verifica una ricompilazione o una nuova esecuzione. |
Dati di input per uno script U-SQL | Percorso relativo nella cartella radice dei dati locale permanente. | Impostare attraverso la proprietà del progetto U-SQL>Origine dati di test. Tutti i file e le sottocartelle vengono copiati nella cartella radice dei dati temporanea prima di un'esecuzione locale. |
Dati di output per uno script U-SQL | Percorso relativo nella cartella radice dei dati locali permanenti. | Invia l'output nella cartella radice dei dati temporanea. I risultati vengono puliti quando si verifica una ricompilazione o una nuova esecuzione. |
Distribuzione del database a cui si fa riferimento | I database a cui si fa riferimento non vengono distribuiti automaticamente quando vengono eseguiti su un account computer locale . È lo stesso per l'invio a un account di Azure Data Lake Analytics. | I database a cui si fa riferimento vengono distribuiti automaticamente nell'account local-project prima di un'esecuzione locale. Tutti gli ambienti di database vengono puliti e ridistribuiti quando si verifica una ricompilazione o una nuova esecuzione. |
Esecuzione locale con U-SQL SDK
È possibile eseguire script U-SQL in locale in Visual Studio e usare anche Azure Data Lake U-SQL SDK per eseguire script U-SQL in locale con interfacce della riga di comando e di programmazione. Tramite queste interfacce, è possibile automatizzare le esecuzioni e i test locali di U-SQL.
Altre informazioni su Azure Data Lake U-SQL SDK.