Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Saiba como usar o Visual Studio Code (VS Code) para escrever código Python, R e C# com U-SQL e submeter jobs para o serviço Azure Data Lake. Para obter mais informações sobre o Azure Data Lake Tools for VS Code, consulte Usar o Azure Data Lake Tools for Visual Studio Code.
Antes de escrever código personalizado code-behind, você precisa abrir uma pasta ou um espaço de trabalho no VS Code.
Pré-requisitos para Python e R
Registre assemblies de extensões Python e R para sua conta ADL.
Abra a sua conta no portal.
- Selecione Visão geral.
- Selecione Script de exemplo.
Selecione Mais.
Selecione Instalar extensões U-SQL.
A mensagem de confirmação é exibida após a instalação das extensões U-SQL.
Observação
Para melhores experiências no serviço de linguagem Python e R, instale o VSCode Python e a extensão R.
Desenvolver arquivo Python
Selecione o Novo Arquivo em seu espaço de trabalho.
Escreva seu código em U-SQL. A seguir está um exemplo de código.
REFERENCE ASSEMBLY [ExtPython]; @t = SELECT * FROM (VALUES ("D1","T1","A1","@foo Hello World @bar"), ("D2","T2","A2","@baz Hello World @beer") ) AS D( date, time, author, tweet ); @m = REDUCE @t ON date PRODUCE date string, mentions string USING new Extension.Python.Reducer("pythonSample.usql.py", pyVersion : "3.5.1"); OUTPUT @m TO "/tweetmentions.csv" USING Outputters.Csv();
Clique com o botão direito mouse em um arquivo de script e selecione ADL: Generate Python Code Behind File.
O ficheiro xxx.usql.py é gerado na sua pasta de trabalho. Escreva seu código no arquivo Python. A seguir está um exemplo de código.
def get_mentions(tweet): return ';'.join( ( w[1:] for w in tweet.split() if w[0]=='@' ) ) def usqlml_main(df): del df['time'] del df['author'] df['mentions'] = df.tweet.apply(get_mentions) del df['tweet'] return df
Clique com o botão direito do mouse em arquivo USQL, você pode selecionar Compilar Script ou Enviar Trabalho para o trabalho em execução.
Desenvolver arquivo R
Selecione o Novo Arquivo em seu espaço de trabalho.
Escreva seu código no arquivo U-SQL. A seguir está um exemplo de código.
DEPLOY RESOURCE @"/usqlext/samples/R/my_model_LM_Iris.rda"; DECLARE @IrisData string = @"/usqlext/samples/R/iris.csv"; DECLARE @OutputFilePredictions string = @"/my/R/Output/LMPredictionsIris.txt"; DECLARE @PartitionCount int = 10; @InputData = EXTRACT SepalLength double, SepalWidth double, PetalLength double, PetalWidth double, Species string FROM @IrisData USING Extractors.Csv(); @ExtendedData = SELECT Extension.R.RandomNumberGenerator.GetRandomNumber(@PartitionCount) AS Par, SepalLength, SepalWidth, PetalLength, PetalWidth FROM @InputData; // Predict Species @RScriptOutput = REDUCE @ExtendedData ON Par PRODUCE Par, fit double, lwr double, upr double READONLY Par USING new Extension.R.Reducer(scriptFile : "RClusterRun.usql.R", rReturnType : "dataframe", stringsAsFactors : false); OUTPUT @RScriptOutput TO @OutputFilePredictions USING Outputters.Tsv();
Clique com botão direito do rato no ficheiro USQL e, em seguida, selecione ADL: Generate R Code Behind File.
O ficheiro de xxx.usql.r é gerado na sua pasta de trabalho. Escreva seu código no arquivo R. A seguir está um exemplo de código.
load("my_model_LM_Iris.rda") outputToUSQL=data.frame(predict(lm.fit, inputFromUSQL, interval="confidence"))
Clique com o botão direito do rato no ficheiro USQL, pode selecionar Compilar Script ou Enviar Trabalho para executar o trabalho.
Desenvolver arquivo C#
Um arquivo code-behind é um arquivo C# associado a um único script U-SQL. Você pode definir um script dedicado a UDO, UDA, UDT e UDF no arquivo code-behind. O UDO, UDA, UDT e UDF podem ser usados diretamente no script sem registrar o assembly primeiro. O arquivo de código associado é colocado na mesma pasta que o seu ficheiro de script U-SQL correspondente. Se o script for chamado xxx.usql, o código por trás será nomeado como xxx.usql.cs. Se você excluir manualmente o arquivo code-behind, o recurso code-behind será desabilitado para seu script U-SQL associado. Para obter mais informações sobre como escrever código de cliente para script U-SQL, consulte Writing and Using Custom Code in U-SQL: User-Defined Functions.
Selecione o Novo Arquivo em seu espaço de trabalho.
Escreva seu código no arquivo U-SQL. A seguir está um exemplo de código.
@a = EXTRACT Iid int, Starts DateTime, Region string, Query string, DwellTime int, Results string, ClickedUrls string FROM @"/Samples/Data/SearchLog.tsv" USING Extractors.Tsv(); @d = SELECT DISTINCT Region FROM @a; @d1 = PROCESS @d PRODUCE Region string, Mkt string USING new USQLApplication_codebehind.MyProcessor(); OUTPUT @d1 TO @"/output/SearchLogtest.txt" USING Outputters.Tsv();
Clique com botão direito do mouse em arquivo USQL e selecione ADL: Generate CS Code Behind File.
O ficheiro xxx.usql.cs é gerado na sua pasta de trabalho. Escreva seu código no arquivo CS. A seguir está um exemplo de código.
namespace USQLApplication_codebehind { [SqlUserDefinedProcessor] public class MyProcessor : IProcessor { public override IRow Process(IRow input, IUpdatableRow output) { output.Set(0, input.Get<string>(0)); output.Set(1, input.Get<string>(0)); return output.AsReadOnly(); } } }
Clique com o botão direito do mouse no arquivo USQL, você pode selecionar Compilar Script ou Enviar Trabalho para executar o trabalho.
Próximos passos
- Usar as Ferramentas do Azure Data Lake para o Visual Studio Code
- Execução Local do U-SQL e Depuração Local com Visual Studio Code
- Introdução à Análise Data Lake usando o PowerShell
- Introdução à Análise Data Lake usando o portal do Azure
- Usar ferramentas Data Lake para Visual Studio para desenvolver aplicativos U-SQL
- Usar o catálogo do Data Lake Analytics (U-SQL)