Compartir a través de


New-AzureHDInsightPigJobDefinition

Define un nuevo trabajo de Pig para un servicio de HDInsight.

Nota:

Los cmdlets a los que se hace referencia en esta documentación son para administrar recursos de Azure heredados que usan las API de Azure Service Management (ASM). Este módulo heredado de PowerShell no se recomienda al crear nuevos recursos, ya que ASM está programado para la retirada. Para más información, consulte Retirada de Azure Service Manager.

El módulo Az de PowerShell es el módulo de PowerShell recomendado para administrar recursos de Azure Resource Manager (ARM) con PowerShell.

Sintaxis

New-AzureHDInsightPigJobDefinition
   [-Arguments <String[]>]
   [-File <String>]
   [-Files <String[]>]
   [-Query <String>]
   [-StatusFolder <String>]
   [-Profile <AzureSMProfile>]
   [<CommonParameters>]

Description

Esta versión de HDInsight de Azure PowerShell está en desuso. Estos cmdlets se quitarán el 1 de enero de 2017. Use la versión más reciente de HDInsight de Azure PowerShell.

Para obtener información sobre cómo usar el nuevo HDInsight para crear un clúster, consulte Creación de clústeres basados en Linux en HDInsight mediante Azure PowerShell (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-create-linux-clusters-azure-powershell/). Para obtener información sobre cómo enviar trabajos mediante Azure PowerShell y otros enfoques, consulte Envío de trabajos de Hadoop en HDInsight (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-submit-hadoop-jobs-programmatically/). Para obtener información de referencia sobre HDInsight de Azure PowerShell, consulte Cmdlets de Azure HDInsight.

New-AzureHDInsightPigJobDefinition define un trabajo de Pig para un servicio de Azure HDInsight.

Ejemplos

Ejemplo 1: Definición de un nuevo trabajo de Pig

PS C:\>$0 = '$0';
PS C:\> $QueryString =  "LOGS = LOAD 'wasb:///example/data/sample.log';" + "LEVELS = foreach LOGS generate REGEX_EXTRACT($0, '(TRACE|DEBUG|INFO|WARN|ERROR|FATAL)', 1) as LOGLEVEL;" + "FILTEREDLEVELS = FILTER LEVELS by LOGLEVEL is not null;" + "GROUPEDLEVELS = GROUP FILTEREDLEVELS by LOGLEVEL;" + "FREQUENCIES = foreach GROUPEDLEVELS generate group as LOGLEVEL, COUNT(FILTEREDLEVELS.LOGLEVEL) as COUNT;" + "RESULT = order FREQUENCIES by COUNT desc;" + "DUMP RESULT;"
PS C:\> $PigJobDefinition = New-AzureHDInsightPigJobDefinition -Query $QueryString

El primer comando declara un valor de cadena y, a continuación, almacena en la variable $0.

El segundo comando crea una consulta de trabajo de Pig y, a continuación, la almacena en la variable $QueryString.

El comando final crea una definición de trabajo de Pig que usa la consulta en $QueryString y, a continuación, almacena la definición del trabajo en la variable $PigJobDefinition.

Parámetros

-Arguments

Especifica una matriz de argumentos para un trabajo de Pig. Los argumentos se pasan a cada tarea como argumentos de la línea de comandos.

Tipo:String[]
Alias:Args
Posición:Named
Valor predeterminado:None
Requerido:False
Aceptar entrada de canalización:False
Aceptar caracteres comodín:False

-File

Especifica la ruta de acceso a un archivo que contiene una consulta que se va a ejecutar. Puede usar este parámetro en lugar del parámetro Query .

Tipo:String
Alias:QueryFile
Posición:Named
Valor predeterminado:None
Requerido:False
Aceptar entrada de canalización:False
Aceptar caracteres comodín:False

-Files

Especifica una colección de archivos asociados a un trabajo de Pig.

Tipo:String[]
Posición:Named
Valor predeterminado:None
Requerido:False
Aceptar entrada de canalización:False
Aceptar caracteres comodín:False

-Profile

Especifica el perfil de Azure del que lee este cmdlet. Si no especifica un perfil, este cmdlet lee del perfil predeterminado local.

Tipo:AzureSMProfile
Posición:Named
Valor predeterminado:None
Requerido:False
Aceptar entrada de canalización:False
Aceptar caracteres comodín:False

-Query

Especifica una consulta de trabajo de Pig.

Tipo:String
Alias:QueryText
Posición:Named
Valor predeterminado:None
Requerido:False
Aceptar entrada de canalización:False
Aceptar caracteres comodín:False

-StatusFolder

Especifica la ubicación de la carpeta que contiene salidas estándar y salidas de error para un trabajo, incluido su código de salida y los registros de tareas.

Tipo:String
Posición:Named
Valor predeterminado:None
Requerido:False
Aceptar entrada de canalización:False
Aceptar caracteres comodín:False