你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Invoke-AzureHDInsightHiveJob

将 Hive 查询提交到 HDInsight 群集,显示查询执行进度,并在一个操作中获取查询结果。

注意

本文档中引用的 cmdlet 用于管理使用 Azure Service Manager (ASM) API 的旧式 Azure 资源。 创建新资源时,建议不要使用旧的 PowerShell 模块,因为计划将停用 ASM。 有关详细信息,请参阅 Azure Service Manager 停用

Az PowerShell 模块是建议用于管理 PowerShell 的 Azure 资源管理器 (ARM) 资源的 PowerShell 模块。

语法

Invoke-AzureHDInsightHiveJob
      [-Arguments <String[]>]
      [-Defines <Hashtable>]
      [-File <String>]
      [-Files <String[]>]
      [-JobName <String>]
      [-Query <String>]
      [-RunAsFileJob]
      [-StatusFolder <String>]
      [-Profile <AzureSMProfile>]
      [<CommonParameters>]

说明

此版本的 Azure PowerShell HDInsight 已弃用。 这些 cmdlet 将于 2017 年 1 月 1 日删除。 请使用较新版本的 Azure PowerShell HDInsight。

有关如何使用新的 HDInsight 创建群集的信息,请参阅 使用 Azure PowerShell 在 HDInsight 中创建基于 Linux 的群集(https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-create-linux-clusters-azure-powershell/)。 有关如何使用 Azure PowerShell 和其他方法提交作业的信息,请参阅 HDInsight 中的提交 Hadoop 作业(https://azure.microsoft.com/en-us/documentation/articles/hdinsight-submit-hadoop-jobs-programmatically/)。 有关 Azure PowerShell HDInsight 的参考信息,请参阅 Azure HDInsight Cmdlet

Invoke-AzureHDInsightHiveJob cmdlet 将 Hive 查询提交到 HDInsight 群集,显示查询执行进度,并在一个操作中获取查询结果。 在运行 Invoke-AzureHDInsightHiveJob 之前,必须运行 Use-AzureHDInsightCluster cmdlet,以指定要向其提交查询的 HDInsight 群集。

示例

示例 1:提交 Hive 查询

PS C:\>Use-AzureHDInsightCluster "Cluster01" -Subscription (Get-AzureSubscription -Current).SubscriptionId
PS C:\> Invoke-AzureHDInsightHiveJob "select * from hivesampletable limit 10"

第一个命令使用 Use-AzureHDInsightCluster cmdlet 指定要用于 Hive 查询的当前订阅中的群集。

第二个命令使用 Invoke-AzureHDInsightHiveJob cmdlet 提交 Hive 查询。

参数

-Arguments

指定 Hadoop 作业的参数数组。 参数以命令行参数的形式传递到每个任务。

类型:String[]
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Defines

指定要在作业运行时设置的 Hadoop 配置值。

类型:Hashtable
别名:Params
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-File

指定 Azure Blob 存储中包含要运行的查询的文件的 Windows Azure 存储 Blob(WASB)路径。 可以使用此参数而不是 Query 参数。

类型:String
别名:QueryFile
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Files

指定 Hive 作业所需的文件集合。

类型:String[]
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-JobName

指定 Hive 作业的名称。 如果未指定此参数,此 cmdlet 将使用默认值:“Hive: <Query 的前 100 个字符>”。

类型:String
别名:Name
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Profile

指定此 cmdlet 从中读取的 Azure 配置文件。 如果未指定配置文件,此 cmdlet 将从本地默认配置文件中读取。

类型:AzureSMProfile
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Query

指定 Hive 查询。

类型:String
别名:QueryText
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-RunAsFileJob

指示此 cmdlet 在存储查询的默认 Azure 存储帐户中创建文件。 此 cmdlet 提交将引用此文件的作业作为要运行的脚本。

可以使用此功能来处理特殊字符,例如通过 Templeton 提交作业失败的百分比符号 ≤ ,因为 Templeton 将具有百分号的查询解释为 URL 参数。

类型:SwitchParameter
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-StatusFolder

指定包含作业的标准输出和错误输出的文件夹的位置,包括其退出代码和任务日志。

类型:String
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False