在用于 Visual Studio 的 Data Lake 工具中使用顶点执行视图

了解如何使用顶点执行视图测试 Data Lake Analytics 作业。

重要

Azure Data Lake Analytics于 2024 年 2 月 29 日停用。 通过此公告了解更多信息。

对于数据分析,组织可以使用 Azure Synapse AnalyticsMicrosoft Fabric

打开顶点执行视图

在用于 Visual Studio 的 Data Lake 工具中打开 U-SQL 作业。 选择左下角的 “顶点执行视图 ”。 系统可能提示先加载配置文件,此操作可能需要一些时间,具体取决于网络连接状况。

显示 Data Lake Analytics 工具顶点执行视图的屏幕截图

了解顶点执行视图

顶点执行视图由三个部分组成:

显示顶点执行视图的屏幕截图,其中突出显示了“顶点选择器”、顶部居中窗格和底部居中窗格。

可在左边的“顶点选择器”按功能选择顶点(例如:前 10 个数据读取,或按阶段选择)。 最常用的筛选器之一是查看 关键路径上的顶点。 “关键路径”是 U-SQL 作业顶点中最长的链。 了解关键路径有助于通过检查哪个顶点耗时最长来优化作业。

显示顶点执行视图的顶部居中窗格的屏幕截图,其中显示了“所有顶点的运行状态”。

顶部中心窗格显示“所有顶点的运行状态”

显示顶点执行视图的底部居中窗格的屏幕截图,其中显示了每个顶点的信息。

底部中心窗格显示每个顶点的信息:

  • 进程名称:顶点实例的名称。 它由 StageName 中的不同部分组成|VertexName |VertexRunInstance。 例如,SV7_Split[62].v1 顶点表示阶段 SV7_Split 中顶点数 62 的第二个运行实例(.v1,从 0 开始索引)。
  • 读取/写入的总数据:此顶点读取/写入的数据。
  • 状态/退出状态:顶点结束时的最终状态。
  • 退出代码/失败类型:顶点失败时出现的错误。
  • 创建原因:为何创建顶点。
  • 资源延迟/进程延迟/PN 队列延迟:顶点等待资源、处理数据和在队列中等待所需的时间。
  • 进程/创建者 GUID:当前运行顶点或其创建者的 GUID。
  • 版本:运行中顶点的第 N 个实例(系统可能因故障转移、计算冗余等多种原因安排顶点的新实例)
  • 版本创建时间。
  • 进程创建开始时间/进程排队时间/进程开始时间/进程完成时间:顶点进程开始创建的时间;顶点进程开始排队的时间;特定顶点进程开始时间;特定顶点完成时间。

后续步骤