共用方式為


快速入門:使用資料總管進行分析 (預覽)

在本文中,您將了解使用適用於 Azure Synapse 的資料總管來載入和分析資料的基本步驟。

建立資料總管集區

  1. 在 Synapse Studio 的左側窗格上,選取 [管理] > [資料總管集區]

  2. 選取 [新增],然後在 [基本] 索引標籤中輸入下列詳細資料:

    設定 建議的值 描述
    資料總管集區名稱 contosodataexplorer 這是資料總管集區將具有的名稱。
    工作負載 計算最佳化 此工作負載提供更高的 CPU 與 SSD 儲存體比例。
    節點大小 小型 (4 核心) 將此設為最小的大小,以降低本快速入門的成本

    重要

    請注意,資料總管可以使用的名稱有特定限制。 名稱只能包含小寫字母和數字,同時長度須介於 4 到 15 個字元,並以字母開頭。

  3. 選取 [檢閱 + 建立]>[建立]。 您的資料總管集區將啟動佈建程序。

建立資料總管資料庫

  1. 在 Synapse Studio 的左側窗格上,選取 [資料]

  2. 選取 + (新增資源) >[資料總管資料庫],並貼上下列資訊:

    設定 建議的值 描述
    集區名稱 contosodataexplorer 要使用的資料總管集區名稱
    名稱 TestDatabase 資料庫名稱在叢集內必須是唯一而不重複。
    預設保留期限 365 保證資料持續可供查詢的時間範圍 (天)。 系統會從內嵌資料的時間開始測量時間範圍。
    預設快取期間 31 在 SSD 儲存裝置或 RAM 中 (而非長期儲存裝置),讓受到頻繁查詢的資料維持可用狀態的時間範圍 (天)。
  3. 選取 [建立] 以建立資料庫。 建立時間通常不到一分鐘。

擷取範例資料,並使用簡單的查詢進行分析

  1. 在 Synapse Studio 的左側窗格上,選取 [開發]

  2. KQL 指令碼下方,選取+ (新增資源) >[KQL 指令碼]。 您可以在右側窗格上命名指令碼。

  3. 在 [連線至] 功能表中,選取 [contosodataexplorer]

  4. 在 [使用資料庫] 功能表中,選取 [TestDatabase]

  5. 貼上下列命令,然後選取 [執行] 以建立 StormEvents 資料表。

    .create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)
    

    提示

    確認資料表已成功建立。 在左側窗格上,依序選取 [資料]contosodataexplorer 其他功能表和 [重新整理]。 在 contosodataexplorer 下方,展開 [資料表],確認 StormEvents 資料表出現在清單中。

  6. 貼上下列命令,然後選取 [執行] 以將資料擷取至 StormEvents 資料表。

    .ingest into table StormEvents 'https://kustosamples.blob.core.windows.net/samplefiles/StormEvents.csv' with (ignoreFirstRecord=true)
    
  7. 在擷取完成之後,貼上下列查詢,在視窗中選取該查詢,然後選取 [執行]

    StormEvents
    | sort by StartTime desc
    | take 10
    

    此查詢會從所擷取的範例資料傳回下列結果。

    Results for query run on sample data

下一步