使用無伺服器 SQL 集區來分析資料
在本教學課程中,您將了解如何使用無伺服器 SQL 集區來分析資料。
內建的無伺服器 SQL 集區
無伺服器 SQL 集區可讓您使用 SQL,卻不用保留容量。 無伺服器 SQL 集區的計費是根據執行查詢所處理的資料量計算,不是執行查詢所用的節點數目。
每個工作區都有一個稱為內建的預先設定無伺服器 SQL 集區。
使用無伺服器 SQL 集區來分析 NYC 計程車資料
注意
請確定您已將範例資料放入主要儲存體帳戶
在 Synapse Studio 中,移至 [開發] 中樞
建立新的 SQL 指令碼。
將下列程式碼貼到指令碼中。 (將
contosolake
更新為您的儲存體帳戶名稱,以及將users
更新為您的容器名稱。)SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]
選取執行。
資料探索只是方便您了解資料基本特性的簡化案例。 在本教學課程中深入了解資料探索和分析。
建立資料探索資料庫
您可以直接透過 master
資料庫瀏覽檔案內容。 有些簡單的資料探索案例不需要建立個別的資料庫。
但在您繼續進行資料探索時,可能會想要建立一些公用程式物件,例如:
- 代表儲存體帳戶具名參考的外部資料來源。
- 資料庫範圍認證可讓您指定驗證外部資料來源的方式。
- 有權存取某些資料來源或資料庫物件的資料庫使用者。
- 您可以在查詢中使用的公用程式檢視、程序和函式。
使用
master
資料庫為自訂資料庫物件建立個別的資料庫。 您無法在master
資料庫中建立自訂的資料庫物件。CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8
重要
使用具有
_UTF8
尾碼的定序,以確保 UTF-8 文字已正確轉換成VARCHAR
資料行。Latin1_General_100_BIN2_UTF8
能為從 Parquet 檔案和 Azure Cosmos DB 容器讀取資料的查詢提供最佳效能。 如需變更定序的詳細資訊,請參閱 Synapse SQL 支援的定序類型。使用下列命令,將資料庫內容從
master
切換至DataExplorationDB
。 您也可以使用 UI 控制項 [使用資料庫] 來切換目前的資料庫:USE DataExplorationDB
從
DataExplorationDB
建立公用程式物件,例如認證和資料來源。CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
注意
您可以建立不含認證的外部資料來源。 如果認證不存在,可使用呼叫端的身分識別來存取外部資料來源。
或者,您也可以使用新建立的
DataExplorationDB
資料庫,在DataExplorationDB
中建立可存取外部資料的使用者登入:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
然後在上述登入
DataExplorationDB
中建立資料庫使用者,並授與ADMINISTER DATABASE BULK OPERATIONS
權限。CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GO
使用相對路徑和資料來源探索檔案內容:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
將變更發佈至工作區。
資料探索資料庫只是一個簡單的預留位置,您可以在此儲存公用程式物件。 Synapse SQL 集區可讓您執行更多作業並建立邏輯資料倉儲,這是以 Azure 資料來源建置的關聯式層。 在本教學課程中深入了解如何建置邏輯資料倉儲。