開始使用:從筆記本查詢資料並將其視覺化
本入門文章會逐步引導您使用 Azure Databricks Notebook 來查詢使用 SQL、Python、Scala 和 R 儲存在 Unity 目錄中的範例數據,然後將筆記本中的查詢結果可視化。
需求
若要完成這項工作,請確定您符合下列需求:
- 工作區必須已啟用 Unity 目錄 。 如需開始使用 Unity 目錄的資訊,請參閱 設定與管理 Unity 目錄。
- 您必須擁有使用現有計算資源或建立新計算資源的權限。 請參閱 開始使用:帳戶與工作區設定 ,或查看您的 Databricks 系統管理員。
步驟 1:建立新的筆記本。
若要在工作區中建立筆記本,請按一下提要欄位的 新增 ,然後按一下 筆記本。 空白筆記本會在工作區中開啟。
若要深入瞭解如何建立並管理筆記本,請參閱 管理筆記本。
步驟 2:查詢數據表
samples.nyctaxi.trips
使用您選擇的語言查詢 Unity 目錄中的數據表。
請將下列程式碼複製並貼到全新空白筆記本資料格。 此程式代碼會顯示查詢
samples.nyctaxi.trips
Unity 目錄中資料表的結果。SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
按
Shift+Enter
執行此資料格,然後移至下一個資料格。查詢結果會出現在筆記本中。
步驟 3:顯示數據
依車程距離顯示平均票價金額,並依取貨郵遞區編碼分組。
在資料表索引標籤旁,按一下 + ,然後按一下 視覺效果。
此時會顯示視覺效果編輯器。
在 [視覺效果類型]] 下拉式清單中,確認已選取 [橫條圖]。
選取
fare_amount
X 資料行。選取
trip_distance
Y 資料行。選取
Average
作為匯總類型。選取
pickup_zip
為 [ 依群組] 數據行。按一下 [檔案] 。
下一步
- 若要瞭解如何將數據從 CSV 檔案新增至 Unity 目錄並可視化數據,請參閱 開始使用:從筆記本匯入和可視化 CSV 數據。
- 若要瞭解如何使用 Apache Spark 將數據載入 Databricks,請參閱 教學課程:使用 Apache Spark DataFrame 載入和轉換數據。
- 若要深入瞭解將數據內嵌至 Databricks,請參閱 將數據內嵌至 Databricks Lakehouse。
- 若要深入瞭解如何使用 Databricks 查詢數據,請參閱 查詢數據。
- 若要深入了解視覺效果,請參閱 Databricks 筆記本中的視覺效果。