共用方式為


bamboolib

重要

此文件已停止使用,且可能不會更新。 bamboolib 已被取代。 如需產生程式代碼的協助,請參閱 Databricks Assistant

注意

bamboolib 在 Databricks Runtime 11.3 LTS 及更高版本中受到支援。

bamboolib 是一種使用者介面元件,可允許從 Azure Databricks Notebook內進行無程式代碼數據分析和轉換。 bamboolib 可協助使用者更輕鬆地使用其數據,並加速常見的數據整頓、探索和視覺效果工作。 當使用者使用其數據完成這類工作時,bamboolib 會自動在背景中產生 Python 程式代碼。 使用者可以與其他人共用此程式碼,他們可以在自己的筆記本中執行此程序代碼,以快速重現這些原始工作。 他們也可以使用 bamboolib 來擴充這些原始工作與額外的數據工作,而不需要知道如何撰寫程序代碼。 那些有程式代碼撰寫經驗的人可以擴充此程序代碼,以建立更複雜的結果。

在幕後,bamboolib 會使用 ipywidgets,這是 IPython 核心的互動式 HTML 小工具架構。 ipywidgets 會在 IPython 核心內執行。

內容

要求

快速入門

  1. 建立 Python 筆記本

  2. 將筆記型電腦 連接到滿足 要求的叢集,

  3. 在筆記本的第一個 儲存格中,輸入下列程式代碼,然後 單元格執行。 如果已 已安裝在工作區或叢集中,則可以略過此步驟。

    %pip install bamboolib
    
  4. 在筆記本的第二個儲存格中,輸入下列程式代碼,然後執行該儲存格。

    import bamboolib as bam
    
  5. 在筆記本的第三個程式碼格中,輸入下列程式代碼,然後執行該格。

    bam
    

    注意

    或者,您可以 列印現有的 pandas DataFrame 來顯示 bamboolib,以便與該特定 DataFrame 搭配使用。

  6. 繼續執行 關鍵工作。

操作指南

您可以單獨使用 bamboolib ,或將其與現有的 pandas DataFrame搭配使用。

單獨使用 Bamboolib

在本逐步解說中,您會使用 bamboolib 在筆記本中顯示範例銷售數據集的內容。 然後,您可以實驗 bamboolib 自動為您產生的一些相關筆記本程序代碼。 您透過查詢和排序銷售資料集內容的複本來完成。

  1. 建立 Python 筆記本

  2. 將筆記型電腦 連接到滿足 要求的叢集,

  3. 在筆記本的第一個 儲存格中,輸入下列程式代碼,然後 單元格執行。 如果已 已安裝在工作區或叢集中,則可以略過此步驟。

    %pip install bamboolib
    
  4. 在筆記本的第二個儲存格中,輸入下列程式代碼,然後執行該儲存格。

    import bamboolib as bam
    
  5. 在筆記本的第三個程式碼格中,輸入下列程式代碼,然後執行該格。

    bam
    
  6. 點選「載入虛擬資料」。

  7. [載入虛擬數據] 窗格中,對於 為測試 bamboolib 載入的虛擬數據集,選擇 銷售數據集

  8. 按下 執行

  9. 顯示所有 item_type嬰兒食品的資料列:

    1. 搜尋動作 清單中,選取 [篩選數據列]
    2. 在 [篩選數據列] 窗格中,於 [選擇] 列表中(上方),選取 [選取數據列]。
    3. 在下列清單中 的地方,選取 類型項目
    4. 在 [選擇 item_type旁的 [] 列表中,選取 [具有 value(s)
    5. 在 [選擇值 方塊中,具有 value(s),選取 [嬰兒食品]。
    6. 按下 執行
  10. 複製此查詢自動產生的 Python 程式代碼:

    1. Cick 資料預覽下方的複製程式代碼
  11. 貼上並修改程式代碼:

    1. 在筆記本的第四個儲存格中,貼上您複製的程式碼。 看起來應該像這樣:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. 新增至此程式代碼,使其只顯示 order_prioC的數據列,然後執行資料格:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    提示

    除了撰寫此程式代碼,您也可以只使用第三個數據格中的 bamboolib 來執行相同的動作,只顯示 order_prioC的數據列。此步驟是擴充 bamboolib 稍早自動產生的程式代碼範例。

  12. 區域排序數據列, 遞增順序:

    1. 在第四個數據格內的小工具中,於 [搜尋動作] 清單中,選取 [排序數據列]。
    2. 在 [排序數據行] 窗格中,於 [選擇數據行] 清單中,選取 [區域]。
    3. 區域旁邊的清單中,選取 遞增 (A-Z)
    4. 按下 執行

    注意

    這相當於自行撰寫下列程式代碼:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    您也可以只使用 bamboolib 在第三個儲存格中,將資料按 區域 以遞增順序排序。 此步驟示範如何使用 bamboolib 來擴充您撰寫的程式代碼。 當您使用 bamboolib 時,它會自動在背景中為您生成額外的程式代碼,以便您能進一步擴展已有的程式代碼!

  13. 繼續執行 關鍵工作。

搭配現有的DataFrame使用 bamboolib

在此循序教學中,您將使用 bamboolib 在筆記本上顯示 pandas DataFrame的內容。 此 DataFrame 包含範例銷售數據集的複本。 然後,您可以實驗 bamboolib 自動為您產生的一些相關筆記本程序代碼。 您可以藉由查詢及排序某些 DataFrame 的內容來完成。

  1. 建立 Python 筆記本

  2. 將筆記型電腦 連接到滿足 要求的叢集,

  3. 在筆記本的第一個 儲存格中,輸入下列程式代碼,然後 單元格執行。 如果已 已安裝在工作區或叢集中,則可以略過此步驟。

    %pip install bamboolib
    
  4. 在筆記本的第二個儲存格中,輸入下列程式代碼,然後執行該儲存格。

    import bamboolib as bam
    
  5. 在筆記本的第三個程式碼格中,輸入下列程式代碼,然後執行該格。

    import pandas as pd
    
    df = pd.read_csv(bam.sales_csv)
    df
    

    請注意,bamboolib 僅支援 pandas DataFrames。 若要將 PySpark DataFrame 轉換成 pandas DataFrame,請在 PySpark DataFrame 上呼叫 toPandas。 若要將 Spark DataFrame 上的 Pandas API 轉換成 pandas DataFrame,請在 Spark DataFrame 上的 Pandas API 上呼叫 to_pandas

  6. 點選 「」 顯示 bamboolib UI

  7. 顯示所有 item_type嬰兒食品的資料列:

    1. 搜尋動作 清單中,選取 [篩選數據列]
    2. 在 [篩選數據列] 窗格中,於 [選擇] 列表中(上方),選取 [選取數據列]。
    3. 在下列清單中 的地方,選取 類型項目
    4. 在 [選擇 item_type旁的 [] 列表中,選取 [具有 value(s)
    5. 在 [選擇值 方塊中,具有 value(s),選取 [嬰兒食品]。
    6. 按下 執行
  8. 複製此查詢自動產生的 Python 程式代碼。 為此,請點擊數據預覽下方的 複製代碼

  9. 貼上並修改程式代碼:

    1. 在筆記本的第四個儲存格中,貼上您複製的程式碼。 看起來應該像這樣:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. 新增至此程式代碼,使其只顯示 order_prioC的數據列,然後執行資料格:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    提示

    除了撰寫此程式代碼,您也可以只使用第三個數據格中的 bamboolib 來執行相同的動作,只顯示 order_prioC的數據列。此步驟是擴充 bamboolib 稍早自動產生的程式代碼範例。

  10. 區域排序數據列, 遞增順序:

    一個。 在第四個儲存格內的小工具中,按一下 [排序資料列]

    1. 在 [排序數據行] 窗格中,於 [選擇數據行] 清單中,選取 [區域]。
    2. 區域旁邊的清單中,選取 遞增 (A-Z)
    3. 按下 執行

    注意

    這相當於自行撰寫下列程式代碼:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    您也可以只使用 bamboolib 在第三個儲存格中,將資料按 區域 以遞增順序排序。 此步驟示範如何使用 bamboolib 來擴充您撰寫的程式代碼。 當您使用 bamboolib 時,它會自動在背景中為您生成額外的程式代碼,以便您能進一步擴展已有的程式代碼!

  11. 繼續執行 關鍵工作。

重要工作

在本節中:

將小工具新增至儲存格

案例:您希望 bamboolib 小工具顯示在儲存格中。

  1. 請確定筆記本符合 bamboolib 需求。

  2. 如果 bamboolib 尚未 已安裝在工作區或叢集中, 在筆記本的單元格中執行下列程序代碼,最好在第一個數據格中執行:

    %pip install bamboolib
    
  3. 在筆記本中執行下列程序代碼,最好是在筆記本的第一個或第二個數據格中:

    import bamboolib as bam
    
  4. 選項 1:在您要顯示小工具的儲存格中,新增下列程式碼,然後執行該儲存格:

    bam
    

    小工具會出現在程序代碼下方的儲存格中。

    或:

    選項 2:在包含 Pandas資料框參考的儲存格中,打印資料框。 例如,假設有下列 DataFrame 定義,請執行該程式碼區塊。

    import pandas as pd
    from datetime import datetime, date
    
    df = pd.DataFrame({
      'a': [ 1, 2, 3 ],
      'b': [ 2., 3., 4. ],
      'c': [ 'string1', 'string2', 'string3' ],
      'd': [ date(2000, 1, 1), date(2000, 2, 1), date(2000, 3, 1) ],
      'e': [ datetime(2000, 1, 1, 12, 0), datetime(2000, 1, 2, 12, 0), datetime(2000, 1, 3, 12, 0) ]
    })
    
    df
    

    小工具會出現在程序代碼下方的儲存格中。

    請注意,bamboolib 僅支援 pandas DataFrames。 若要將 PySpark DataFrame 轉換成 pandas DataFrame,請在 PySpark DataFrame 上呼叫 toPandas。 若要將 Spark DataFrame 上的 Pandas API 轉換成 pandas DataFrame,請在 Spark DataFrame 上的 Pandas API 上呼叫 to_pandas

清除小工具

案例:您想清除widget內容,然後將新數據載入既有的widget中。

選項 1:在包含目標小工具的儲存格內執行下列程式代碼:

bam

小工具會清除並重新顯示以下按鈕:Databricks:從 DBFS 讀取 CSV 檔案Databricks:載入資料庫數據表,以及 載入虛擬數據

注意

如果出現錯誤 name 'bam' is not defined,請在筆記本中執行下列程式代碼(最好在筆記本的第一個數據格中),然後再試一次:

import bamboolib as bam

選項 2:在包含 pandas DataFrame參考的儲存格中,重新執行該儲存格以再次列印 DataFrame。 小工具會清除舊資料,然後顯示新資料。

數據載入工作

在本節中:

將範例數據集的內容讀入小工具

案例:您想要將一些範例數據讀入小工具,例如一些假裝的銷售數據,以便測試小工具的功能。

  1. 點選「載入虛擬資料」。

    注意

    如果 載入虛擬資料 沒有顯示,請用選項 1 清除元件,然後再試一次。

  2. 在 [載入虛擬數據] 窗格中,針對 [載入用於測試 bamboolib 的虛擬數據集],選取您要載入的數據集名稱。

  3. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。

  4. 按下 執行

    小工具會顯示數據集的內容。

提示

您可以切換目前的小工具以顯示不同範例資料集的內容:

  1. 在目前的 Widget 中,點擊 [載入虛擬資料] 索引標籤。
  2. 請遵循上述步驟,將其他範例數據集的內容讀入 Widget。

將 CSV 文件內容讀取到該小工具中

案例:您想要將 Azure Databricks 工作區內的 CSV 檔案內容讀入 Widget。

  1. 點擊 Databricks:從 DBFS 讀取 CSV 檔案

    注意

    如果 Databricks:看不到 DBFS 的 CSV 檔案,清除具有選項 1 的小工具,然後再試一次。

  2. 在 [從 DBFS 讀取 CSV] 窗格中,流覽至包含目標 CSV 檔案的位置。

  3. 選取目標 CSV 檔案。

  4. 針對 Dataframe 名稱,輸入 CSV 檔案內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。

  5. 針對 CSV 值分隔符,輸入分隔 CSV 檔案中值的字元,或將 (逗號) 字元保留為預設值分隔符。

  6. 針對 小數分隔符,輸入 CSV 檔案中分隔小數點的字元,或保留 (點) 字元做為預設值分隔符。

  7. 針對 數據列限制:讀取第一個 N 個數據列 - 保留空白,、輸入要讀取到小工具的數據列數目上限,或將 100000 保留為預設數據列數目,或將此方塊保留空白以指定無數據列限制。

  8. 點選 「」 開啟 CSV 檔案

    小工具會根據您指定的設定,顯示 CSV 檔案的內容。

提示

您可以切換目前的小工具以顯示不同 CSV 檔案的內容:

  1. 在目前的小工具中,點擊 [從 DBFS 讀取 CSV] 索引標籤。
  2. 請遵循上述步驟,將其他 CSV 檔案的內容讀入 Widget。

將資料庫數據表的內容讀入 Widget

案例:您想要將 Azure Databricks 工作區內資料庫數據表的內容讀入 Widget。

  1. 按一下 Databricks:載入資料庫資料表

    注意

    如果 Databricks:無法顯示載入資料庫數據表清除選項 1 的小工具,然後再試一次。

  2. 在 [Databricks:載入資料庫數據表] 窗格中,針對 [資料庫] 保留空白,針對預設資料庫,輸入目標數據表所在的資料庫名稱,或將此方塊保留空白,以指定 默認資料庫 資料庫。

  3. 針對 Table,輸入目標數據表的名稱。

  4. 針對 數據列限制:讀取第一個 N 個數據列 - 保留空白,、輸入要讀取到小工具的數據列數目上限,或將 100000 保留為預設數據列數目,或將此方塊保留空白以指定無數據列限制。

  5. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。

  6. 按下 執行

    小工具會根據您指定的設定,顯示資料表的內容。

提示

您可以切換目前的小工具以顯示不同資料表的內容:

  1. 在目前的小工具中,按一下 [Databricks:載入資料庫資料表] 索引標籤。
  2. 請遵循上述步驟,將其他數據表的內容讀入 Widget。

資料操作任務

bamboolib 提供超過 50 個數據動作。 以下是一些較常見的入門資料操作任務。

在本節中:

選取欄

情境:您想要只顯示名稱、數據類型或符合某些正則表達式的特定表格欄位。 例如,在虛擬 Sales 資料集中,您想要只顯示 item_typesales_channel 數據行,或只顯示包含數據行名稱中字串 _date 的數據行。

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 選擇 ,然後選擇,接著選擇或取消欄
    • 選取 選取或刪除的數據列。
  2. 在 [選取或卸除數據行] 窗格中,於 [選擇] 下拉式清單中,選取 [選取 選取]。
  3. 選取目標欄名稱或包含條件。
  4. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  5. 按下 執行

卸除列

案例:您想要依名稱、數據類型或符合某些正則表示式來隱藏特定數據表數據行。 例如,在虛擬 Sales 數據集中,您想要隱藏 order_prioorder_dateship_date 資料行,或想要隱藏只包含日期時間值的所有數據行。

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 卸除,然後選取 選取或卸除數據行
    • 選取 選取或刪除的數據列。
  2. 在 [選取或卸除欄位] 窗格中,於 [選擇] 下拉式清單中,選取 [卸除]。
  3. 選取目標欄名稱或包含條件。
  4. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  5. 按下 執行

篩選行

案例:您想要根據符合或遺漏的特定數據行值等準則來顯示或隱藏特定數據表數據列。 例如,在虛擬 Sales 數據集中,您想要只顯示欄位 item_type 的值設定為 Baby Food的資料行。

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 篩選,然後選取 篩選行
    • 選擇 篩選資料列
  2. 在 [篩選數據列] 窗格中,於上方的 [選擇] 下拉式清單中 ,選取 [選取數據列] 或 [刪除資料列]。
  3. 指定第一個篩選準則。
  4. 若要新增另一個篩選準則,請按下 [新增條件],然後指定下一個篩選準則。 視需要重複。
  5. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  6. 按下 執行

排序行

案例:您想要根據一或多個數據行內的值來排序數據表數據列。 例如,在虛擬 Sales 數據集中,您想要根據 region 資料列的值,從 A 到 Z 的字母順序顯示資料列。

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 排序,然後選取 排序數據列
    • 選擇 排序列
  2. 在 [排序欄位] 窗格中,選擇要排序的第一個欄位和排序順序。
  3. 若要新增另一個排序準則,請按一下 [新增欄位,然後指定下一個排序準則。 視需要重複。
  4. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  5. 按下 執行

群組行列的任務

在本節中:
依單一聚合函數分組數據列和數據行

案例:您想要藉由計算群組來顯示數據列和數據行結果,而您想要將自定義名稱指派給這些群組。 例如,在虛擬 Sales 資料集中,您想要依 country 資料行的值來分組數據列,顯示包含相同 country 值的數據列數,並提供計算計數清單 country_count

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 群組,然後選取 按群組並匯總(附加重新命名)
    • 選取 [群組依據],並對進行聚合與重新命名。
  2. 在 [使用數據行重新命名] 窗格的 [群組依據] 窗格中,選取要分組的數據行、第一個計算,並選擇性地指定計算結果列的名稱。
  3. 若要新增另一個計算,請按兩下 [新增計算],然後指定下一個計算和數據行名稱。 視需要重複。
  4. 指定要儲存結果的位置。
  5. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  6. 按下 執行
依多個聚合函數分組數據列和數據行

案例:您想要藉由計算群組來顯示數據列和數據行結果。 例如,在虛擬 Sales 數據集中,您希望根據 regioncountrysales_channel 欄的值來分組資料行,顯示 region包含相同 countrysales_channel 值的資料行數量,並且按照 total_revenueregioncountry的唯一組合來顯示 sales_channel

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 群組,然後選擇 [依群組 並匯總(預設)]
    • 選取 [群組依據] ,然後匯總 [預設]
  2. [使用數據行重新命名] 窗格中,選取要分組的數據行,然後選取第一個計算。
  3. 若要新增另一個計算,請按兩下 [新增計算],然後指定下一個計算。 視需要重複。
  4. 指定要儲存結果的位置。
  5. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  6. 按下 執行

拿掉遺漏值的數據列

案例:您想要移除任何具有指定欄位遺漏值的數據行。 例如,在虛擬 Sales 數據集中,您想要移除遺漏 item_type 值的任何數據列。

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 卸除移除,然後選取 [卸除遺漏值
    • 選取 移除遺漏值
  2. 在 [卸除遺漏值 窗格中,選取數據行以移除該數據行遺漏值的任何數據列。
  3. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  4. 按下 執行

拿掉重複的數據列

案例:您想要移除具有指定資料行重複值的任何數據列。 例如,在虛擬 Sales 數據集中,您想要移除彼此完全重複的任何數據列。

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 放下移除,然後選取 [放下/移除重複項目]
    • 選擇 [卸除/移除重複項目
  2. 在 [[移除重複專案] 窗格中,選取數據行以移除這些數據行具有重複值的任何數據列,然後選取是否保留具有重複值的第一個或最後一個數據列。
  3. 針對 Dataframe 名稱,輸入數據表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識符。
  4. 按下 執行

尋找並取代遺漏的值

案例:您希望將指定列中任何行的遺漏值替換為替代值。 例如,在虛擬 Sales 資料集中,您想要將 item_type 欄中的遺漏值所在的任何資料列替換為值 Unknown Item Type

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 尋找取代,然後選取 尋找並取代遺漏值
    • 選取 尋找並取代遺漏的值
  2. 在 [取代遺漏值 窗格中,選取要取代遺漏值的數據行,然後指定取代值。
  3. 按下 執行

建立欄位公式

案例:您想要建立使用獨特公式的欄。 例如,在虛擬 Sales 數據集中,您想要建立名為 profit_per_unit 的數據行,以顯示將 total_profit 數據行值除以每個數據列 units_sold 數據行值的結果。

  1. 在 [數據] 標籤頁中,於 [搜尋動作] 下拉式清單中,執行下列其中一項操作:
    • 輸入 公式, 然後選取 新增列公式
    • 選擇 新增欄公式
  2. 在 [取代遺漏值 窗格中,選取要取代遺漏值的數據行,然後指定取代值。
  3. 按下 執行

數據動作歷程記錄工作

在本節中:

檢視在小工具中執行的動作清單

案例:您想查看小工具中所有變更的記錄,從最新的變更開始。

點選 歷史。 動作清單會出現在 [轉換歷程記錄] 窗格中。

復原小工具中最近採取的動作

情境:您想要還原元件中最近所做的變更。

執行下列其中一項動作:

  • 按兩下逆時針箭號圖示。
  • 點選 [記錄],然後在 [轉換紀錄] 窗格中,點選 [復原最後一個步驟]。

重做小工具中最近執行的操作

案例:您想要撤銷小工具中最最近的一次復原。

執行下列其中一項動作:

  • 按兩下順時針箭號圖示。
  • 單擊 [記錄],然後在 [轉換歷程記錄] 窗格中,單擊 [復原最後一個步驟]。

更改小工具中最新完成的動作

案例:您想要變更小工具中進行的最新的變更。

  1. 執行下列其中一項動作:
    • 按兩下鉛筆圖示。
    • 點選 [記錄],然後在 [轉換歷程記錄] 窗格中,點擊 [編輯最後一個步驟]。
  2. 進行所需的變更,然後點擊 執行

取得程式碼,將小工具的目前狀態程式化為 DataFrame

案例:您想要取得以程序設計方式重新建立目前小工具狀態的 Python 程式代碼,以 pandas DataFrame 表示。 您想要在此活頁簿中的不同儲存格中執行此程式碼,或完全在不同的活頁簿中執行此程式碼。

  1. 點選 「取得程式碼」

  2. 在 [匯出程式代碼] 窗格中,按一下 複製程式代碼。 程式碼已複製到系統的剪貼簿。

  3. 將程式代碼貼到此活頁簿中的不同儲存格或不同的活頁簿中。

  4. 撰寫額外的程式碼以程式方式操作此 pandas DataFrame,然後執行該單元格。 例如,假設您的 DataFrame 是以程式方式表達的,若要顯示其內容,df

    # Your pasted code here, followed by...
    df
    

局限性

如需詳細資訊,請參閱 Databricks 筆記本 的已知限制。

其他資源