共用方式為


Azure Cosmos DB

重要

此文件已淘汰,且可能未更新。 請參閱 官方 Cosmos DB Spark 連接器 Github 存放庫

Azure Cosmos DB 是 Microsoft 的全域散發多模型資料庫。 Azure Cosmos DB 可讓您彈性且獨立地跨任意數目的 Azure 地理區域調整輸送量和記憶體。 它提供輸送量、延遲、可用性和一致性保證,並提供完整的服務等級協定(SLA)。 Azure Cosmos DB 提供下列數據模型的 API,並提供多種語言的 SDK:

  • SQL API
  • MongoDB API
  • Cassandra API
  • 圖形 (Gremlin) API
  • 資料表 API

本文說明如何使用 Azure Databricks 從 Azure Cosmos DB 讀取和寫入數據。 如需有關 Azure Cosmos DB 的最新詳細數據,請參閱 使用 Apache Spark 加速巨量數據分析至 Azure Cosmos DB 連接器

資源:

重要

此連接器支援 Azure Cosmos DB 的核心 (SQL) API。 針對適用於 MongoDB 的 Cosmos DB API,請使用 MongoDB Spark 連接器。 針對 Cosmos DB Cassandra API,請使用 Cassandra Spark 連接器

建立和附加必要的連結庫

  1. 下載您 執行之 Apache Spark 版本的最新 azure-cosmosdb-spark 連結庫
  2. 將下載的 JAR 檔案上傳至 Databricks。 請參閱程式庫
  3. 將上傳的連結庫 安裝到 Databricks 叢集中。