Azure Cosmos DB
重要
此文件已淘汰,且可能未更新。 請參閱 官方 Cosmos DB Spark 連接器 Github 存放庫。
Azure Cosmos DB 是 Microsoft 的全域散發多模型資料庫。 Azure Cosmos DB 可讓您彈性且獨立地跨任意數目的 Azure 地理區域調整輸送量和記憶體。 它提供輸送量、延遲、可用性和一致性保證,並提供完整的服務等級協定(SLA)。 Azure Cosmos DB 提供下列數據模型的 API,並提供多種語言的 SDK:
- SQL API
- MongoDB API
- Cassandra API
- 圖形 (Gremlin) API
- 資料表 API
本文說明如何使用 Azure Databricks 從 Azure Cosmos DB 讀取和寫入數據。 如需有關 Azure Cosmos DB 的最新詳細數據,請參閱 使用 Apache Spark 加速巨量數據分析至 Azure Cosmos DB 連接器。
資源:
重要
此連接器支援 Azure Cosmos DB 的核心 (SQL) API。 針對適用於 MongoDB 的 Cosmos DB API,請使用 MongoDB Spark 連接器。 針對 Cosmos DB Cassandra API,請使用 Cassandra Spark 連接器。
建立和附加必要的連結庫
- 下載您 執行之 Apache Spark 版本的最新 azure-cosmosdb-spark 連結庫 。
- 將下載的 JAR 檔案上傳至 Databricks。 請參閱程式庫。
- 將上傳的連結庫 安裝到 Databricks 叢集中。