Sdílet prostřednictvím


Azure Cosmos DB

Důležité

Tato dokumentace byla vyřazena a nemusí být aktualizována. Podívejte se na oficiální úložiště GitHubu pro konektor Spark služby Cosmos DB.

Databáze Azure Cosmos je globálně distribuovaná databáze Microsoftu pro více modelů. Azure Cosmos DB umožňuje elasticky a nezávisle škálovat propustnost a úložiště napříč libovolným počtem geografických oblastí Azure. Nabízí záruky propustnosti, latence, dostupnosti a konzistence s komplexními smlouvami o úrovni služeb (SLA). Azure Cosmos DB poskytuje rozhraní API pro následující datové modely s sadami SDK dostupnými ve více jazycích:

  • Rozhraní API SQL
  • Rozhraní MongoDB API
  • Rozhraní Cassandra API
  • Rozhraní Graph (Gremlin) API
  • Rozhraní Table API

Tento článek vysvětluje, jak číst data ze služby Azure Cosmos DB a zapisovat do služby Azure Cosmos DB pomocí Azure Databricks. Další aktuální podrobnosti o službě Azure Cosmos DB najdete v tématu Zrychlení analýz velkých objemů dat pomocí Apache Sparku na konektor Azure Cosmos DB.

Prostředky:

Důležité

Tento konektor podporuje základní rozhraní API (SQL) služby Azure Cosmos DB. Pro rozhraní API Služby Cosmos DB pro MongoDB použijte konektor MongoDB Spark. Pro rozhraní API Cassandra služby Cosmos DB použijte konektor Cassandra Spark.

Vytvoření a připojení požadovaných knihoven

  1. Stáhněte si nejnovější knihovnu azure-cosmosdb-spark pro verzi Apache Sparku, kterou používáte.
  2. Nahrajte stažené soubory JAR do Databricks. Viz knihovny.
  3. Nainstalujte nahrané knihovny do clusteru Databricks.