Azure Cosmos DB
Importante
Esta documentação foi desativada e pode não estar atualizada. Consulte o repositório github do conector do Spark do Cosmos DB oficial.
O Azure Cosmos DB é o banco de dados multimodelo da Microsoft distribuído globalmente. O Azure Cosmos DB permite que você dimensione a taxa de transferência e o armazenamento de maneira elástica e independente em qualquer número de regiões geográficas do Azure. Ele oferece garantias de taxa de transferência, disponibilidade, latência e consistência com contratos de nível de serviço (SLAs) abrangentes. O Azure Cosmos DB fornece APIs para os seguintes modelos de dados com SDKs disponíveis em vários idiomas:
- API do SQL
- API do MongoDB
- API Cassandra
- API do Graph (Gremlin)
- API de Tabela
Este artigo explica como ler e gravar dados no Azure Cosmos DB usando o Azure Databricks. Para obter as informações mais atualizadas sobre o Azure Cosmos DB, consulte Acelere a análise de big data usando o conector do Apache Spark para o Azure Cosmos DB.
Recursos:
Importante
Este conector dá suporte à API (SQL) de núcleo do Azure Cosmos DB. Para o Cosmos DB para a API do MongoDB, use o conector do Spark do MongoDB. Para o API do Cassandra do Cosmos DB, use o Conector do Spark do Cassandra.
Criar e anexar as bibliotecas necessárias
- Baixe a biblioteca azure-cosmosdb-spark mais recente para a versão do Apache Spark que você está executando.
- Carregue os arquivos JAR baixados no Databricks. Consulte Bibliotecas.
- Instale as bibliotecas carregadas no cluster do Databricks.