Azure Cosmos DB
Importante
Esta documentação foi desativada e pode não ser atualizada. Veja o repositório oficial do Github do conector Cosmos DB Spark.
O Azure Cosmos DB é uma base de dados com múltiplos modelos distribuída globalmente da Microsoft. O Azure Cosmos DB permite dimensionar de forma elástica e independente a taxa de transferência e o armazenamento em qualquer número de regiões geográficas do Azure. Ele oferece garantia de rendimento, latência, disponibilidade e consistência com SLAs (Service Level Agreements, contratos de nível de serviço) abrangentes. O Azure Cosmos DB fornece APIs para os seguintes modelos de dados, com SDKs disponíveis em vários idiomas:
- API de SQL
- API do MongoDB
- API de Cassandra
- API do Graph (Gremlin)
- API de Tabela
Este artigo explica como ler e gravar dados no Azure Cosmos DB usando o Azure Databricks. Para obter mais detalhes atualizados sobre o Azure Cosmos DB, consulte Acelerar a análise de big data usando o conector Apache Spark to Azure Cosmos DB.
Recursos:
Importante
Este conector suporta a API principal (SQL) do Azure Cosmos DB. Para a API do Cosmos DB for MongoDB, use o conector MongoDB Spark. Para a API Cassandra do Cosmos DB, use o conector Cassandra Spark.
Criar e anexar bibliotecas necessárias
- Baixe a biblioteca azure-cosmosdb-spark mais recente para a versão do Apache Spark que você está executando.
- Carregue os arquivos JAR baixados para o Databricks. Consulte Bibliotecas.
- Instalar bibliotecas carregadas no cluster do Databricks.