Partilhar via


Azure Cosmos DB

Importante

Esta documentação foi desativada e pode não ser atualizada. Veja o repositório oficial do Github do conector Cosmos DB Spark.

O Azure Cosmos DB é uma base de dados com múltiplos modelos distribuída globalmente da Microsoft. O Azure Cosmos DB permite dimensionar de forma elástica e independente a taxa de transferência e o armazenamento em qualquer número de regiões geográficas do Azure. Ele oferece garantia de rendimento, latência, disponibilidade e consistência com SLAs (Service Level Agreements, contratos de nível de serviço) abrangentes. O Azure Cosmos DB fornece APIs para os seguintes modelos de dados, com SDKs disponíveis em vários idiomas:

  • API de SQL
  • API do MongoDB
  • API de Cassandra
  • API do Graph (Gremlin)
  • API de Tabela

Este artigo explica como ler e gravar dados no Azure Cosmos DB usando o Azure Databricks. Para obter mais detalhes atualizados sobre o Azure Cosmos DB, consulte Acelerar a análise de big data usando o conector Apache Spark to Azure Cosmos DB.

Recursos:

Importante

Este conector suporta a API principal (SQL) do Azure Cosmos DB. Para a API do Cosmos DB for MongoDB, use o conector MongoDB Spark. Para a API Cassandra do Cosmos DB, use o conector Cassandra Spark.

Criar e anexar bibliotecas necessárias

  1. Baixe a biblioteca azure-cosmosdb-spark mais recente para a versão do Apache Spark que você está executando.
  2. Carregue os arquivos JAR baixados para o Databricks. Consulte Bibliotecas.
  3. Instalar bibliotecas carregadas no cluster do Databricks.