Azure Cosmos DB
Importante
Esta documentación se ha retirado y es posible que no se actualice. Consulte el repositorio oficial de Github del conector de Spark de Cosmos DB.
Azure Cosmos DB es la base de datos multimodelo de distribución global de Microsoft. Azure Cosmos DB permite escalar de forma elástica e individual el rendimiento y el almacenamiento en cualquiera de las regiones geográficas de Azure. Ofrece garantía de rendimiento, latencia, disponibilidad y coherencia con Acuerdos de Nivel de Servicio (SLA) integrales. Azure Cosmos DB proporciona API para los siguientes modelos de datos, con SDK disponibles en varios idiomas:
- API DE SQL
- MongoDB API
- Cassandra API
- API de Graph (Gremlin)
- Table API
En este artículo se explica cómo leer datos en Azure Cosmos DB y escribir datos en el servicio mediante Azure Databricks. Para obtener la información más actualizada sobre Azure Cosmos DB, consulte Aceleración del análisis de macrodatos mediante el conector de Apache Spark a Azure Cosmos DB.
Recursos:
Importante
Este conector admite la API Core (SQL) de Azure Cosmos DB. Si va a usar Cosmos DB para la API de MongoDB, use el conector de Spark de MongoDB. En el caso de Cosmos DB Cassandra API, use el conector Spark de Cassandra.
Creación y asociación de las bibliotecas necesarias
- Descargue la biblioteca azure-cosmosdb-spark más reciente para la versión de Apache Spark que está ejecutando.
- Cargue los archivos JAR descargados en Databricks. Consulte Bibliotecas.
- Instale las bibliotecas cargadas en el clúster de Databricks.