Accès aux produits de données dans Databricks Marketplace (espaces de travail compatibles avec Unity Catalog)
Cet article explique comment accéder aux produits de données dans la Place de marché Databricks si vous disposez d’un espace de travail Azure Databricks activé pour Unity Catalog.
Remarque
Si vous n’avez pas d’espace de travail Azure Databricks activé pour Unity Catalog, vous pouvez accéder aux produits de données de la Place de marché partagée à l’aide des connecteurs de partage ouvert Delta Sharing. Voir Accès aux produits de données dans Databricks Marketplace à l’aide de plateformes externes.
Vue d’ensemble
La Place de marché Databricks vous offre, en tant que consommateur de données, une plateforme sécurisée pour découvrir les produits de données dont votre organisation a besoin pour réussir. La Place de marché Databricks utilise Delta Sharing pour assurer la sécurité et le contrôle des données partagées. Les consommateurs peuvent accéder à des données publiques, des exemples de données gratuits et des offres de données commercialisées. Les consommateurs qui utilisent un espace de travail Azure Databricks avec Unity Catalog ne sont pas limités à l’accès aux données tabulaires : ils peuvent aussi accéder aux volumes (données non tabulaires), aux modèles d’IA, aux notebooks Databricks et aux accélérateurs de solution Databricks.
Lorsque vous consommez des produits de données de la Place de marché à l’aide d’un espace de travail Azure Databricks activé pour Unity Catalog, vous pouvez tirer parti de l’intégration approfondie entre Delta Sharing et Unity Catalog, ainsi que la gouvernance, l’audit et les interfaces pratiques de Unity Catalog.
Avant de commencer
Pour parcourir les listes de produits de données sur la Place de marché Databricks, vous pouvez utiliser l’une des options suivantes :
- La Place de marché ouverte.
- Un espace de travail Azure Databricks.
Pour consommer des produits de données à l’aide d’un espace de travail Databricks activé pour Unity Catalog vous devez disposer des éléments suivants :
Un compte Azure Databricks dans le plan Premium.
Un espace de travail Azure Databricks activé pour Unity Catalog (bien entendu). Consultez Activer un espace de travail pour le Catalogue Unity.
Si vous n’en avez pas, vous pouvez obtenir un essai gratuit. Cliquez sur Essayer gratuitement sur la Place de marché ouverte et suivez les invites pour commencer votre essai.
Important
Vous n’avez pas besoin d’activer tous vos espaces de travail pour Unity Catalog. Vous pouvez en créer un nouveau et l’activer pour Unity Catalog afin d’utiliser cet espace de travail pour recevoir des produits de données de la Place de marché. Si cette option n’est pas disponible, utilisez l’option Place de marché sur des plateformes externes. Voir Accès aux produits de données dans Databricks Marketplace à l’aide de plateformes externes.
Pour savoir comment activer un espace de travail pour Unity Catalog, consultez Configurer et gérer Unity Catalog.
USE MARKETPLACE ASSETS
autorisation sur le metastore Unity Catalog attaché à l’espace de travail. Voir Types de privilèges s’appliquant uniquement au partage Delta ou à la Place de marché Databricks. Cette autorisation est activée par défaut pour tous les metastore Unity Catalog.Si votre administrateur a désactivé ce privilège, vous pouvez demander qu’il vous l’accorde ou qu’il vous accorde l’une des options suivantes :
- Les autorisations
CREATE CATALOG
etUSE PROVIDER
sur le metastore Unity Catalog. - Le rôle Administrateur de metastore.
Si vous n’avez aucun de ces privilèges, vous pouvez toujours afficher les offres de la Place de marché, mais vous ne pouvez pas accéder aux produits de données à l’aide de Unity Catalog.
Pour plus d’informations, consultez Privilèges et objets sécurisables Unity Catalog et Gérer les privilèges dans Unity Catalog. Voir aussi Désactiver l’accès à la Place de marché.
- Les autorisations
Parcourir les offres de la Place de marché Databricks
Pour trouver un produit de données souhaité, il vous suffit de parcourir ou de rechercher les offres de produits de données dans la Place de marché Databricks.
Remarque
En guise d’alternative aux instructions qui suivent, vous pouvez rechercher des descriptions de la Place de marché à l’aide de la barre de recherche globale en haut de votre espace de travail Azure Databricks. Consultez Recherche des objets de l’espace de travail. Vous pouvez également afficher et demander des exemples de données gratuits sur la page Ajouter des données. Dans la barre latérale de l’espace de travail, cliquez sur Ingestion des données, puis faites défiler vers le bas jusqu’à Exemples de données gratuites de la Place de marché Databricks.
Accédez à marketplace.databricks.com ou connectez-vous à votre espace de travail Azure Databricks et cliquez sur Place de marché.
Parcourez ou recherchez le produit de données souhaité.
Vous pouvez filtrer les listes par type de produit (jeu de données, accélérateur de solution ou modèle Machine Learning), nom du fournisseur, catégorie, coût (gratuit ou payant) ou recherche de mots clés.
Si vous êtes connecté à un espace de travail Azure Databricks, vous pouvez également choisir d’afficher uniquement les listes privées qui vous sont accessibles dans le cadre d’un échange privé. Voir Participer à des échanges privés.
Demander l’accès à des produits de données dans la Place de marché
Pour effectuer une requête d’accès aux des produits de données, vous devez être connecté à un espace de travail Azure Databricks. Certains produits de données sont disponibles immédiatement, tandis que d’autres nécessitent l’approbation du fournisseur et l’achèvement d’une transaction à l’aide des interfaces des fournisseurs.
Spécifications
Voir Avant de commencer. Pour accéder à des produits de données dans la Place de marché, vous devez disposer au moins du privilège USE MARKETPLACE ASSETS
sur le metastore Unity Catalog attaché à l’espace de travail que vous utilisez.
Accéder à des produits de données disponibles instantanément
Certains produits de données sont disponibles instantanément, ce qui vous oblige uniquement à les demander et à accepter les conditions. Ceux-ci sont répertoriés sous l’en-tête Gratuit et instantanément disponible sur la page d’accueil de la Place de marché. Ils sont identifiés sur la vignette d’offre comme étant Gratuit et identifiés comme Instantanément disponibles sur la page de détails de l’offre.
Une fois que vous avez trouvé une offre qui vous intéresse sur la page d’accueil de la Place de marché, cliquez sur l’offre pour ouvrir la page de détails de l’offre.
Cliquez sur le bouton Obtenir un accès instantané et acceptez les conditions générales de Databricks.
L’accès aux accélérateurs de solution Databricks fonctionne un peu différemment. Consultez Obtenir l’accès aux accélérateurs de solution Databricks.
(Facultatif) Sous Plus d’options, modifiez le nom de catalogue suggéré.
Le nom du catalogue s’affiche dans Catalog Explorer dans votre espace de travail Azure Databricks, et il est utilisé dans l’espace de noms en trois parties (catalog.schema.table|volume|view) dans les requêtes. Vous pouvez modifier le nom par défaut.
Cliquez sur le bouton Obtenir un accès instantané.
Cliquez sur le bouton Ouvrir pour afficher le produit de données, qui apparaît sous la forme d’un catalogue en lecture seule dans Catalog Explorer.
Pour plus d’informations sur la gestion de l’accès aux catalogues dans Azure Databricks, consultez Accéder aux données partagées à l’aide de Unity Catalog.
Si des exemples de notebooks sont disponibles, ils apparaissent sous l’en-tête Exemples de notebooks de l’offre.
Pour afficher un notebook, cliquez sur le bouton Aperçu du notebook. Pour importer un notebook dans votre espace de travail Azure Databricks afin de pouvoir l’exécuter, cliquez sur Préversion du notebook, puis sur Importer un notebook. Consultez Présentation des notebooks Databricks.
Demander des produits de données qui nécessitent l’approbation du fournisseur
Certains produits de données nécessitent l’approbation du fournisseur, généralement parce qu’une transaction commerciale est impliquée, ou le fournisseur peut préférer personnaliser les produits de données selon vos besoins. Ces offres sont identifiées sur la page de détails de l’offre en tant que Sur demande et incluent un bouton Demander l’accès .
Une fois que vous avez trouvé une offre qui vous intéresse sur la page d’accueil de la Place de marché, cliquez sur l’offre pour ouvrir la page de détails de l’offre.
Cliquez sur le bouton Demander l’accès.
Entrez votre nom, votre société et une brève description de l’utilisation prévue pour le produit de données.
Acceptez les conditions générales de Databricks et cliquez sur Demander l’accès.
Vous serez averti par e-mail lorsque le fournisseur a terminé son examen de votre demande.
Vous pouvez également surveiller la progression de votre demande sur la page Mes demandes de la Place de marché. Voir Gérer les produits de données partagés Databricks Marketplace. Toutefois, toutes les transactions qui suivent utilisent les plateformes de communication et de paiement des fournisseurs. Aucune transaction commerciale n’est gérée directement sur la Place de marché Databricks.
Une fois votre transaction terminée, le fournisseur de données met le produit de données à votre disposition en tant que catalogue en lecture seule dans votre espace de travail.
Pour plus d’informations sur la gestion de l’accès aux catalogues dans Azure Databricks, consultez Accéder aux données partagées à l’aide de Unity Catalog.
Accéder aux accélérateurs de solution Databricks
Contrairement à d’autres ressources de données, les accélérateurs de solution Databricks sont partagés en clonant des référentiels Git et en les rendant disponibles dans des dossiers Git Databricks. Pour accéder à un accélérateur de solution :
- Dans la Place de marché, cliquez sur la liste Accélérateur de solution pour ouvrir la page de détails de la liste.
- Cliquez sur le bouton Obtenir un accès instantané.
- Dans la boîte de dialogue Ajouter un dossier Git, entrez un nom pour le référentiel. Ce nom s’affiche dans les interfaces utilisateur des dossiers Git Databricks.
- Acceptez les conditions générales de Databricks et cliquez sur Créer un dossier Git.
- Cliquez sur le bouton Ouvrir et sélectionnez Dossier Git pour afficher le référentiel dans le navigateur de fichiers de l’espace de travail.
Accéder aux données partagées à l’aide de Unity Catalog
L’accès aux données dans votre espace de travail Azure Databricks dépend du type de produit de données :
Les jeux de données de la Place de marché sont partagés avec vous dans un catalogue en lecture seule dans Azure Databricks. Les catalogues sont le conteneur de niveau supérieur pour les ressources de données gérées par Unity Catalog. Pour plus d’informations sur la hiérarchie des objets de données dans Unity Catalog, consultez Objets de base de données dans Azure Databricks.
Une fois que le fournisseur a partagé les données avec vous, vous disposez de plusieurs façons d’accéder au catalogue. Les sections suivantes décrivent certaines de ces options d’accès.
Les notebooks sont partagés directement dans la liste de la Place de marché et vous pouvez les importer à partir de la liste dans votre espace de travail.
Les accélérateurs de solution sont partagés en tant que dossiers Git Databricks. Consultez Obtenir l’accès aux accélérateurs de solution Databricks.
Accéder aux jeux de données partagés dans la Place de marché
Pour accéder aux données partagées à partir de la Place de marché :
Dans la barre latérale, cliquez sur Place de marché.
Sur la page d’accueil de la Place de marché, cliquez sur Mes demandes dans le coin supérieur droit.
Dans l’onglet Produits de données installés, recherchez le produit de données, cliquez sur le menu Kebab à la fin de la ligne du produit de données, puis sélectionnez Afficher les données.
Vous pouvez également cliquer sur le nom du produit de données pour ouvrir la page des détails du produit de données, où vous pouvez cliquer sur le bouton Ouvrir pour afficher les données.
Catalog Explorer s’ouvre sur le catalogue qui contient le jeu de données, où vous pouvez accéder aux données ou gérer l’accès d’autres membres de l’équipe. Consultez Accorder l’accès à d’autres membres de l’équipe.
Pour en savoir plus sur l’accès aux données partagées dans Azure Databricks, consultez Lire les données partagées à l’aide du partage Delta Databricks-to-Databricks (pour les destinataires).
Accéder aux jeux de données partagés dans l’Explorateur de catalogues
Pour accéder aux données partagées directement à partir de Catalog Explorer :
- Dans la barre latérale, cliquez sur Catalogue.
- Si vous connaissez le nom du catalogue qui contient les données partagées, recherchez-le et sélectionnez-le.
Si vous ne connaissez pas le nom du catalogue, mais que vous connaissez le nom du fournisseur, vous pouvez trouver le catalogue dans Catalog Explorer en procédant comme suit :
- Dans la barre latérale, cliquez sur Catalogue.
- Dans le volet gauche de Catalog Explorer, cliquez sur Partage Delta, puis Partagé avec moi.
- Sous l’onglet Fournisseurs, cliquez sur le nom du fournisseur.
- Sous l’onglet Partages , recherchez le nom du catalogue et cliquez dessus pour l’ouvrir.
Accéder aux jeux de données partagés à l’aide de l’interface CLI Databricks ou d’instructions SQL
Vous pouvez également rechercher et accéder au catalogue qui contient les données partagées à l’aide de l’interface CLI Databricks ou des instructions SQL dans un notebook Azure Databricks ou un éditeur de requêtes SQL Databricks. Pour plus d’informations, consultez Accéder aux données dans une table partagée ou dans un volume. Vous pouvez ignorer les sections qui décrivent comment créer un catalogue, car la Place de marché Databricks le fait pour vous.
Accorder l’accès à d’autres membres de l’équipe
Si vous êtes l’utilisateur qui a demandé les données partagées, vous êtes le propriétaire du catalogue qui contient ces données dans votre espace de travail. Par conséquent, vous pouvez accorder aux membres de votre équipe l’accès au catalogue et affiner l’accès au niveau du schéma, de la table, de la vue, de la ligne et de la colonne, comme vous le faites pour toutes les données dans Unity Catalog. Consultez Gérer les privilèges dans Unity Catalog. Cela dit, les données de table et de vue sous un catalogue partagé sont en lecture seule, ce qui signifie que vous pouvez uniquement accorder à votre équipe des opérations de lecture telles que DESCRIBE
, SHOW
et SELECT
.
Vous pouvez également transférer la propriété du catalogue ou des objets qu’il contient.
Afficher des exemples de notebooks
Certaines offres incluent des exemples de notebooks sur la page de détails de l’offre. Pour accéder à ces notebooks pour des offres disponibles instantanément qui ont été partagées avec vous :
- Dans la barre latérale, cliquez sur Place de marché.
- Sur la page d’accueil de la Place de marché, cliquez sur Mes demandes dans le coin supérieur droit.
- Dans l’onglet Produits de données installés, recherchez le produit de données et cliquez sur son nom pour ouvrir la page des détails de l’offre. S’il existe un exemple de notebook, il apparaît sous l’en-tête Exemple de notebook dans la liste.
- Cliquez sur Aperçu du notebook pour afficher le notebook, puis cliquez sur Importer le notebook pour l’importer dans votre espace de travail Azure Databricks.
Remarque
L’affichage et l’aperçu Exemples de notebooks dans l’interface utilisateur des offres ne fonctionnent pas dans Chrome en mode Incognito.
Participer à des échanges privés
Certains fournisseurs de données peuvent souhaiter partager certaines données avec un ensemble limité de consommateurs qui sont invités à faire partie d’un échange privé. Vous pouvez trouver des offres d’échange privé en cochant la case Échange privé sur la page d’accueil de la Place de marché. Tout comme pour les offres publiques, vous pouvez accéder instantanément aux offres gratuites ou demander l’accès à celles qui sont marquées Sur demande.
Pour rejoindre un échange privé, un fournisseur de données doit inviter votre organisation. Dans ce cas, ils demandent un identificateur partagé pour votre metastore Unity Catalog. Pour savoir comment obtenir l’identificateur de partage de votre metastore, consultez l’étape 1 dans Obtenir l’accès dans le modèle de Databricks à Databricks.
Pour en savoir plus sur les échanges privés, consultez Créer et gérer des échanges privés dans la Place de marché Databricks.
Désactiver l’accès à la Place de marché
Par défaut, tous les utilisateurs de n’importe quel espace de travail avec Unity Catalog ont la possibilité de demander des produits de données dans la Place de marché Databricks. En d’autres termes, le groupe account users
dispose du privilège USE MARKETPLACE ASSETS
sur tous les metastores Unity Catalog, sauf si un administrateur de metastore révoque ce privilège.
Ce privilège ne permet pas de participer à des transactions financières avec des fournisseurs de données. Toutes les transactions financières ont lieu en dehors d’Azure Databricks. Ce privilège permet d’accéder aux produits de données étiquetés Gratuit et instantanément disponibles et aux produits de données qui ont déjà été achetés. L’accès à ces produits de données crée de nouveaux catalogues en lecture seule dans Azure Databricks appartenant au demandeur, qui peut accorder un accès en lecture seule à d’autres utilisateurs.
Un administrateur de metastore peut désactiver la capacité de tous les utilisateurs à demander des produits de données dans la Place de marché Databricks en révoquant le privilège USE MARKETPLACE ASSETS
du groupe account users
sur le metastore Unity Catalog. Si vous révoquez ce privilège, les utilisateurs peuvent continuer à parcourir la Place de marché Databricks dans leur espace de travail, mais ne peuvent pas demander de produits de données.
Autorisation requise : administrateur de metastore
Remarque
Si votre espace de travail a été activé automatiquement pour Unity Catalog, vous n’avez peut-être pas d’administrateur de metastore. Pour plus d’informations, consultez Activation automatique de Unity Catalog.
Explorateur de catalogues
Pour révoquer le privilège USE MARKETPLACE ASSETS
pour le groupe account users
:
- Dans votre espace de travail Azure Databricks, cliquez sur Catalogue.
- Cliquez sur l’icône de lien en regard du nom du metastore en haut à gauche.
- Recherchez la ligne qui accorde à
account users
le privilègeUSE MARKETPLACE ASSETS
. - Cochez la case en regard de la ligne, puis cliquez sur le bouton Révoquer.
- Confirmez l’action de révocation.
- Accordez l’autorisation à tous les utilisateurs et groupes spécifiques souhaités en cliquant sur le bouton Accorder.
SQL
Pour révoquer le privilège USE MARKETPLACE ASSETS
pour le groupe account users
, exécutez la commande suivante dans un notebook ou dans l’éditeur de requêtes SQL Databricks.
REVOKE USE MARKETPLACE ASSETS ON METASTORE FROM `account users`;
Pour accorder le privilège USE MARKETPLACE ASSETS
à un utilisateur ou un groupe spécifique, exécutez la commande suivante dans un notebook ou dans l’éditeur de requête SQL Databricks.
GRANT USE MARKETPLACE ASSETS ON METASTORE TO `<user-or-group>`;
Si vous ne souhaitez pas que vos utilisateurs puissent afficher la page d’accueil de Marketplace, contactez l’équipe de votre compte Azure Databricks.
Problèmes connus
Si une demande d’accès est rejetée par le fournisseur de données, vous ne pouvez pas demander à nouveau le même produit de données. Si vous rencontrez ce problème, contactez votre fournisseur ou l’équipe de compte Azure Databricks.
Partager vos commentaires
Nous aimerions savoir ce que vous pensez de la Place de marché Databricks.
- Vous avez des commentaires ? Accédez à Apprendre > Fournir des commentaires sur la page d’accueil de la Place de marché.
- Vous souhaitez voir des jeux de données supplémentaires sur la Place de marché ? Cliquez sur Suggérer un produit dans la bannière de la page d’accueil de la Place de marché.