Partager via


Choisir la configuration du runtime d’intégration appropriée pour votre scénario

Le runtime d’intégration (IR) est l’infrastructure de calcul utilisée par Microsoft Purview pour alimenter l’analyse des données dans différents environnements réseau. Cet article présente les différents types de runtime d’intégration disponibles dans Microsoft Purview et fournit des conseils sur la façon de choisir la configuration du runtime d’intégration appropriée pour votre scénario.

Types de runtimes d’intégration

Microsoft Purview fournit les types de runtimes d’intégration suivants :

  • Runtime d’intégration Azure : le runtime d’intégration Azure est un calcul entièrement managé et élastique que vous pouvez utiliser pour analyser des sources de données Azure ou non-Azure. Azure IR prend en charge les connexions aux magasins de données et aux services de calcul avec des points de terminaison accessibles publiquement. Il s’agit du runtime d’intégration par défaut dont vous n’avez pas besoin pour créer quoi que ce soit pour commencer.
  • Runtime d’intégration managed Réseau virtuel (VNet) : vous pouvez créer un runtime d’intégration de réseau virtuel managé, qui réside dans un Réseau virtuel managé Microsoft Purview. Il peut utiliser des points de terminaison privés pour se connecter et analyser en toute sécurité les sources de données prises en charge. Pour plus d’informations, consultez Managed Réseau virtuel et points de terminaison privés managés.
  • Runtime d’intégration auto-hébergé : le runtime d’intégration auto-hébergé peut être utilisé pour analyser des sources de données dans un réseau local ou un réseau virtuel. Vous pouvez l’installer sur un ordinateur local ou une machine virtuelle à l’intérieur de votre réseau privé. Pour plus d’informations, consultez Créer et gérer des runtimes d’intégration auto-hébergés.
  • Runtime d’intégration auto-hébergé pris en charge par Kubernetes (préversion) : ce runtime d’intégration est hébergé sur un cluster Kubernetes et peut être utilisé pour analyser des sources de données dans un réseau local ou un réseau virtuel. La prise en charge de Kubernetes améliore les performances globales et permet au runtime d’intégration de s’adapter au travail. Pour en savoir plus, consultez Créer et gérer des runtimes d’intégration auto-hébergés pris en charge par Kubernetes
  • Runtime d’intégration AWS : le runtime d’intégration AWS est un runtime d’intégration entièrement managé et élastique hébergé par Microsoft Purview dans AWS. Elle s’applique lors de l’analyse de sources de données Amazon telles que S3, RDS.

Choisir le runtime d’intégration approprié

Il est important de choisir un type de runtime d’intégration approprié. Non seulement elle doit être adaptée à votre architecture et à vos exigences existantes pour l’intégration des données, mais vous devez également réfléchir à la façon de répondre aux besoins croissants de l’entreprise et à toute augmentation future de la charge de travail.

La considération suivante peut vous aider à prendre la décision :

  1. Quels types de sources de données souhaitez-vous analyser ?

    Consultez la section Sources de données prises en charge pour en savoir plus sur les types de runtime d’intégration pris en charge pour les sources de données que vous souhaitez analyser.

  2. Quel est le contrôle d’accès réseau sur votre source de données ?

    Une source de données différente peut avoir des paramètres de pare-feu réseau différents pour la protéger contre l’accès aléatoire sur Internet, qu’il s’agit d’un magasin de données local ou cloud/SaaS. Le tableau suivant répertorie certaines options de pare-feu courantes. Vous pouvez choisir le type de runtime d’intégration pris en charge en fonction de votre scénario.

    Pare-feu de source de données Azure IR Runtime d’intégration de réseau virtuel managé SHIR Kubernetes pris en charge par SHIR
    Autoriser l’accès public
    Autoriser le service Azure ou le service approuvé
    Autoriser l’accès à partir d’un réseau virtuel Azure spécifique ✓ (avec prise en charge des points de terminaison privés managés)
    Autoriser une plage d’adresses IP/IP spécifiques
    Autre accès réseau local ou privé
  3. Quel est le paramètre de pare-feu de votre Microsoft Purview ?

    Microsoft Purview fournit différentes options de pare-feu réseau. Pour plus d’informations, consultez Configurer le pare-feu Microsoft Purview. Vous pouvez choisir le type de runtime d’intégration pris en charge en fonction de votre scénario.

    Pare-feu Purview Azure IR Runtime d’intégration de réseau virtuel managé SHIR Kubernetes pris en charge par SHIR
    Activé à partir de tous les réseaux
    Désactivé à partir de tous les réseaux ✓ (point de terminaison privé managé requis) ✓ (besoin de créer un point de terminaison privé à partir de votre réseau) ✓ (besoin de créer un point de terminaison privé à partir de votre réseau)
  4. Quel niveau de sécurité avez-vous besoin lors de la transmission des données ?

    L’emplacement du runtime d’intégration définit l’emplacement de son calcul principal et l’emplacement où les opérations d’analyse sont effectuées. Pour prendre en compte la résidence des données :

    • Lorsque vous utilisez Azure IR, Microsoft Purview détecte automatiquement l’emplacement de la source de données et utilise le runtime d’intégration dans cette région. Si Microsoft Purview ne peut pas détecter la région, il utilise la région du compte Purview.
    • Lorsque vous utilisez managed VNet IR, il s’exécute dans la région que vous configurez pour le réseau virtuel managé.
    • Lorsque vous utilisez SHIR, vous pouvez décider entièrement de l’emplacement dans vos machines virtuelles locales ou Azure.

    Pour vous défendre contre, par exemple, les attaques de l’intercepteur lors de la transmission de données, vous pouvez choisir d’utiliser un point de terminaison privé et Private Link pour garantir la sécurité des données.

    • Vous pouvez créer des points de terminaison privés managés pour vos magasins de données lors de l’utilisation du runtime d’intégration de réseau virtuel managé. Les points de terminaison privés sont gérés par le service Microsoft Purview au sein du réseau virtuel managé.
    • Vous pouvez également créer des points de terminaison privés dans votre réseau virtuel et le SHIR peut les utiliser pour accéder aux magasins de données.
  5. Quel niveau de maintenance pouvez-vous fournir ?

    La maintenance de l’infrastructure, des serveurs et de l’équipement est l’une des tâches importantes du service informatique d’une entreprise. Cela prend généralement beaucoup de temps et d’efforts.

    • Lorsque vous utilisez Azure IR et managed VNet IR, vous n’avez pas à vous soucier de la maintenance, telle que la mise à jour, le correctif et la version. Le service Microsoft Purview prend en charge tous les efforts de maintenance.
    • Étant donné que le SHIR est installé sur vos machines et que le SHIR pris en charge par Kubernetes se trouve sur vos clusters Kubernetes, vous devez gérer la maintenance.
  6. Performances et évolutivité

    Nous vous recommandons d’utiliser le runtime d’intégration Azure complètement managé et mis à l’échelle automatiquement, le runtime d’intégration de réseau virtuel managé ou le runtime d’intégration auto-hébergé pris en charge par Kubernetes, le cas échéant. Avec l’élasticité, ils peuvent vous offrir de meilleures performances et scalabilité, en particulier lors de l’analyse de systèmes de données à grande échelle.

Sources de données prises en charge

Le tableau ci-dessous présente toutes les sources de données prises en charge par l’analyse Microsoft Purview, ainsi que les types de runtime d’intégration pris en charge.

Catégorie Magasin de données pris en charge Azure IR/AWS IR Runtime d’intégration de réseau virtuel managé SHIR Kubernetes SHIR
Azure Plusieurs sources
Stockage Blob Azure ✓ (y compris point de terminaison privé managé)
Azure Cosmos DB (API pour NoSQL) ✓ (y compris point de terminaison privé managé)
Explorateur de données Azure ✓ (v2 uniquement)
Azure Data Lake Storage Gen1 ✓ (v2 uniquement)
Azure Data Lake Storage Gen2 ✓ (y compris point de terminaison privé managé)
Base de données Azure pour MySQL ✓ (y compris point de terminaison privé managé)
Base de données Azure pour PostgreSQL ✓ (y compris point de terminaison privé managé)
Azure Databricks Hive Metastore
Catalogue Unity d' Azure Databricks ✓ (v2 uniquement, y compris point de terminaison privé managé)
Pool SQL dédié Azure (anciennement SQL DW) ✓ (y compris point de terminaison privé managé)
Azure Files ✓ (y compris point de terminaison privé managé)
Base de données Azure SQL ✓ (y compris point de terminaison privé managé)
Azure SQL Managed Instance ✓ (y compris point de terminaison privé managé)
Analytique Azure Synapse (Espace de travail) ✓ (y compris point de terminaison privé managé)
Database Amazon RDS
Amazon Redshift
Cassandra ✓ (v2 uniquement)
Db2
Google BigQuery
Base de données Hive Metastore
MongoDB
MySQL ✓ (v2 uniquement, y compris point de terminaison privé managé)
Oracle
PostgreSQL ✓ (v2 uniquement)
SAP Business Warehouse (entrepôt de données)
SAP HANA
Snowflake ✓ (v2 uniquement)
SQL Server
SQL Server sur Azure-Arc
Teradata
Fichier Amazon S3
HDFS
Services et applications Dataverse ✓ (v2 uniquement)
Erwin
Looker ✓ (v2 uniquement)
Fabric ✓ (v2 uniquement)
Power BI ✓ (v2 uniquement)
Qlik Sense Mobile ✓ (v2 uniquement)
Salesforce ✓ (v2 uniquement)
SAP ECC
SAP S/4HANA
Tableau ✓ (v2 uniquement)