Quand utiliser Azure Data Explorer
Ici, nous allons vous aider à déterminer si Azure Data Explorer constitue le bon choix pour vos besoins d’analytique de Big Data. En évaluant les critères suivants, vous pouvez déterminer si Azure Data Explorer répond à vos objectifs fonctionnels et de performances.
- Analytique interactive
- Variété des données
- Vélocité des données
- Volume de données
- Organisation des données
- Simultanéité de requête
- Créer ou acheter
Critères de décision
Azure Data Explorer est une plateforme d’analytique interactive de Big Data qui permet aux utilisateurs de prendre des décisions pilotées par les données dans un environnement hautement agile. Les facteurs listés ici peuvent vous aider à évaluer si Azure Data Explorer est adapté à la charge de travail en cours. Posez-vous les questions clés suivantes :
Analytique interactive
Est-ce que je dois analyser les données de manière interactive ?
L’analyse des données comprend des techniques, telles que l’agrégation, la délimitation, l’évaluation, la corrélation, la détection des anomalies, les prévisions et l’évaluation générale du modèle, qui permettent de réduire les grandes quantités de données en conclusions actionnables. La réalisation de ces activités en interactivité est l’un des avantages d’Azure Data Explorer. Ces activités peuvent avoir lieu dans des tableaux de bord interactifs, dans une application personnalisée analytique ou via une interaction directe avec des données via des requêtes et une visualisation conviviales. Azure Data Explorer n’est peut-être pas la bonne technologie pour exécuter des travaux par lots de longue durée sur les données. Envisagez d’utiliser des technologies comme Microsoft Spark qui fonctionnent bien avec Azure Data Explorer pour les tâches de longue durée.
Variété des données
Est-ce que la structure de mes données est variée ?
Azure Data Explorer fournit un index de recherche en texte intégral haute performance évolutif et prend en charge les schémas dynamiques. Si vous avez besoin d’analyser et de traiter des données structurées, semi-structurées (json/xml) et texte, Azure Data Explorer est approprié à votre charge de travail.
Vélocité des données
L’analyse des données en temps réel est-elle un facteur essentiel ?
Azure Data Explorer peut ingérer rapidement et en faible latence une quantité considérable de données. Un jeu de données typique comprend des traces, des journaux des transactions, des séries chronologiques, des métriques et généralement des flux d’enregistrements d’activité. Une analytique en quasi-temps réel sur de nouvelles données est un cas d’usage courant. Azure Data Explorer se connecte bien aux technologies de streaming comme Azure Event Hubs, IoT Hubs, Kafka pour alimenter ces charges de travail. Toutefois, si vous avez besoin d’une analytique en temps réel, Azure Data Explorer risque de ne pas être la meilleure option.
Volume de données
Quelle quantité de données ai-je besoin d’ingérer ?
Azure Data Explorer est conçu pour fournir une analytique de chemin chaud, interactive ou via des API, sur des charges de travail de données volumineuses. Pour les scénarios où la taille totale des données accumulées est de quelques gigaoctets, il peut y avoir d’autres solutions plus rentables.
Organisation des données
Avec quel degré de cohérence sont organisées mes données ?
Azure Data Explorer est conçu pour appliquer un schéma à la lecture sur des données brutes. Cette approche offre la flexibilité nécessaire pour examiner les données de différentes façons et à partir de différents points de vue en fonction des besoins actuels. Cette fonctionnalité est utile pour répondre à des défis inattendus comme vous pouvez en trouver dans des environnements de sécurité, d’exploitation et de concurrence, entre autres. Azure Data Explorer offre une vitesse, une scalabilité et une rentabilité extrêmes pour analyser des données brutes. Souvent, dans les déploiements d’entreposage de données, un processus d’extraction, de transformation, de chargement (ETL) génère régulièrement un ensemble bien organisé, hautement cohérent et bien documenté d’entités et d’attributs. Les analyses sur ces schémas en étoile complexes impliquent généralement des jointures de fait-à-fait-à-fait importantes pour lesquelles Azure Data Explorer n’est pas optimisé.
Simultanéité de requête
Combien d’utilisateurs doivent interroger/ingérer/traiter les données en même temps ?
Azure Data Explorer est largement utilisé pour implémenter des produits SaaS analytiques. Si vous devez prendre en charge des besoins d’analyse variables et uniques d’un grand nombre de requêtes en parallèle, Azure Data Explorer devrait constituer une bonne solution.
Créer ou acheter
Dans quelle mesure dois-je personnaliser ma plateforme de données ?
Azure Data Explorer est une plateforme en tant que service complètement managée. Toutefois, il ne fournit pas de solution clé en main prête à l’emploi. Il demande en effet de personnaliser, configurer, connecter et créer des expériences pour fournir une solution (créer). Il existe différentes solutions, de Microsoft et de tiers qui utilisent Azure Data Explorer pour fournir ces solutions clés en main dans différents domaines et secteurs verticaux. Par exemple, Azure Monitor pour les opérations informatiques. Microsoft Advanced Threat Protection et Microsoft Sentinel dans le domaine de sécurité, Azure Time Series Insights et Azure IoT Central dans les domaines IoT.
Appliquer les critères
Azure Data Explorer est parfait pour offrir des fonctionnalités d’analytique interactives aux travailleurs du savoir sur des données brutes diverses à grande vélocité. Réfléchissons à la façon d’appliquer les critères que nous avons répertoriés précédemment à nos exemples de processus dans le scénario de la société de vêtements.
Faut-il utiliser Azure Data Explorer pour les données de production ?
Le département de production de notre exemple de société de vêtements doit prendre des décisions sur la gestion des stocks et des volumes de production. Il dispose de journaux de données entrants pour le stock. Il souhaite également utiliser les données géospatiales du marketing pour anticiper les besoins en produits par région. Ces données ont un niveau élevé de variété, de vélocité et de volume. Ils ne sont pas organisées de manière cohérente, alors que de nombreuses parties prenantes doivent interroger simultanément ces données. De l’ingestion à l’interrogation, elles nécessitent une faible latence. Elles demandent des temps de réponse de requête inférieurs à une seconde. Sur la base des critères de décision, Azure Data Explorer est adapté à la division de production de la société de vêtements.
Faut-il utiliser Azure Data Explorer pour les données de marketing ?
Le département marketing de la société de vêtements souhaite évaluer l’efficacité de sa campagne. Il dispose des données de parcours de son site web et de ses campagnes publicitaires. Il dispose aussi des données de texte libre (non structurées) des réseaux sociaux. Ces données sont très variées et désorganisées. Le département va vouloir procéder à une analytique interactive exploratoire. Sur la base des critères de décision, Azure Data Explorer est adapté à la division de marketing de la société de vêtements.
Récapitulatif des conseils
Le tableau suivant indique comment évaluer les nouveaux cas d’usage. Bien que tous les cas d’usage ne soient pas abordés ici, nous pensons que cela peut vous aider à déterminer si Azure Data Explorer est la bonne solution pour vous.
Cas d’usage | Analytique interactive | Big Data (variété, vélocité, volume) | Organisation des données | Concurrency | Créer ou acheter | Dois-je utiliser Azure Data Explorer ? |
---|---|---|---|---|---|---|
Implémentation d’un produit SaaS d’analytique de sécurité | Utilisation intensive d’une analytique interactive en quasi-temps réel. | Les données de sécurité sont variées, volume élevé et vélocité élevée. | Variable | Le système est souvent utilisé par plusieurs analystes de plusieurs locataires. | L’implémentation d’un produit SaaS est un scénario Créer. | Oui |
Analytique des journaux CDN | Interactif pour le dépannage, la surveillance QoS. | Les journaux CDN sont variés, volume élevé et vélocité élevée. | Enregistrements de journaux distincts. | Un petit groupe de scientifiques des données peut utiliser ces analyses, mais il peut également alimenter de nombreux tableaux de bord. | La valeur extraite de l’analyse CDN est propre au scénario et demande une analytique personnalisée. | Oui |
Base de données de série chronologique pour la télémétrie IoT | Interactif pour le dépannage, l’analyse des tendances, l’utilisation, la détection des anomalies. | La télémétrie IoT est à vélocité élevée mais peut uniquement être structurée ou de taille moyenne. | Ensembles d’enregistrements associés. | Un petit groupe de scientifiques des données peut utiliser ces analyses, mais il peut également alimenter de nombreux tableaux de bord. | Lors de la recherche d’une base de données, le contexte est généralement Créer. | Oui |
L’organigramme suivant récapitule les questions clés à vous poser lorsque vous envisagez d’utiliser Azure Data Explorer.