Enrichir les données et ingérer dans Event Hub à l’aide de l’éditeur sans code Stream Analytics
Cet article explique comment utiliser l’éditeur sans code pour créer facilement un travail Stream Analytics. Il lit en continu à partir de votre Event Hubs, enrichit les données entrantes avec des donné SQL, puis écrit les résultats en continu dans Event Hub.
Prérequis
- Vos ressources Azure Event Hubs et de données de référence SQL doivent être accessibles publiquement et ne peuvent pas résider derrière un pare-feu ou être sécurisées dans un réseau virtuel Azure
- Les données de votre Event Hubs doivent être sérialisées au format JSON, CSV ou Avro.
Développer un travail Stream Analytics pour enrichir les données Event Hub
Sur le portail Azure, recherchez et sélectionnez l’instance d’Azure Event Hubs.
Sélectionnez Fonctionnalités>Traiter les données, puis sélectionnez Démarrer sur la carte Enrichir les données et ingérer dans Event Hub.
Saisissez un nom pour le travail Stream Analytics, puis sélectionnez Créer.
Spécifiez le type de sérialisation de vos données dans la fenêtre Event Hubs et la méthode d’authentification que le travail utilisera pour se connecter aux Event Hubs. Sélectionnez Connecter.
Lorsque la connexion est établie avec succès et que vous disposez de flux de données qui circulent dans votre instance Event Hubs, vous verrez immédiatement deux éléments :
- Champs présents dans les données d’entrée. Vous pouvez choisir Ajouter un champ ou sélectionner le symbole trois points en regard d’un champ pour supprimer, renommer ou modifier son type.
- Exemple dynamique de données entrantes dans la table d’aperçu des données sous la vue diagramme. Il s’actualise automatiquement à intervalles réguliers. Vous pouvez sélectionner Suspendre la préversion de streaming pour afficher une vue statique des exemples de données d’entrée.
- Champs présents dans les données d’entrée. Vous pouvez choisir Ajouter un champ ou sélectionner le symbole trois points en regard d’un champ pour supprimer, renommer ou modifier son type.
Sélectionnez la vignette Entrée SQL de référence pour vous connecter à la base de données SQL de référence.
Sélectionnez la vignette Joindre. Dans le panneau de configuration droit, choisissez un champ à partir de chaque entrée pour joindre les données entrantes à partir des deux entrées.
Sélectionnez la vignette Gérer. Dans le panneau de configuration Gérer les champs, choisissez les champs que vous souhaitez obtenir dans le hub d’événements. Si vous souhaitez ajouter tous les champs, sélectionnez Ajouter tous les champs.
Sélectionnez la vignette Event Hub. Dans le panneau de configuration Event Hub, renseignez les paramètres nécessaires et connectez-vous, de la même façon que la configuration Event Hub d’entrée.
Si vous le souhaitez, sélectionnez Obtenir l’aperçu statique/Actualiser la préversion statique pour afficher la préversion des données qui seront ingérées dans Event Hub.
Sélectionnez Enregistrer, puis Démarrer le travail Stream Analytics.
Pour démarrer le travail, spécifiez :
- Le nombre d’unités de streaming (SU) avec lesquelles le travail est exécuté. Les SU représentent les capacités de calcul et de mémoire allouées au travail. Nous vous recommandons de commencer par trois, puis d’ajuster selon les besoins.
- Gestion des erreurs de données de sortie : elle vous permet de spécifier le comportement souhaité lorsque la sortie d’un travail vers votre destination échoue en raison d’erreurs de données. Par défaut, votre travail réessaie jusqu’à ce que l’opération d’écriture aboutisse. Vous pouvez également choisir de supprimer de tels événements de sortie.
Une fois que vous avez sélectionné Démarrer, le travail commence à s’exécuter dans les deux minutes, et les métriques s’ouvrent dans la section d’onglet en-dessous.
Vous pouvez également voir le travail sous la section Traiter les données de l’onglet Travaux Stream Analytics. Sélectionnez Ouvrir les métriques pour surveiller le travail ou l’arrêter et le redémarrer, selon les besoins.
Considérations relatives à l’utilisation de la fonctionnalité de géo Event Hubs
Azure Event Hubs a récemment lancé la fonctionnalité géo en préversion publique. Cette fonctionnalité est différente de la fonctionnalité récupération d’urgence géo d’Azure Event Hubs.
Lorsque le type de basculement est Forcé et que la cohérence de la réplication est Asynchrone, le travail Stream Analytics ne garantit pas exactement une sortie vers une sortie Azure Event Hubs.
Azure Stream Analytics, comme producteur avec un hub d’événements en tant que sortie, peut observer un retard de filigrane sur le travail pendant la durée de basculement et pendant la limitation par Event Hubs au cas où le décalage de réplication entre le serveur principal et le serveur secondaire atteint la limite maximale configurée de décalage.
Azure Stream Analytics, comme consommateur avec Event Hubs en tant qu’entrée, peut observer un délai de filigrane sur le travail pendant la durée de basculement et peut ignorer les données ou rechercher des données dupliquées une fois le basculement terminé.
En raison de ces avertissements, nous vous recommandons de redémarrer le travail Stream Analytics avec l’heure de début appropriée juste après la fin du basculement d’Event Hubs. En outre, étant donné que la fonctionnalité géo d’Event Hubs est en préversion publique, nous vous déconseillons d’utiliser ce modèle pour les travaux Stream Analytics de production à ce stade. Le comportement actuel de Stream Analytics s’améliore avant que la fonctionnalité de géo d’Event Hubs soit généralement disponible et puisse être utilisée dans des travaux de production Stream Analytics.
Étapes suivantes
En savoir plus sur Azure Stream Analytics et sur la surveillance du travail que vous avez créé.