Déterminer les besoins fonctionnels
Après avoir identifié le type de données que vous souhaitez stocker (structurées, semi-structurées ou non structurées), l’étape suivante consiste à déterminer comment vous allez utiliser les données. Par exemple, en tant que détaillant en ligne, vous savez que les clients doivent accéder rapidement aux données des produits et que les utilisateurs professionnels doivent exécuter des requêtes analytiques complexes. Quand vous parcourez ces exigences et que vous prenez la classification des données en compte, vous pouvez commencer à planifier votre solution de stockage de données.
Ici, vous allez répondre à certaines questions pour vous aider à déterminer ce qu’il faut faire avec vos données.
Opérations et latence
Quelles sont les opérations principales que vous allez exécuter sur chaque type de données et quelles sont les exigences de performances pour les données ?
Posez-vous ces questions concernant vos données :
- Allez-vous effectuer des recherches simples à l’aide d’un champ d’ID ?
- Devez-vous rechercher un ou plusieurs champs dans la base de données ?
- Combien d’opérations de création, de mise à jour et de suppression prévoyez-vous d’exécuter ?
- Devez-vous exécuter des requêtes analytiques complexes ?
- À quelle vitesse ces opérations doivent-elles être traitées ?
Les réponses à ces questions vous aideront à choisir la meilleure solution de stockage pour vos données.
Opérations et latence : Évaluer vos types de données
Nous allons parcourir chacun des jeux de données en gardant ces questions à l’esprit et aborder les exigences.
Données du catalogue de produits
Pour les données du catalogue de produits dans un scénario de vente au détail en ligne, satisfaire les besoins du client est la priorité la plus élevée. Les clients souhaiteront interroger le catalogue de produits pour trouver un élément ou une catégorie recherché(e). Par exemple, un client peut interroger toutes les chaussures de tennis, puis les chaussures de tennis en solde, puis les chaussures de tennis en solde dans une pointure particulière. Les besoins des clients peuvent nécessiter de nombreuses opérations de lecture, et ces opérations doivent pouvoir interroger des champs spécifiques.
Lorsqu’un client place une commande, l’application doit mettre à jour les quantités de produits. Les opérations de mise à jour doivent se dérouler aussi rapidement que les opérations de lecture, pour éviter que les utilisateurs ne mettent dans leur panier un article devenu indisponible. Non seulement l’application doit prendre en charge un grand nombre d’opérations de lecture, mais elle nécessite également un nombre croissant d’opérations d’écriture pour les données du catalogue de produits. Veillez à déterminer les priorités de tous les utilisateurs de la base de données, et pas seulement des principaux utilisateurs.
Photos et vidéos
Les photos et vidéos affichées dans les pages de produits ont cependant des exigences différentes. Elles nécessitent des temps de récupération rapides pour pouvoir être affichées sur le site en même temps que les données du catalogue de produits, mais n’ont pas besoin d’être interrogées indépendamment. Au lieu de cela, vous pouvez vous fier aux résultats de la requête de produit et inclure simplement l’ID ou l’URL de la vidéo comme propriété sur les données des produits. Vous devez récupérer des photos et des vidéos en utilisant leur ID uniquement.
Les clients n’apportent pas de modifications aux photos et vidéos existantes, mais ils peuvent ajouter de nouvelles photos pour des évaluations de produit. Par exemple, un utilisateur pourra charger une image le montrant en train de porter ses nouvelles chaussures.
En tant qu’employé, vous chargez et supprimez également des photos de produits fournies par votre fournisseur de produits. Mais ces mises à jour n’ont pas besoin de se produire aussi rapidement que vos autres mises à jour de données de produits.
En résumé, vous pouvez interroger des photos et des vidéos par ID en retournant le fichier entier. Toutefois, les opérations de création et de mise à jour sont moins fréquentes et ont une priorité plus faible.
Données métier
Pour l’analyse des données, l’entreprise utilise uniquement des données historiques. Aucune donnée d’origine n’est mise à jour en fonction de l’analyse, les données métier sont donc en lecture seule. Les utilisateurs n’attendent pas une exécution instantanée de leur analytique complexe ; une certaine latence dans les résultats est donc acceptable.
Les données métier sont stockées dans plusieurs jeux de données. Les analystes d’entreprise n’ont pas tous besoin d’un accès en écriture à tous les jeux de données, mais tous les analystes d’entreprise peuvent lire à partir de tous les jeux de données.