Esplorare i database
Un database viene usato per definire un sistema centrale in cui è possibile archiviare i dati ed eseguirne le query. In parole semplice, il file system in cui vengono archiviati i file è un tipo di database, ma, quando si usa il termine in un contesto dei dati professionale, in genere si intende un sistema dedicato per la gestione dei record di dati invece che dei file.
Database relazionali
I database relazionali vengono comunemente usati per archiviare i dati strutturati ed eseguire query su di essi. I dati vengono archiviati in tabelle che rappresentano entità, ad esempio clienti, prodotti o ordini di vendita. A ogni istanza di un'entità viene assegnata a una chiave primaria che la identifica in modo univoco. Queste chiavi vengono usate per fare riferimento all'istanza dell'entità in altre tabelle. È ad esempio possibile fare riferimento alla chiave primaria di un cliente in un record dell'ordine di vendita per indicare quale cliente ha inserito l'ordine. Questo uso delle chiavi per fare riferimento alle entità dei dati consente a un database relazionale di essere normalizzato, il che in parte significa eliminare i valori di dati duplicati in modo che, ad esempio, i dettagli di un singolo cliente vengano archiviati una sola volta e non per ogni ordine di vendita inserito dal cliente. Le tabelle vengono gestite e sottoposte a query usando Structured Query Language (SQL), basato su uno standard ANSI e quindi simile a più sistemi di database.
Database non relazionali
I database non relazionali sono sistemi di gestione dei dati che non applicano uno schema relazionale ai dati. I database non relazionali vengono spesso definiti database NoSQL, anche se alcuni supportano una variante del linguaggio SQL.
Esistono quattro tipi comuni di database non relazionali comunemente usati.
Database di coppie chiave-valore in cui ogni record è costituito da una chiave univoca e da un valore associato, in qualsiasi formato.
Database di documenti, che sono un tipo specifico di database di coppie chiave-valore in cui il valore è un documento JSON (che il sistema è ottimizzato per analizzare e sottoporre a query)
Database della famiglia di colonne, che archiviano i dati tabulari che comprendono righe e colonne, ma è possibile dividere le colonne in gruppi noti come famiglie di colonne. Ogni famiglia di colonne include un set di colonne logicamente correlate tra loro.
Database a grafo, che archiviano le entità come nodi con collegamenti per definire le relazioni tra di esse.