Architettura logica (Analysis Services – Data mining)
Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium
Importante
Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato interrotto in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.
Il processo di data mining è basato sull'interazione di più componenti.
Si accede a origini dati in un database SQL Server o a qualsiasi altra origine i cui dati verranno utilizzati a scopo di training, testing o stima.
È possibile definire strutture e modelli di data mining usando SQL Server Data Tools o Visual Studio.
È possibile gestire gli oggetti di data mining e creare stime e query usando SQL Server Management Studio.
Al termine della soluzione, la distribuzione viene distribuita in un'istanza di SQL Server Analysis Services.
Il processo di creazione di questi oggetti della soluzione è già stato descritto in altri argomenti. Per altre informazioni, vedere Soluzioni di data mining.
Nelle sezioni seguenti viene descritta l'architettura logica degli oggetti in una soluzione di data mining.
Oggetti di data mining personalizzati
Dati di origine di data mining
Nella soluzione di data mining vengono archiviate solo le associazioni, non i dati utilizzati nel processo di data mining. I dati potrebbero essere contenuti in un database creato in una versione precedente di SQL Server, in un sistema CRM o anche in un file flat. Quando si esegue il training della struttura o del modello tramite elaborazione, viene creato e archiviato un riepilogo statistico dei dati in una cache che può essere resa persistente per l'utilizzo in operazioni successive o eliminata dopo l'elaborazione. Per altre informazioni, vedere Strutture di data mining (Analysis Services - Data Mining).
Si combinano dati diversi all'interno dell'oggetto SQL Server Analysis Services visualizzazione origine dati (DSV), che fornisce un livello di astrazione sopra l'origine dati. È possibile specificare join tra le tabelle o aggiungere tabelle con una relazione molti-a-uno per creare colonne di tabelle nidificate. La definizione di questi oggetti, l'origine dati e la vista origine dati, viene archiviata all'interno della soluzione con le estensioni di file * .ds e * .dsv. Per altre informazioni sulla creazione e l'uso di SQL Server Analysis Services origini dati e viste origine dati, vedere Origini dati supportate (SSAS - Multidimensionale).
È inoltre possibile definire e modificare origini dati e viste origine dati tramite AMO o XMLA. Per altre informazioni sull'uso di questi oggetti a livello di codice, vedere Panoramica dell'architettura logica (Analysis Services - Dati multidimensionali).
Strutture di data mining
Una struttura di data mining è un contenitore di dati logico che definisce il dominio di dati in base al quale vengono compilati i modelli di data mining. Una sola struttura di data mining può supportare più modelli di data mining.
Quando è necessario utilizzare i dati nella soluzione di data mining, Analysis Services legge i dati dall'origine e genera una cache di aggregazioni e altre informazioni. Per impostazione predefinita, questa cache è resa persistente in modo che i dati di training possano essere riutilizzati per supportare modelli aggiuntivi. Se è necessario eliminare la cache, modificare la proprietà CacheMode nell'oggetto struttura di data mining impostandola sul valore ClearAfterProcessing. Per altre informazioni, vedere Classi di data mining AMO.
Analysis Services offre anche la possibilità di separare i dati in set di dati di training e test, in modo che sia possibile testare i modelli di data mining in un set di dati selezionato in modo casuale. I dati in realtà non vengono archiviati separatamente; piuttosto i dati del case nella cache della struttura vengono contrassegnati da una proprietà che indica se tale particolare caso viene utilizzato per il training o il test. Se la cache viene eliminata, non è possibile recuperare tali informazioni.
Per altre informazioni, vedere Strutture di data mining (Analysis Services - Data Mining).
Una struttura di data mining può contenere tabelle nidificate. In una tabella nidificata vengono forniti dettagli aggiuntivi sul case di cui viene definito il modello nella tabella di dati primaria. Per altre informazioni, vedere Tabelle annidate (Analysis Services - Data mining)
Modelli di data mining
Prima dell'elaborazione, un modello di data mining è solo una combinazione di proprietà di metadati. Tali proprietà specificano una struttura di data mining e un algoritmo di data mining e definiscono una raccolta di impostazioni di parametri e filtri che influiscono sul modo in cui i dati vengono elaborati. Per altre informazioni, vedere Modelli di data mining (Analysis Services - Data mining).
Quando si elabora il modello, i dati di training archiviati nella cache della struttura di data mining sono utilizzati per generare modelli, basati sia sulle proprietà statistiche dei dati sia sull'euristica definita dall'algoritmo e dai relativi parametri. Questo processo è noto come training del modello.
Il risultato del training è un set di dati riepilogativi, contenuti nel contenuto del modelloin cui sono descritti i modelli rilevati e vengono fornite le regole in base a cui generare le stime. Per altre informazioni, vedere Contenuto del modello di data mining (Analysis Services - Data Mining).
In casi limitati è anche possibile esportare la struttura logica del modello in un file che rappresenta formule di modello e associazioni dati secondo un formato standard, il linguaggio PMML (Predictive Modeling Markup Language). È possibile importare questa struttura logica in altri sistemi che utilizzano PMML e il modello descritto può quindi essere utilizzato per la stima. Per altre informazioni, vedere Informazioni sull'istruzione DMX Select.
Oggetti di data mining personalizzati
Altri oggetti utilizzati nel contesto di un progetto di data mining, ad esempio grafici di accuratezza o query di stima, non vengono resi persistenti all'interno della soluzione, ma possono essere inseriti nello script utilizzando ASSL o compilati tramite AMO.
È inoltre possibile estendere i servizi e le funzionalità disponibili in un'istanza di SQL Server Analysis Services aggiungendo questi oggetti personalizzati:
Assembly personalizzati
Gli assembly .NET possono essere definiti tramite qualsiasi linguaggio conforme a CLR o COM, quindi registrati con un'istanza di SQL Server. I file di assembly vengono caricati dal percorso definito dall'applicazione e una copia viene salvata nel server insieme ai dati. La copia del file di assembly viene utilizzata per caricare l'assembly a ogni avvio del servizio.
Per altre informazioni, vedere Gestione di assembly di modelli multidimensionali.
Stored procedure personalizzate
SQL Server Analysis Services data mining supporta l'uso di stored procedure per l'uso degli oggetti di data mining. È possibile creare stored procedure personalizzate per estendere le funzionalità e utilizzare più facilmente i dati restituiti da query di stima e query contenuto.
Definizione di stored procedure
Le seguenti stored procedure sono supportate per l'utilizzo nell'esecuzione della convalida incrociata.
Stored procedure di data mining (Analysis Services - Data mining)
Inoltre, SQL Server Analysis Services contiene molte stored procedure di sistema usate internamente per il data mining. Benché le stored procedure di sistema siano per uso interno, possono rivelarsi utili scelte rapide. Microsoft si riserva il diritto di modificare tali stored procedure in base alle esigenze; pertanto, per l'utilizzo in fase di produzione, si consiglia di creare query tramite DMX, AMO o XMLA.
Algoritmi plug-in personalizzati
SQL Server Analysis Services fornisce un meccanismo per la creazione di algoritmi personalizzati e quindi l'aggiunta degli algoritmi come nuovo servizio di data mining all'istanza del server.
In Analysis Services vengono utilizzate le interfacce COM per comunicare con gli algoritmi plug-in. Per altre informazioni sull'implementazione dei nuovi algoritmi, vedere Algoritmi plug-in.
Prima di utilizzare i nuovi algoritmi è necessario registrarli. Per registrare un algoritmo, aggiungere i metadati necessari per gli algoritmi nel file .ini dell'istanza di SQL Server Analysis Services. È necessario aggiungere le informazioni a ogni istanza in cui si intende utilizzare il nuovo algoritmo. Dopo l'aggiunta dell'algoritmo, è possibile riavviare l'istanza e utilizzare il set di righe dello schema MINING_SERVICES per visualizzare il nuovo algoritmo, inclusi i provider e le opzioni supportati.
Vedere anche
Elaborazione di un modello multidimensionale (Analysis Services)
Guida di riferimento a DMX (Data Mining Extensions)