Freigeben über


Erstellen von Vorhersagen (Lernprogramm zu Data Mining-Grundlagen)

 

Gilt für: SQL Server 2016 Preview

Nachdem Sie entschieden, dass Sie mit den Ergebnissen zufrieden sind und die Genauigkeit Ihrer Miningmodelle getestet haben, können Sie Sie vorhersagen erzeugen, mit dem Generator für Vorhersageabfragen auf die Miningmodellvorhersage Registerkarte im Data Mining-Designer.

Der Generator für Vorhersageabfragen verfügt über drei Sichten. Mit der Entwurf und Abfrage Ansichten erstellen und untersuchen Sie die Abfrage. Sie können die Abfrage ausführen und Anzeigen der Ergebnisse in der Ergebnis anzeigen.

Alle Vorhersageabfragen verwenden die DMX-Programmiersprache, die Kurzform für Data Mining Extensions (Data Mining-Erweiterungen). DMX hat eine ähnliche Syntax wie T-SQL, wird jedoch für Abfragen von Data Mining-Objekten verwendet. Obwohl DMX-Syntax nicht kompliziert ist, verwenden Sie einen Abfrage-Generator wie diesem oder in der SQL Server Data Mining-Add-Ins für Office, ist es viel leichter Eingaben auswählen und Erstellen von Ausdrücken, sodass es wird dringend empfohlen, dass Sie die Grundlagen kennen.

Erstellen einer Abfrage

Der erste Schritt beim Erstellen einer Vorhersageabfrage ist die Auswahl eines Miningmodells und einer Eingabetabelle.

So wählen Sie ein Modell und eine Eingabetabelle aus

  1. Auf der Miningmodellvorhersage Data Mining-Designer auf der Registerkarte in der Miningmodell auf Modell auswählen.

  2. In der Miningmodell auswählen Dialogfeld Navigieren durch die Struktur der Targeted Mailing erweitern Sie die Struktur, wählen TM_Decision_Tree, und klicken Sie dann auf OK.

  3. In der Eingabetabelle(n) auf Falltabelle auswählen.

  4. In der Tabelle auswählen Dialogfeld die Datenquelle wählen Sie die Datenquellensicht Adventure Works DW Multidimensional 2012.

  5. In Tabellen-/Sichtname, wählen die ProspectiveBuyer (Dbo) Tabelle, und klicken Sie dann auf OK.

    Die ProspectiveBuyer Tabelle am ehesten entspricht der vTargetMail Falltabelle.

Zuordnen der Spalten

Wenn Sie die Eingabetabelle ausgewählt haben, erstellt der Generator für Vorhersageabfragen eine Standardzuordnung zwischen dem Miningmodell und der Eingabetabelle, die auf den Spaltennamen basiert. Mindestens eine Spalte in der Struktur muss mit einer Spalte in den externen Daten übereinstimmen.

Wichtig


Die Daten, die Sie zur Ermittlung der Genauigkeit der Modelle verwenden, müssen eine Spalte enthalten, die der vorhersagbaren Spalte zugeordnet werden kann. Wenn so eine Spalte nicht vorhanden ist, können Sie eine Spalte mit leeren Werten erstellen. Sie muss jedoch den gleichen Datentyp wie die vorhersagbare Spalte aufweisen.

So ordnen Sie dem Modell die Eingaben zu

  1. Mit der rechten Maustaste Verbindungslinien zwischen den Miningmodell Fenster, um die Eingabetabelle(n) auswählen und wählen Sie Verbindungen ändern.

    Beachten Sie, dass nicht jede Spalte zugeordnet wird. Fügen Sie Zuordnungen für mehrere Tabellenspalten. Wir generieren außerdem eine neue Geburtsdatumsspalte, die auf der aktuellen Datumsspalte basiert, um die Übereinstimmung zwischen den Spalten zu erhöhen.

  2. Unter Tabellenspalte, klicken Sie auf die Bike Buyer Zelle und ProspectiveBuyer.Unknown in der Dropdownliste auswählen.

    Dies ordnet die vorhersagbare Spalte [Bike Buyer] einer Eingabetabellenspalte zu.

  3. Klicken Sie auf OK.

  4. In Projektmappen-Explorer, mit der rechten Maustaste die Targeted Mailing Datenquellensicht und wählen Sie Ansicht-Designer.

  5. Mit der rechten Maustaste in der Tabelle "prospectivebuyer", und wählen Sie neue benannte Berechnung.

  6. In der benannte Berechnung erstellen im Dialogfeld für Spaltenname, Typ CalcAge.

  7. Für Beschreibung, Typ Alter basierend auf Birthdate berechnen.

  8. In der Ausdruck Geben DATEDIFF(YYYY,[BirthDate],getdate()) und klicken Sie dann auf OK.

    Da in die Eingabetabelle keine Alter in das Modell entsprechende können diesen Ausdruck zur Berechnung des Alters von Kunden aus der BirthDate-Spalte der Eingabetabelle. Da Alter identifiziert wurde, als die meisten beigemessen Spalte für den Kauf eines Fahrrads, müssen sie sowohl im Modell und in der Eingabetabelle vorhanden.

  9. Wählen Sie im Data Mining-Designer die Miningmodellvorhersage Registerkarte, und öffnen Sie erneut die Verbindungen ändern Fenster.

  10. Unter Tabellenspalte, klicken Sie auf die Alter Zelle und ProspectiveBuyer.calcAge in der Dropdownliste auswählen.

    Warnung


    Wenn die Spalte in der Liste nicht angezeigt wird, müssen Sie u. U. die Definition der im Designer geladenen Datenquellensicht aktualisieren. Dazu aus der Datei Klicken Sie im Menü Speichern, schließen und erneut öffnen Sie das Projekt im Designer.

  11. Klicken Sie auf OK.

Entwerfen einer Vorhersageabfrage

  1. Die erste Schaltfläche auf der Symbolleiste der der Miningmodellvorhersage Registerkarte ist die Wechseln Sie in anzeigen wechseln / zur ergebnissicht wechseln / zur Abfragesicht Schaltfläche. Klicken Sie auf den Pfeil nach unten, klicken Sie auf diese Schaltfläche, und wählen Sie Entwurf.

  2. Im Raster auf die Miningmodellvorhersage Registerkarte, klicken Sie auf die Zelle in der ersten leeren Zeile in der Quelle Spalte, und wählen Sie dann Vorhersagefunktion.

  3. In der Vorhersagefunktion -Zeile in der Feld Spalte PredictProbability.

    In der Alias Spalte derselben Zeile, Typ Wahrscheinlichkeit des Ergebnisses.

  4. Aus der Miningmodell oben im Fenster auswählen, und ziehen Sie [Bike Buyer] in der Kriterium/Argument Zelle.

    Wenn Sie loslassen, [TM_Decision_Tree]. [Bike Buyer] wird in der Kriterium/Argument Zelle.

    Hiermit wird die Zielspalte für die PredictProbability Funktion. Weitere Informationen zu Funktionen finden Sie unter Data Mining-Erweiterungen ( DMX ) Funktion Referenz.

  5. Klicken Sie auf die nächste leere Zeile in der Quelle Spalte, und wählen Sie dann TM_Decision_Tree Miningmodell**.**

  6. In der TM_Decision_Tree -Zeile in der Feld Spalte Bike Buyer.

  7. In der TM_Decision_Tree -Zeile in der Kriterium/Argument Geben Sie die Spalte = 1.

  8. Klicken Sie auf die nächste leere Zeile in der Quelle Spalte, und wählen Sie ProspectiveBuyer-Tabelle.

  9. In der ProspectiveBuyer -Zeile in der Feld Spalte ProspectiveBuyerKey.

    Damit wird der Vorhersageabfrage ein eindeutiger Bezeichner hinzugefügt, sodass Sie feststellen können, wer wahrscheinlich ein Fahrrad kaufen wird und wer nicht.

  10. Fügen Sie dem Raster fünf weitere Zeilen hinzu. Wählen Sie für jede Zeile ProspectiveBuyer Table als die Quelle und fügen Sie die folgenden Spalten in der Feld Zellen:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Führen Sie zum Schluss die Abfrage aus, und durchsuchen Sie die Ergebnisse.

Die Generator für Vorhersageabfragen umfasst zusätzlich folgende Steuerelemente:

  • Anzeigen das Kontrollkästchen

    Ermöglicht das Entfernen von Klauseln aus der Abfrage, ohne sie aus dem Designer zu löschen. Diese Funktion kann bei komplexen Abfragen hilfreich sein, wenn Sie die Syntax beibehalten und keine DMX kopieren und in das Fenster einfügen möchten.

  • Gruppieren

    Fügt eine öffnende (linke) Klammer am Anfang der ausgewählten Zeile oder eine schließende (rechte) Klammer am Ende der aktuellen Zeile ein.

  • AND/OR

    Fügt der und Operator oder OR -Operator unmittelbar nach der aktuellen Funktion oder Spalte.

So führen Sie die Abfrage aus und zeigen die Ergebnisse an

  1. In der Miningmodellvorhersage Registerkarte der Ergebnis Schaltfläche.

  2. Nachdem die Abfrage ausgeführt wurde und die Ergebnisse angezeigt werden, können Sie die Ergebnisse überprüfen.

    Die Miningmodellvorhersage Registerkarte Kontaktinformationen für potenzielle Kunden, die wahrscheinlich ein Fahrrad gekauft haben, werden angezeigt. Die Wahrscheinlichkeit des Ergebnisses Spalte gibt die Wahrscheinlichkeit die Vorhersage richtig an. Anhand dieser Ergebnisse können Sie entscheiden, welche potenziellen Kunden beim Targeted Mailing angeschrieben werden sollen.

  3. An diesem Punkt können Sie die Ergebnisse speichern. Hierfür stehen drei Möglichkeiten zur Verfügung:

    • Mit der rechten Maustaste in einer Zeile mit Daten in den Ergebnissen, und wählen Sie Kopieren nur diesen Wert (und die Spaltenüberschrift) in die Zwischenablage zu speichern.

    • Mit der rechten Maustaste in die Ergebnisse jeder Zeile, und wählen Sie Alle kopieren das gesamte Resultset, einschließlich Spaltenüberschriften, in die Zwischenablage zu kopieren.

    • Klicken Sie auf Abfrageergebnis speichern die Ergebnisse wie folgt direkt in einer Datenbank zu speichern:

      1. In der Data Mining-Abfrageergebnis speichern Klicken Sie im Dialogfeld Datenquelle auswählen oder eine neue Datenquelle zu definieren.

      2. Geben Sie einen Namen für die Tabelle ein, in die die Abfrageergebnisse eingefügt werden.

      3. Verwenden Sie die Option zur Datenquellensicht hinzufügen, um die Tabelle erstellen und eine vorhandene Datenquellensicht hinzugefügt. Diese Option ist nützlich, wenn Sie alle verknüpften Tabellen für ein Modell – z. B. Trainingsdaten, Vorhersagequelldaten und Abfrageergebnisse – in der gleichen Datenquellensicht beibehalten möchten.

      4. Verwenden Sie die Option überschreiben, falls vorhanden, um eine vorhandene Tabelle mit den neuesten Ergebnissen zu aktualisieren.

        Sie müssen die Option verwenden, um die Tabelle zu überschreiben, falls Sie der Vorhersageabfrage Spalten hinzugefügt, die Namen oder Datentypen von Spalten in der Vorhersageabfrage geändert oder ALTER-Anweisungen für die Zieltabelle ausgeführt haben.

        Auch wenn mehrere Spalten den gleichen Namen (z. B. den Standardspaltennamen Ausdruck) müssen Sie einen Alias für Spalten mit doppelten Namen erstellen, oder ein Fehler ausgelöst, wenn der Designer versucht, die Ergebnisse in SQL Server speichern. Dies liegt daran, dass mehrere Spalten unter SQL Server nicht über denselben Namen verfügen dürfen.

        Weitere Informationen finden Sie unter Data Mining-Abfrage Ergebnis im Dialogfeld Speichern ( Miningmodell-Vorhersageansicht ).

Nächste Aufgabe in der Lektion

Verwenden von Drillthrough für Strukturdaten ( Grundlegende Datamining-Lernprogramm )

Siehe auch

Erstellen von Vorhersageabfragen mithilfe des Generators für Vorhersageabfragen