Tutorial: Verwenden eines Notebooks mit Apache Spark zum Abfragen einer KQL-Datenbank
Notebooks sind sowohl lesbare Dokumente, die Beschreibungen und Ergebnisse der Datenanalyse enthalten, als auch ausführbare Dokumente, die zur Datenanalyse ausgeführt werden können. In diesem Artikel erfahren Sie, wie Sie ein Microsoft Fabric-Notebook verwenden, um mithilfe von Apache Spark Daten in einer KQL-Datenbank zu lesen und sie in diese zu schreiben. In diesem Tutorial werden vorab erstellte Datasets und Notebooks sowohl in der Real-Time Intelligence als auch in den Datentechnik-Umgebungen in Microsoft Fabric verwendet. Weitere Informationen zu Notebooks finden Sie unter Verwenden von Microsoft Fabric-Notebooks.
Sie lernen speziell Folgendes:
- Erstellen einer KQL-Datenbank
- Importieren eines Notebooks
- Schreiben von Daten in eine KQL-Datenbank mithilfe von Apache Spark
- Abfragen von Daten aus einer KQL-Datenbank
Voraussetzungen
- Ein Arbeitsbereich mit einer Microsoft Fabric-fähigen Kapazität
1. Erstellen einer KQL-Datenbank
Öffnen Sie den Switcher für die Benutzererfahrung unten im Navigationsbereich, und wählen Sie Real-Time Intelligence aus.
Wählen Sie die KQL-Datenbank aus.
Geben Sie im Feld KQL-DatenbanknamenycGreenTaxi ein, und wählen Sie dann Erstellen aus.
Die KQL-Datenbank wird im Kontext des ausgewählten Arbeitsbereichs erstellt.
Kopieren Sie den Abfrage-URI aus der Karte der Datenbankdetails im Datenbankdashboard, und fügen Sie ihn irgendwo, z. B. in einen Editor, ein, um ihn in einem späteren Schritt zu verwenden.
2. Herunterladen des NYC GreenTaxi-Notebooks
Wir haben ein Beispielnotebook erstellt, das Sie durch alle erforderlichen Schritte zum Laden von Daten in Ihre Datenbank mit dem Spark-Connector führt.
Öffnen Sie das Fabric-Beispielrepository auf GitHub, um das NYC GreenTaxi KQL-Notebook herunterzuladen.
Speichern Sie das Notebook lokal auf Ihrem Gerät.
Hinweis
Das Notebook muss im Dateiformat
.ipynb
gespeichert werden.
3. Importieren des Notebooks
Der Rest dieses Workflows erfolgt im Abschnitt Datentechnik des Produkts und verwendet ein Spark-Notebook, um Daten in Ihre KQL-Datenbank zu laden und abzufragen.
Öffnen Sie den Umschalter für die Benutzeroberfläche unten im Navigationsbereich, und wählen Sie Entwickeln und dann Ihren Arbeitsbereich aus.
Wählen Sie Import>Notebook>Auf diesem Computer>Hochladen und dann das Notebook „NYC GreenTaxi“ aus, das Sie in einem vorherigen Schritt heruntergeladen haben.
Öffnen Sie das Notebook nach Abschluss des Imports in Ihrem Arbeitsbereich.
4. Abrufen der Daten
Um Ihre Datenbank mithilfe des Spark-Connectors abzufragen, müssen Sie Lese- und Schreibzugriff auf den NYC GreenTaxi-Blobcontainer gewähren.
Wählen Sie die Wiedergabeschaltfläche aus, um die folgenden Zellen auszuführen, oder wählen Sie die Zelle aus, und drücken Sie UMSCHALT+EINGABETASTE. Wiederholen Sie diesen Schritt für jede Codezelle.
Hinweis
Warten Sie, bis das Häkchen angezeigt wird, bevor Sie die nächste Zelle ausführen.
Führen Sie die folgende Zelle aus, um den Zugriff auf den NYC GreenTaxi-Blobcontainer zu ermöglichen.
Fügen Sie in KustoURI den zuvor kopiertenAbfrage-URI anstelle des Platzhaltertexts ein.
Ändern Sie den Platzhalternamen der Datenbank in nycGreenTaxi.
Ändern Sie den Platzhalternamen der Tabelle in GreenTaxiData.
Führen Sie die Zelle aus.
Führen Sie die nächste Zelle aus, um Daten in Ihre Datenbank zu schreiben. Es kann einige Minuten dauern, bis der Vorgang abgeschlossen ist.
Ihre Datenbank enthält nun Daten, die in eine Tabelle mit dem Namen GreenTaxiData geladen wurden.
5. Ausführen des Notebooks
Führen Sie die verbleibenden beiden Zellen sequenziell aus, um Daten aus Ihrer Tabelle abzufragen. Die Ergebnisse zeigen die 20 besten und niedrigsten Taxitarife und Entfernungen, die nach Jahr aufgezeichnet wurden.
6. Bereinigen der Ressourcen
Bereinigen Sie die erstellten Elemente, indem Sie zu dem Arbeitsbereich navigieren, in dem sie erstellt wurden.
Zeigen Sie in Ihrem Arbeitsbereich auf das Notebook, das Sie löschen möchten, und wählen Sie Menü „Mehr“ [...] >Löschen aus.
Klicken Sie auf Löschen. Sie können Ihr Notebook nach dem Löschen nicht mehr wiederherstellen.