Tutorial: Verwenden eines Notebooks mit Apache Spark zum Abfragen einer KQL-Datenbank

Artikel
11/19/2024

Notebooks sind sowohl lesbare Dokumente, die Beschreibungen und Ergebnisse der Datenanalyse enthalten, als auch ausführbare Dokumente, die zur Datenanalyse ausgeführt werden können. In diesem Artikel erfahren Sie, wie Sie ein Microsoft Fabric-Notebook verwenden, um mithilfe von Apache Spark Daten in einer KQL-Datenbank zu lesen und sie in diese zu schreiben. In diesem Tutorial werden vorab erstellte Datasets und Notebooks sowohl in der Real-Time Intelligence als auch in den Datentechnik-Umgebungen in Microsoft Fabric verwendet. Weitere Informationen zu Notebooks finden Sie unter Verwenden von Microsoft Fabric-Notebooks.

Sie lernen speziell Folgendes:

Erstellen einer KQL-Datenbank
Importieren eines Notebooks
Schreiben von Daten in eine KQL-Datenbank mithilfe von Apache Spark
Abfragen von Daten aus einer KQL-Datenbank

Voraussetzungen

Ein Arbeitsbereich mit einer Microsoft Fabric-fähigen Kapazität

1. Erstellen einer KQL-Datenbank

Öffnen Sie den Switcher für die Benutzererfahrung unten im Navigationsbereich, und wählen Sie Real-Time Intelligence aus.
Wählen Sie die KQL-Datenbank aus.
Geben Sie im Feld KQL-DatenbanknamenycGreenTaxi ein, und wählen Sie dann Erstellen aus.

Die KQL-Datenbank wird im Kontext des ausgewählten Arbeitsbereichs erstellt.
Kopieren Sie den Abfrage-URI aus der Karte der Datenbankdetails im Datenbankdashboard, und fügen Sie ihn irgendwo, z. B. in einen Editor, ein, um ihn in einem späteren Schritt zu verwenden.

2. Herunterladen des NYC GreenTaxi-Notebooks

Wir haben ein Beispielnotebook erstellt, das Sie durch alle erforderlichen Schritte zum Laden von Daten in Ihre Datenbank mit dem Spark-Connector führt.

Öffnen Sie das Fabric-Beispielrepository auf GitHub, um das NYC GreenTaxi KQL-Notebook herunterzuladen.
Speichern Sie das Notebook lokal auf Ihrem Gerät.

Hinweis

Das Notebook muss im Dateiformat .ipynb gespeichert werden.

3. Importieren des Notebooks

Der Rest dieses Workflows erfolgt im Abschnitt Datentechnik des Produkts und verwendet ein Spark-Notebook, um Daten in Ihre KQL-Datenbank zu laden und abzufragen.

Öffnen Sie den Umschalter für die Benutzeroberfläche unten im Navigationsbereich, und wählen Sie Entwickeln und dann Ihren Arbeitsbereich aus.
Wählen Sie Import>Notebook>Auf diesem Computer>Hochladen und dann das Notebook „NYC GreenTaxi“ aus, das Sie in einem vorherigen Schritt heruntergeladen haben.
Öffnen Sie das Notebook nach Abschluss des Imports in Ihrem Arbeitsbereich.

4. Abrufen der Daten

Um Ihre Datenbank mithilfe des Spark-Connectors abzufragen, müssen Sie Lese- und Schreibzugriff auf den NYC GreenTaxi-Blobcontainer gewähren.

Wählen Sie die Wiedergabeschaltfläche aus, um die folgenden Zellen auszuführen, oder wählen Sie die Zelle aus, und drücken Sie UMSCHALT+EINGABETASTE. Wiederholen Sie diesen Schritt für jede Codezelle.

Hinweis

Warten Sie, bis das Häkchen angezeigt wird, bevor Sie die nächste Zelle ausführen.

Führen Sie die folgende Zelle aus, um den Zugriff auf den NYC GreenTaxi-Blobcontainer zu ermöglichen.
Fügen Sie in KustoURI den zuvor kopiertenAbfrage-URI anstelle des Platzhaltertexts ein.
Ändern Sie den Platzhalternamen der Datenbank in nycGreenTaxi.
Ändern Sie den Platzhalternamen der Tabelle in GreenTaxiData.
Führen Sie die Zelle aus.
Führen Sie die nächste Zelle aus, um Daten in Ihre Datenbank zu schreiben. Es kann einige Minuten dauern, bis der Vorgang abgeschlossen ist.

Ihre Datenbank enthält nun Daten, die in eine Tabelle mit dem Namen GreenTaxiData geladen wurden.

5. Ausführen des Notebooks

Führen Sie die verbleibenden beiden Zellen sequenziell aus, um Daten aus Ihrer Tabelle abzufragen. Die Ergebnisse zeigen die 20 besten und niedrigsten Taxitarife und Entfernungen, die nach Jahr aufgezeichnet wurden.

6. Bereinigen der Ressourcen

Bereinigen Sie die erstellten Elemente, indem Sie zu dem Arbeitsbereich navigieren, in dem sie erstellt wurden.

Zeigen Sie in Ihrem Arbeitsbereich auf das Notebook, das Sie löschen möchten, und wählen Sie Menü „Mehr“ [...] >Löschen aus.
Klicken Sie auf Löschen. Sie können Ihr Notebook nach dem Löschen nicht mehr wiederherstellen.

Freigeben über

Tutorial: Verwenden eines Notebooks mit Apache Spark zum Abfragen einer KQL-Datenbank

Voraussetzungen

1. Erstellen einer KQL-Datenbank

2. Herunterladen des NYC GreenTaxi-Notebooks

3. Importieren des Notebooks

4. Abrufen der Daten

5. Ausführen des Notebooks

6. Bereinigen der Ressourcen

Feedback

Zusätzliche Ressourcen

Freigeben über

Tutorial: Verwenden eines Notebooks mit Apache Spark zum Abfragen einer KQL-Datenbank

Voraussetzungen

1. Erstellen einer KQL-Datenbank

2. Herunterladen des NYC GreenTaxi-Notebooks

3. Importieren des Notebooks

4. Abrufen der Daten

5. Ausführen des Notebooks

6. Bereinigen der Ressourcen

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen