Aracılığıyla paylaş


Hızlı Başlangıç: Apache Zeppelin ile Azure HDInsight'ta Apache Hive sorguları yürütme

Bu hızlı başlangıçta, Apache Zeppelin kullanarak Azure HDInsight'ta Apache Hive sorguları çalıştırmayı öğreneceksiniz. HDInsight Etkileşimli Sorgu kümeleri, etkileşimli Hive sorguları çalıştırmak için kullanabileceğiniz Apache Zeppelin not defterlerini içerir.

Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.

Önkoşullar

HDInsight Etkileşimli Sorgu kümesi. Bkz. HDInsight kümesi oluşturmak için küme oluşturma. Etkileşimli Sorgu küme türünü seçtiğinizden emin olun.

Apache Zeppelin Notu oluşturma

  1. değerini aşağıdaki URL'deki https://CLUSTERNAME.azurehdinsight.net/zeppelinkümenizin adıyla değiştirinCLUSTERNAME. Ardından URL'yi bir web tarayıcısına girin.

  2. Küme oturum açma kullanıcı adınızı ve parolanızı girin. Zeppelin sayfasından yeni bir not oluşturabilir veya mevcut notları açabilirsiniz. HiveSample bazı örnek Hive sorguları içerir.

    HDInsight Etkileşimli Sorgu zeppelin.

  3. Yeni not oluştur'u seçin.

  4. Yeni not oluştur iletişim kutusunda aşağıdaki değerleri yazın veya seçin:

    • Not Adı: Not için bir ad girin.
    • Varsayılan yorumlayıcı: Açılan listeden jdbc'yi seçin.
  5. Not Oluştur'u seçin.

  6. Kod bölümüne aşağıdaki Hive sorgusunu girin ve Shift + Enter tuşlarına basın:

    %jdbc(hive)
    show tables
    

    HDInsight Etkileşimli Sorgu zeppelin sorguyu çalıştırır.

    %jdbc(hive) İlk satırdaki deyimi not defterine Hive JDBC yorumlayıcısını kullanmasını söyler.

    Sorgu hivesampletable adlı bir Hive tablosu döndürecektir.

    Hivesampletable için çalıştırabileceğiniz iki Hive sorgusu daha aşağıdadır:

    %jdbc(hive)
    select * from hivesampletable limit 10
    
    %jdbc(hive)
    select ${group_name}, count(*) as total_count
    from hivesampletable
    group by ${group_name=market,market|deviceplatform|devicemake}
    limit ${total_count=10}
    

    Geleneksel Hive ile karşılaştırıldığında sorgu sonuçları çok daha hızlı bir şekilde geri gelir.

Daha fazla örnek

  1. Bir tablo oluşturun. Zeppelin Not Defteri'nde kodu yürütür:

    %jdbc(hive)
    CREATE EXTERNAL TABLE log4jLogs (
        t1 string,
        t2 string,
        t3 string,
        t4 string,
        t5 string,
        t6 string,
        t7 string)
    ROW FORMAT DELIMITED
    FIELDS TERMINATED BY ' '
    STORED AS TEXTFILE;
    
  2. Yeni tabloya veri yükleyin. Zeppelin Not Defteri'nde kodu yürütür:

    %jdbc(hive)
    LOAD DATA
    INPATH 'wasbs:///example/data/sample.log'
    INTO TABLE log4jLogs;
    
  3. Tek bir kayıt ekleyin. Zeppelin Not Defteri'nde kodu yürütür:

    %jdbc(hive)
    INSERT INTO TABLE log4jLogs2
    VALUES ('A', 'B', 'C', 'D', 'E', 'F', 'G');
    

Daha fazla söz dizimi için Hive dil kılavuzunu gözden geçirin.

Kaynakları temizleme

Hızlı başlangıcı tamamladıktan sonra kümeyi silmek isteyebilirsiniz. HDInsight ile verileriniz Azure Depolama'de depolanır, böylece kullanılmadığında kümeyi güvenle silebilirsiniz. Kullanımda olmasa bile HDInsight kümesi için de ücretlendirilirsiniz. Küme ücretleri depolama ücretlerinden çok daha fazla olduğundan, kullanımda olmayan kümeleri silmek ekonomik bir anlam ifade eder.

Kümeyi silmek için bkz . Tarayıcınızı, PowerShell'i veya Azure CLI'yı kullanarak HDInsight kümesini silme.

Sonraki adımlar

Bu hızlı başlangıçta, Apache Zeppelin kullanarak Azure HDInsight'ta Apache Hive sorguları çalıştırmayı öğrendiniz. Hive sorguları hakkında daha fazla bilgi edinmek için, sonraki makalede Visual Studio ile sorguların nasıl yürütüleceği gösterilir.