Condividi tramite


Scenario: il nodo del cluster esaurisce lo spazio su disco in Azure HDInsight

Questo articolo descrive le procedure di risoluzione dei problemi e le possibili soluzioni per i problemi che si verificano quando si interagisce con i cluster Azure HDInsight.

Problema

Un processo può non riuscire e restituire un messaggio di errore simile al seguente: /usr/hdp/2.6.3.2-14/hadoop/libexec/hadoop-config.sh: fork: No space left on device.

In alternativa, è possibile ricevere un avviso di Apache Ambari simile a: local-dirs usable space is below configured utilization percentage.

Causa

È possibile che la cache dell'applicazione Apache Yarn abbia utilizzato tutto lo spazio su disco disponibile. Probabilmente l'applicazione Spark viene eseguita in modo non efficiente.

Risoluzione

  1. Usare l'interfaccia utente di Ambari per determinare quale nodo sta esaurendo lo spazio su disco.

  2. Determinare quale cartella nel nodo con problemi utilizza la maggior parte dello spazio su disco. Innanzitutto, connettersi al nodo tramite SSH, quindi eseguire df per elencare l'utilizzo del disco per tutti i montaggi. In genere è /mnt, che è un disco temporaneo usato dal sistema operativo. È possibile entrare in una cartella e digitare sudo du -hs per visualizzare il riepilogo delle dimensioni dei file in una cartella. Se viene visualizzata una cartella simile a /mnt/resource/hadoop/yarn/local/usercache/livy/appcache/application_1537280705629_0007, questo output indica che l'applicazione è ancora in esecuzione. Questo output potrebbe essere dovuto alla persistenza RDD o ai file casuali intermedi.

  3. Per attenuare il problema, terminare l'applicazione per rilasciare lo spazio su disco usato da tale applicazione.

  4. Se il problema si verifica spesso nei nodi di lavoro, è possibile ottimizzare le impostazioni della cache locale di YARN nel cluster.

    Aprire l'interfaccia utente di Ambari e passare a YARN --> Configurazioni --> Avanzate.
    Aggiungere le due proprietà seguenti alla sezione yarn-site.xml personalizzata e salvare:

    yarn.nodemanager.localizer.cache.target-size-mb=2048
    yarn.nodemanager.localizer.cache.cleanup.interval-ms=300000
    
  5. Se il problema non viene risolto in modo permanente, ottimizzare l'applicazione.

Passaggi successivi

Se il problema riscontrato non è presente in questo elenco o se non si riesce a risolverlo, visitare uno dei canali seguenti per ottenere ulteriore assistenza:

  • Ricevere risposte dagli esperti di Azure tramite la pagina Supporto della community per Azure.

  • Connettersi con @AzureSupport, l'account ufficiale Microsoft Azure per migliorare l'esperienza del cliente. Mette in contatto la community di Azure con le risorse giuste: risposte, supporto ed esperti.

  • Se serve ulteriore assistenza, è possibile inviare una richiesta di supporto dal portale di Azure. Selezionare Supporto nella barra dei menu o aprire l'hub Guida e supporto. Per informazioni più dettagliate, vedere Come creare una richiesta di supporto in Azure. L'accesso al supporto per la gestione delle sottoscrizioni e la fatturazione è incluso nella sottoscrizione di Microsoft Azure e il supporto tecnico viene fornito tramite uno dei piani di supporto di Azure.