Freigeben über


Problembehandlung bei Bereitstellungen von Azure-Knoten mit Microsoft HPC Pack

Dieses Thema enthält Informationen, die Ihnen oder dem Microsoft-Support bei der Problembehandlung bei Bereitstellungen von Azure-Knoten mit HPC Pack helfen.

Allgemeine Anforderungen und bewährte Methoden zum Bereitstellen von Azure-Knoten mit HPC Pack finden Sie in den folgenden Themen:

Allgemeine Anleitung zur Problembehandlung bei der Bereitstellung

  • Wenn ein Problem mit Ihrer Internetverbindung oder den Azure-Abonnementinformationen in der Knotenvorlage vorliegt, kann die Azure-Knotenbereitstellung fehlschlagen. Sie können die Verbindungseinstellungen für Azure in der Knotenvorlage überprüfen. Öffnen Sie die Vorlage im Knotenvorlagen-Editor. Klicken Sie dann auf der Registerkarte Verbindungsinformationen auf Verbindungsinformationenüberprüfen.

  • Wenn es ein Problem mit der Konfiguration des Azure-Verwaltungszertifikats gibt, lesen Sie Behandeln von Zertifikatproblemen.

  • Wenn Sie mindestens HPC Pack 2008 R2 mit SP2 ausführen, können Sie den Azure Firewall Ports Diagnosetest und den Azure Services Connection Diagnosetest ausführen, um zu überprüfen, ob die Netzwerkfirewall und andere Einstellungen ordnungsgemäß für die Kommunikation zwischen HPC Pack und Azure konfiguriert sind oder um Konnektivitätsprobleme zu beheben.

  • Wenn die Systemzeit auf dem Kopfknotencomputer (oder den Kopfknotencomputern) nicht genau festgelegt wird, können bestimmte Azure-Vorgänge wie die Erstellung von Knotenvorlagen oder das Bereitstellen neuer Knoten mit einem Fehler wie den folgenden fehlschlagen:

    Server failed to authenticate the request. Make sure the value of Authorization header is formed correctly including the signature.  
    
  • Wenn bei der Bereitstellung teilweise Fehler auftreten, bei denen die Azure-Knoten nicht online sind, können Sie versuchen, den folgenden Telnet-Befehl auszuführen, um festzustellen, ob der in der Knotenvorlage angegebene Clouddienst am Azure-Endpunkt erreichbar ist:

    telnet <ServiceName>.cloudapp.net 7999  
    

    Anmerkung

    Um diesen Befehl auszuführen, muss das Telnet-Clientfeature im Betriebssystem installiert sein. Informationen zum Installieren des Telnet-Clients mithilfe des Server-Managers finden Sie im Telnet Operations Guide.

  • Ein Problem in Azure kann sich auf eine Teilmenge der Azure-Knoten auswirken, die sich in einer Gruppe befinden. Wenn Sie beispielsweise eine große Anzahl von Knoten starten, ist es möglich, dass die Bereitstellung auf einem oder mehreren Knoten fehlschlägt. In diesem Fall werden die entsprechenden Statusinformationen für die fehlgeschlagenen Knoten in Ressourcenverwaltung angezeigt (in einigen Versionen von HPC Pack als Node Management bezeichnet).

  • Informationen zum Bereitstellungsstatus werden in den Dienstkontoinformationen im Portal angezeigt. HPC Cluster Manager fragt dieses Portal regelmäßig nach aktualisierten Statusinformationen ab. Die Informationen im Portal können sich jedoch in den Bereitstellungsprotokollen oder dem Betriebsprotokoll im HPC Cluster Manager unterscheiden.

  • Wenn in Azure ein Bereitstellungsfehler auftritt, werden möglicherweise eine Fehlermeldung und Problembehandlungsinformationen in den Clouddienstinformationen im Portal oder im Bereitstellungsprotokoll im HPC Cluster Manager angezeigt. Wenn Sie das Problem nicht beheben können, können Sie die Ablaufverfolgungsprotokolle überprüfen, die in den Rolleninstanzen in der Bereitstellung generiert werden. Weitere Informationen finden Sie unter Ablaufverfolgungsprotokolldateien auf Azure-Knoten in diesem Thema.

    Sie können auch Azure Supportbesuchen. Um das Problem zu beheben, müssen Sie die Abonnement-ID bereitstellen, die in der Knotenvorlage konfiguriert ist, und die Bereitstellungs-ID, die im Bereitstellungsprotokoll im HPC Cluster Manager und im Portal angezeigt wird.

  • Nachdem Sie eine Reihe von Knoten in Azure bereitgestellt haben, können Sie einen zusätzlichen Satz von Knoten mithilfe derselben Knotenvorlage starten. In einigen Fällen können die zusätzlichen Knoten jedoch nicht im HPC Cluster-Manager online sein, aber sie scheinen in Azure erfolgreich bereitgestellt zu werden. In diesem Fall ist es möglicherweise nicht möglich, den HPC Cluster-Manager zu verwenden, um die fehlgeschlagenen Knoten zu beenden oder zu löschen. Beenden Sie bei Bedarf zuerst den HPC-Verwaltungsdienst, und starten Sie den Dienst neu. Verwenden Sie dann das Azure-Verwaltungsportal, um die Knoten zu löschen.

  • Ab HPC Pack 2012 mit SP1 können Sie sich bei der Problembehandlung bei Azure-Knotenbereitstellungen entscheiden, den Kopfknoten zu sammeln und an Microsoft-Daten über die Verfügbarkeit, Konnektivität und Leistung von Azure-Knoten zu senden. Sie können dies tun, wenn Sie einen Supportvorfall im Zusammenhang mit einer Azure-Knotenbereitstellung öffnen müssen. Klicken Sie zum Aktivieren der Datensammlung im HPC Cluster Manager im Menü Optionen auf Azure Support Data Collection. Konfigurieren Sie alternativ die AzureMetricsCollectionEnabled Clustereigenschaft mithilfe des cmdlets Set-HpcClusterProperty HPC PowerShell. Weitere Informationen zur Datensammlung finden Sie in den datenschutzbestimmungen Microsoft HPC Pack.

Ablaufverfolgungsprotokolldateien auf Azure-Knoten

Ab HPC Pack 2008 R2 mit SP4 werden Ablaufverfolgungsprotokolldateien automatisch auf Azure-Arbeitsknoten und auf den Azure HPC-Proxyknoten generiert, die automatisch für jede Bereitstellung bereitgestellt werden. Die Protokolldateien können Ihnen oder dem Microsoft-Support bei der Behandlung von Problemen während oder nach der Knotenbereitstellung helfen– z. B. Bedingungen, die dazu führen können, dass ein Azure-Knoten einen Integritätsstatus von nicht erreichbaren oder Fehler-anzeigt, obwohl das Portal möglicherweise einen Status von Readyangeben kann.

Die Ablaufverfolgungsprotokolldateien enthalten die folgenden Arten von Informationen zu den einzelnen Knoten:

  • Bootstrapping-Informationen für das Betriebssystem.

  • Informationen zu den HPC Pack-Diensten, die auf dem Knoten ausgeführt werden sollen.

  • Informationen zur Hosts-Datei.

  • Leistungsindikatordaten des Betriebssystems.

Die Protokolldateien werden in den lokalen Speicher auf jedem Knoten geschrieben, wie in der folgenden Tabelle dargestellt. Die Formate, Merkmale und die Benennung der Ablaufverfolgungsprotokolldateien hängen von der Version des HPC Pack ab.

Wichtig

Die Protokolldateien werden nur im lokalen Speicher auf den Azure-Rolleninstanzen verwaltet, während die Knoten in Azure bereitgestellt bleiben. Sofern die Dateien oder Daten nicht an einen anderen Speicherort kopiert werden, können Sie die Ablaufverfolgungsprotokollinformationen nicht überprüfen, nachdem die Azure-Knoten beendet oder gelöscht wurden. Weitere Informationen finden Sie unter Szenarien zum Speichern von Ablaufverfolgungsprotokolldaten in diesem Thema.

Version von HPC Pack Protokolldateien Notizen
HPC Pack 2012 oder höher - Workerknoten C:\logs\hpcworker_nnnnnnn.bin
- Proxyknoten C:\logs\hpcproxy_nnnnnn.bin
- Protokolldateien befinden sich im Binärformat. Die Standardprotokollierungsebene ist ausführlich.
- Jede Protokolldatei ist standardmäßig maximal 4 MB groß, und auf jedem Knoten können maximal 5000 MB Protokolldateien gespeichert werden.
- Um die Analyse zu vereinfachen, können Protokolldateien in tabtrennte Textdateien konvertiert werden, indem sie den Parselog Unterbefehl des hpctrace Befehlszeilentool ausführen, das mit HPC Pack installiert ist. Weitere Informationen zur Verwendung dieses Befehls finden Sie unter hpctrace.
HPC Pack 2008 R2 mit SP4 - Workerknoten C:\logs\hpcworker.log
- Proxyknoten C:\logs\hpcproxy.log
- Protokolldateien befinden sich im Textformat. Die Standardprotokollierungsebene ist Warnung oder höher.
- Bis zu fünf nummerierte Überlaufprotokolldateien mit der Erweiterung .00<Integer> werden auf jedem Knoten geschrieben.
- Protokolldateien auf jedem Knoten sind auf 60 MB begrenzt und werden dann automatisch gezyklust.

Anmerkung

Sie können die Konfigurieren von Einstellungen für den Clouddienst im klassischen Portal verwenden, um die Ablaufverfolgungsebene für bestimmte Prozesse auf den Azure-Knoten zu ändern (z. B. Microsoft.Hpc.Azure.AzureNodeManagerTracing).

Szenarien zum Speichern von Ablaufverfolgungsprotokolldaten

Die in Azure-Rolleninstanzen generierten Ablaufverfolgungsprotokolldateien verbleiben in lokalen Speicher auf den Rolleninstanzen, solange die Rolleninstanzen ausgeführt werden. Wenn Sie jedoch auf die Daten zugreifen möchten, nachdem eine Azure-Bereitstellung beendet wurde oder die Knoten gelöscht werden, müssen Sie die Ablaufverfolgungsprotokolldateien oder -daten im beständigen Speicher herunterladen oder speichern, z. B. Azure Storage, während die Rolleninstanzen ausgeführt werden. Es folgen Szenarien zum Speichern von Ablaufverfolgungsprotokolldateien oder -daten.

Szenario 1: Aktivieren der automatischen Übertragung von Ablaufverfolgungsprotokolldateien in Azure Blob Storage

Ab HPC Pack 2012 mit SP1 kann der HPC-Clusteradministrator optional die automatische Übertragung von Ablaufverfolgungsprotokolldateien von den Azure-Compute- oder Proxyknoten in einer Bereitstellung in einen Container im Blob-Speicher (Hpclogs) im Azure Storage-Konto für die Bereitstellung aktivieren.

Klicken Sie zum Aktivieren der automatischen Übertragung von Ablaufverfolgungsprotokolldateien in das Azure-Speicherkonto im HPC Cluster-Manager im Menü Optionen auf Azure Deployment Configuration. Sie können die AzureLogstoBlob HPC-Clustereigenschaft auch mithilfe des cmdlets Set-HpcClusterProperty HPC PowerShell festlegen. Sie können protokolle für Proxyknoten, Workerknoten oder beides übertragen. Standardmäßig ist die Übertragung des Blobspeichers von Protokolldateien deaktiviert. Das Ändern der AzureLogstoBlob--Eigenschaft wirkt sich nur auf die Übertragung von Protokolldateien für zukünftige Azure-Knotenbereitstellungen aus. Die aktuellen Bereitstellungen sind nicht betroffen. Weitere Informationen finden Sie unter Set-HpcClusterProperty.

Wichtig

Das Speichern von Azure-Bereitstellungsprotokolldateien im BLOB-Speicher verwendet Speicherplatz und generiert Speichertransaktionen auf dem Speicherkonto, das jeder Bereitstellung zugeordnet ist. Wenn diese Option aktiviert ist, kann sich das Speichern von Protokolldateien von Arbeitsknoten auf die Leistung aller Azure-Bereitstellungen auswirken, die dasselbe Speicherkonto verwenden, insbesondere, wenn Sie über große Bereitstellungen oder mehrere gleichzeitige Bereitstellungen verfügen. Der Speicherplatz und die Speichertransaktionen werden Ihrem Konto in Rechnung gestellt. Nachdem Sie die Übertragung von Protokolldateien deaktiviert haben, werden die Protokolldateien nicht automatisch aus Azure Storage entfernt. Sie können die Protokolldateien für zukünftige Verweise beibehalten, indem Sie sie herunterladen. Die Protokolldateien können bereinigt werden, indem sie den Hpclogs-Container aus Ihrem Speicherkonto entfernen.

Sie können den befehl hpcazurelog auf den Kopfknoten ausführen, um Daten aus blob storage im Speicherkonto in einen lokalen Ordner herunterzuladen und die Dateien aus blob storage zu löschen. Weitere Informationen finden Sie unter hpcazurelog.

Szenario 2: Aktivieren der automatischen Übertragung von Ablaufverfolgungsprotokolldaten in azure-Tabellenspeicher

Ab HPC Pack 2012 kann der HPC-Clusteradministrator optional die Übertragung von Ablaufverfolgungsprotokolldaten von den Azure-Knoten in einer Bereitstellung in eine Azure-Diagnosetabelle (WADSLogsTable) aktivieren, die für diesen Zweck im Azure-Speicherkonto für die Bereitstellung erstellt wurde.

Um die Übertragung von Ablaufverfolgungsprotokolldaten in die WADSLogsTable-Tabelle im Azure-Speicherkonto zu ermöglichen, legen Sie die AzureLoggingEnabled-eigenschaft HPC-Clustereigenschaft auf "true" fest, indem Sie das Cmdlet Set-HpcClusterProperty HPC PowerShell verwenden. Standardmäßig werden nur kritische, Fehler- und Warnungsereignisse in den Protokolldateien nach Aufnahme in die WADSLogstable-Tabelle gefiltert. Das Ändern der AzureLoggingEnabled--Eigenschaft wirkt sich nur auf die Protokollierung für zukünftige Azure-Knotenbereitstellungen aus. Die aktuellen Bereitstellungen sind nicht betroffen. Weitere Informationen finden Sie unter Set-HpcClusterProperty.

Wichtig

  • Die Protokollierung von Azure-Bereitstellungsaktivitäten verwendet Tabellenspeicherplatz und generiert Speichertransaktionen für das Speicherkonto, das jeder Bereitstellung zugeordnet ist. Der Speicherplatz und die Speichertransaktionen werden gemäß den Bedingungen des Azure-Abonnements belastet.
  • Die Protokollierung bei Azure Storage sollte in der Regel nur aktiviert werden, wenn Probleme mit der Bereitstellung auftreten, und um Probleme bei der Problembehandlung bei der Bereitstellung zu unterstützen. Nachdem Sie die Protokollierung bei Azure Storage deaktiviert haben, werden die Protokolldaten nicht automatisch aus Azure Storage entfernt. Sie können die Protokolle für zukünftige Verweise beibehalten, indem Sie sie herunterladen. Die Protokolleinträge können bereinigt werden, indem sie die WADLogsTable aus Ihrem Speicherkonto entfernen.

Ab HPC Pack 2012 mit SP1 können Sie den befehl hpcazurelog auf dem Kopfknoten ausführen, um Daten aus der WADLogsTable im Speicherkonto in einen lokalen Ordner herunterzuladen und die Ablaufverfolgungsebene der daten anzugeben, die für die Speicherung in der Tabelle ausgewählt sind. Weitere Informationen finden Sie unter hpcazurelog.

Szenario 3: Manuelles Abrufen und Speichern von Protokolldateien von Azure-Knoten

Um eine weitere Analyse zu erleichtern, können Sie Protokolldateien von Azure-Knoten manuell auf einen lokalen Computer herunterladen oder in ein Azure-Speicherkonto hochladen.

Herunterladen von Protokolldateien

Zum Herunterladen der Protokolldateien können Sie eines der folgenden Verfahren verwenden:

  • Führen Sie den hpcfile get Befehl aus, um Protokolldateien von jedem Knoten einzeln herunterzuladen.

  • Führen Sie ein Skript aus, das hpcfile verwendet, abrufen, um Dateien aus Gruppen von Arbeitsknoten herunterzuladen.

  • Verwenden Sie das Azure-Verwaltungsportal, um eine Remoteverbindung mit jedem Knoten einzeln herzustellen. Anschließend können Sie die Protokolldatei oder Dateien auf einen lokalen Computer kopieren.

  • Führen Sie den Befehl hpcazurelog auf dem Kopfknoten aus, um Dateien von Azure-Arbeitsknoten oder Proxyknoten herunterzuladen. Dieser Befehl wurde in HPC Pack 2012 mit SP1 eingeführt und wird in früheren Versionen nicht unterstützt. Weitere Informationen finden Sie unter hpcazurelog.

Anmerkung

  • Um eine Remoteverbindung mit einem Azure-Knoten herzustellen, stellen Sie sicher, dass Sie Remotedesktopanmeldeinformationen in der Azure-Knotenvorlage konfigurieren.
  • Um die Protokolldateien von HPC-Proxyknoten herunterzuladen, müssen Sie eine Remoteverbindung zu jedem Knoten herstellen und dann Protokolldateien einzeln auf einen lokalen Computer kopieren.

Im Folgenden finden Sie Beispielbefehle und Skripts, die hpcfile get verwenden, um die Protokolldateien von Azure-Arbeitsknoten herunterzuladen. Weitere Informationen zur Befehlssyntax finden Sie unter hpcfile.

Beispiel 1. So laden Sie die Ablaufverfolgungsprotokolldateien, einschließlich möglicher Überlaufdateien, vom Azure-Knoten AZURECN-001- auf einem Cluster mit einem HPC Pack 2008 R2 mit sp4 head node namens myHeadNode in den aktuellen Ordner auf dem lokalen Computer herunter, um die Dateien umzubenennen, um das Überschreiben von Dateien auf dem lokalen Computer zu vermeiden:

hpcfile get /scheduler:myHeadNode /targetnode:AZURECN-001 /file:"C:\logs\hpcworker.log" /destfile:"worker001.log"  
hpcfile get /scheduler:myHeadNode /targetnode:AZURECN-001 /file:"C:\logs\hpcworker.log.001" /destfile:"worker002.log"  
hpcfile get /scheduler:myHeadNode /targetnode:AZURECN-001 /file:"C:\logs\hpcworker.log.002" /destfile:"worker003.log"  
hpcfile get /scheduler:myHeadNode /targetnode:AZURECN-001 /file:"C:\logs\hpcworker.log.003" /destfile:"worker004.log"  
hpcfile get /scheduler:myHeadNode /targetnode:AZURECN-001 /file:"C:\logs\hpcworker.log.004" /destfile:"worker005.log"  
hpcfile get /scheduler:myHeadNode /targetnode:AZURECN-001 /file:"C:\logs\hpcworker.log.005" /destfile:"worker006.log"  

Beispiel 2. So laden Sie die hpcworker_000000.bin Protokolldateien aus den Azure-Knoten in der Knotengruppe WorkerNodes mit Namen ab AZURECN- auf einem Cluster mit einem HPC Pack 2012-Kopfknoten namens myHeadNode in den Ordner C:\myFiles\myLogs\myLogs auf dem lokalen Computer herunter:

@echo off  
set "extension=.bin"  
set "fullfilepath=C:\myFiles\myLogs"  
mkdir C:\myFiles\myLogs  
FOR /F "tokens=1 delims="%%G IN ('node list /group:WorkerNodes ^| FIND "AZURECN-"') DO hpcfile get /scheduler:MyHeadNode /targetnode:%%G -file:"C:\logs\hpcworker_000000.bin" /destfile:"%fullfilepath%%%G%%%extension%"  

Hochladen von Protokolldateien in das Azure-Speicherkonto

Sie können eines der folgenden Verfahren verwenden, um die Ablaufverfolgungsprotokolldateien von Azure-Workerknoten in ein Azure-Speicherkonto hochzuladen:

  1. Laden Sie eine oder mehrere Protokolldateien auf einen lokalen Computer herunter, wie im vorherigen Abschnitt beschrieben, und laden Sie sie dann in ein Azure-Speicherkonto hoch, indem Sie den Hpcpack-Upload Befehl ausführen.

  2. Führen Sie ein Skript auf einem oder mehreren Azure-Knoten aus, das hpcpack upload verwendet, um die Protokolldateien direkt in das Speicherkonto hochzuladen.

    Anmerkung

    • Um ein Skript auf einer Gruppe von Azure-Knoten auszuführen, können Sie das Skript zuerst von einem lokalen Computer auf die Knoten hochladen.
    • Wie in Szenario 1 beschrieben: Aktivieren der automatischen Übertragung von Ablaufverfolgungsprotokolldateien in Azure Blob Storageab HPC Pack 2012 mit SP1 können Sie die automatische Übertragung von Ablaufverfolgungsprotokolldateien in blob Storage im Azure Storage-Konto aktivieren. Wenn Sie jedoch keine Version von HPC Pack verwenden, die diese Funktion unterstützt, oder Sie die automatische Übertragung von Protokolldateien in blob-Speicher nicht aktiviert haben, können Sie sie manuell an diesen Speicherort hochladen.

Im Folgenden sind Beispielskripts aufgeführt, die hpcpack upload verwenden, um die Protokolldateien von Azure-Workerknoten in das Azure-Speicherkonto hochzuladen. Weitere Informationen zur Befehlssyntax finden Sie unter hpcpack.

Anmerkung

Da Protokolldateien auf Arbeitsknoten identisch benannt werden, sollten Sie das Überschreiben von Dateien vermeiden, wenn Sie sie in das Azure-Speicherkonto hochladen. Sie können beispielsweise die Protokolldateien mit Namen umbenennen, die den Hostnamen des Knotens enthalten, wie in den folgenden Beispielen gezeigt.

Beispiel 3. So laden Sie die hpcworker_000000.bin Dateien von Azure-Workerknoten in den Container hoch und umbenennen sie in den Container MyLogs im Azure-Speicherkonto namens MyStorageAccount mit einem Primärschlüssel namens MyPrimaryKey

@echo off  
REM Get the host name of the Azure node  
FOR /F "usebackq" %%i IN ('e:\approot\mpiexec.exe -c 1 hostname') DO SET filename=%%i  
set "extension=.bin"  
set "fullpath=C:\logs"  
REM Consolidate the log file name (e.g., AzureCN-001.bin)  
set "fullfilePath=%fullpath%%filename%%extension%"  
REM echo:%fullfilePath%  
REM Create a temporary file with desired name  
copy C:\logs\hpcworker_000000.bin %fullfilePath%  
e:\approot\hpcpack upload %fullfilePath% /account:MyStorageAccount /container:MyLogs /key:MyPrimaryKey  
del %fullfilePath%  

Beispiel 4. Um ein Skript Uploader.bat (ähnlich dem Skript in Beispiel 3) vom Kopfknoten in einen Container mit dem Namen MyContainer in einem Azure-Speicherkonto namens MyStorageAccounthochzuladen, laden Sie das Skript in die Knotengruppe WorkerNodesherunter, und führen Sie dann Uploader.bat auf den Knoten in WorkerNodesaus:

hpcpack upload uploader.bat /account:MyStorageAccount /container:MyLogs /key:MyPrimaryKey  
clusrun /nodegroup:WorkerNodes hpcpack download uploader.bat /account:MyStorageAccount /container:MyLogs /key:MyPrimaryKey /path:c:\logs  
clusrun /nodegroup:WorkerNodes c:\logs\uploader.bat  
clusrun /nodegroup:WorkerNodes del c:\logs\uploader.bat  

Anzeigen von Protokolldaten in einem Azure-Speicherkonto

Um Protokolle anzuzeigen, die sich in Azure-Tabelle oder blob-Speicher befinden, können Sie den Speicher mithilfe eines Tools wie Azure Storage Explorerdurchsuchen.

Siehe auch

Burst to Azure Worker Instances mit Microsoft HPC Pack
hpcazurelog