Dela via


Visa fel i hälsotjänsten

Gäller för: Azure Local, versionerna 23H2 och 22H2; Windows Server 2022, Windows Server 2019

Hälsotjänst övervakar ständigt ditt Lagringsutrymmen Direct-kluster för att identifiera problem och generera "fel". En cmdlet visar eventuella aktuella fel, så att du enkelt kan verifiera hälsotillståndet för distributionen utan att titta på varje entitet eller funktion i tur och ordning. Fel är utformade till att vara exakta, lätta att förstå och kunna åtgärdas.

Varje fel innehåller fem viktiga fält:

  • Allvarlighet
  • Beskrivning av problemet
  • Rekommenderade nästa steg för att lösa problemet
  • Identifieringsinformation för felaktig entitet
  • Dess fysiska plats (om tillämpligt)

Här är till exempel ett vanligt fel:

Severity: MINOR
Reason: Connectivity has been lost to the physical disk.
Recommendation: Check that the physical disk is working and properly connected.
Part: Manufacturer Contoso, Model XYZ9000, Serial 123456789
Location: Seattle DC, Rack B07, Node 4, Slot 11

Kommentar

Den fysiska platsen härleds från konfigurationen för feldomänen. Mer information om feldomäner finns i Feldomänmedvetenhet. Om du inte anger den här informationen är platsfältet mindre användbart. Den kanske till exempel bara visar facknumret.

Rotorsaksanalys

Hälsotjänst kan utvärdera det potentiella orsakssambandet mellan felande entiteter för att identifiera och kombinera fel som är följder av samma underliggande problem. Genom att känna igen effektkedjor uppstår färre rapporteringar. Om en server till exempel är nere förväntas alla enheter på servern också vara utan anslutning. Därför genereras bara ett fel för rotorsaken – i det här fallet servern.

Användning i PowerShell

Kör följande cmdlet för att se eventuella aktuella fel i PowerShell:

Get-HealthFault

Detta returnerar eventuella fel som påverkar det övergripande Lagringsutrymmen Direct-klustret. De här felen gäller oftast maskinvara eller konfiguration. Om det inte finns några fel returnerar cmdleten ingenting.

Kommentar

I en icke-produktionsmiljö och på egen risk kan du experimentera med den här funktionen genom att utlösa fel själv. Du kan till exempel göra detta genom att ta bort en fysisk disk eller stänga av en nod. När felet visas sätter du in den fysiska disken igen eller startar om noden så att felet försvinner.

Användning i .NET och C#

Det här avsnittet visar hur du ansluter till Hälsotjänst, använder identifieringsobjekt och kör felfrågor.

Anslut

För att köra frågor mot Hälsotjänst upprättar du en CimSession med klustret. För att göra det behöver du vissa saker som bara är tillgängliga i fullständig Microsoft .NET, vilket innebär att du inte enkelt kan göra detta direkt från en webb- eller mobilapp. Kodexemplen i det här avsnittet använder C#, det enklaste valet för det här dataåtkomstskiktet.

using System.Security;
using Microsoft.Management.Infrastructure;

public CimSession Connect(string Domain = "...", string Computer = "...", string Username = "...", string Password = "...")
{
    SecureString PasswordSecureString = new SecureString();
    foreach (char c in Password)
    {
        PasswordSecureString.AppendChar(c);
    }

    CimCredential Credentials = new CimCredential(
        PasswordAuthenticationMechanism.Default, Domain, Username, PasswordSecureString);
    WSManSessionOptions SessionOptions = new WSManSessionOptions();
    SessionOptions.AddDestinationCredentials(Credentials);
    Session = CimSession.Create(Computer, SessionOptions);
    return Session;
}

Det angivna användarnamnet ska vara en lokal administratör för måldatorn.

Vi rekommenderar att du skapar Lösenordet SecureString direkt från användarens indata i realtid, så att lösenordet aldrig lagras i minnet i klartext. Detta hjälper till att minska en mängd olika säkerhetsproblem. Men i praktiken är det vanligt att konstruera det som ovan i prototypsyfte.

Identifiera objekt

När CimSession har upprättats kan du fråga Windows Management Instrumentation (WMI) i klustret.

Innan du kan hämta fel eller mått måste du hämta instanser av flera relevanta objekt. Hämta först MSFT_StorageSubSystem som representerar Lagringsutrymmen Direct i klustret. Med det kan du få varje MSFT_StorageNode i klustret och varje MSFT_Volume av datavolymerna. Slutligen måste du hämta MSCluster_ClusterHealthService, Hälsotjänst själv.

CimInstance Cluster;
List<CimInstance> Nodes;
List<CimInstance> Volumes;
CimInstance HealthService;

public void DiscoverObjects(CimSession Session)
{
    // Get MSFT_StorageSubSystem for Storage Spaces Direct
    Cluster = Session.QueryInstances(@"root\microsoft\windows\storage", "WQL", "SELECT * FROM MSFT_StorageSubSystem")
        .First(Instance => (Instance.CimInstanceProperties["FriendlyName"].Value.ToString()).Contains("Cluster"));

    // Get MSFT_StorageNode for each cluster node
    Nodes = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToStorageNode", null, "StorageSubSystem", "StorageNode").ToList();

    // Get MSFT_Volumes for each data volume
    Volumes = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToVolume", null, "StorageSubSystem", "Volume").ToList();

    // Get MSFT_StorageHealth itself
    HealthService = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToStorageHealth", null, "StorageSubSystem", "StorageHealth").First();
}

Det här är samma objekt som du får i PowerShell med hjälp av cmdletar som Get-StorageSubSystem, Get-StorageNode och Get-Volume.

Du kan komma åt samma egenskaper som dokumenteras i API-klasser för lagringshantering.

using System.Diagnostics;

foreach (CimInstance Node in Nodes)
{
    // For illustration, write each node's Name to the console. You could also write State (up/down), or anything else!
    Debug.WriteLine("Discovered Node " + Node.CimInstanceProperties["Name"].Value.ToString());
}

Frågefel

Anropa Diagnose för att hämta eventuella aktuella fel som är begränsade till mål-CimInstance, som kan vara antingen klustret eller valfri volym.

Den fullständiga listan över fel som är tillgängliga i varje omfång i Windows Server 2019 dokumenteras senare i avsnittet Täckning .

public void GetFaults(CimSession Session, CimInstance Target)
{
    // Set Parameters (None)
    CimMethodParametersCollection FaultsParams = new CimMethodParametersCollection();
    // Invoke API
    CimMethodResult Result = Session.InvokeMethod(Target, "Diagnose", FaultsParams);
    IEnumerable<CimInstance> DiagnoseResults = (IEnumerable<CimInstance>)Result.OutParameters["DiagnoseResults"].Value;
    // Unpack
    if (DiagnoseResults != null)
    {
        foreach (CimInstance DiagnoseResult in DiagnoseResults)
        {
            // TODO: Whatever you want!
        }
    }
}

Valfritt: MyFault-klass

Det kan vara meningsfullt att konstruera och bevara din egen representation av fel. Klassen MyFault lagrar till exempel flera viktiga egenskaper för fel, inklusive FaultId, som kan användas senare för att antingen associera uppdateringar, ta bort meddelanden eller deduplicera om samma fel upptäcks flera gånger.

public class MyFault {
    public String FaultId { get; set; }
    public String Reason { get; set; }
    public String Severity { get; set; }
    public String Description { get; set; }
    public String Location { get; set; }

    // Constructor
    public MyFault(CimInstance DiagnoseResult)
    {
        CimKeyedCollection<CimProperty> Properties = DiagnoseResult.CimInstanceProperties;
        FaultId     = Properties["FaultId"                  ].Value.ToString();
        Reason      = Properties["Reason"                   ].Value.ToString();
        Severity    = Properties["PerceivedSeverity"        ].Value.ToString();
        Description = Properties["FaultingObjectDescription"].Value.ToString();
        Location    = Properties["FaultingObjectLocation"   ].Value.ToString();
    }
}
List<MyFault> Faults = new List<MyFault>;

foreach (CimInstance DiagnoseResult in DiagnoseResults)
{
    Faults.Add(new Fault(DiagnoseResult));
}

Den fullständiga listan över egenskaper i varje fel (DiagnoseResult) dokumenteras senare i avsnittet Felegenskaper .

Felhändelser

När fel skapas, tas bort eller uppdateras genererar Hälsotjänst WMI-händelser. Dessa är viktiga för att hålla programtillståndet synkroniserat utan frekvent avsökning, och kan till exempel hjälpa dig med saker som att bestämma när e-postaviseringar ska skickas. För att prenumerera på dessa händelser använder följande exempelkod mönstret Observer Design.

Börja med att prenumerera på MSFT_StorageFaultEvent händelser.

public void ListenForFaultEvents()
{
    IObservable<CimSubscriptionResult> Events = Session.SubscribeAsync(
        @"root\microsoft\windows\storage", "WQL", "SELECT * FROM MSFT_StorageFaultEvent");
    // Subscribe the Observer
    FaultsObserver<CimSubscriptionResult> Observer = new FaultsObserver<CimSubscriptionResult>(this);
    IDisposable Disposeable = Events.Subscribe(Observer);
}

Implementera sedan en observatör vars OnNext() -metod anropas när en ny händelse genereras.

Varje händelse innehåller ChangeType som anger om ett fel skapas, tas bort eller uppdateras och relevant FaultId.

Dessutom innehåller varje händelse alla egenskaper för själva felet.

class FaultsObserver : IObserver
{
    public void OnNext(T Event)
    {
        // Cast
        CimSubscriptionResult SubscriptionResult = Event as CimSubscriptionResult;

        if (SubscriptionResult != null)
        {
            // Unpack
            CimKeyedCollection<CimProperty> Properties = SubscriptionResult.Instance.CimInstanceProperties;
            String ChangeType = Properties["ChangeType"].Value.ToString();
            String FaultId = Properties["FaultId"].Value.ToString();

            // Create
            if (ChangeType == "0")
            {
                Fault MyNewFault = new MyFault(SubscriptionResult.Instance);
                // TODO: Whatever you want!
            }
            // Remove
            if (ChangeType == "1")
            {
                // TODO: Use FaultId to find and delete whatever representation you have...
            }
            // Update
            if (ChangeType == "2")
            {
                // TODO: Use FaultId to find and modify whatever representation you have...
            }
        }
    }
    public void OnError(Exception e)
    {
        // Handle Exceptions
    }
    public void OnCompleted()
    {
        // Nothing
    }
}

Förstå fellivscykeln

Fel är inte avsedda att markeras som antingen "sedda" eller lösta av användaren. De skapas när Hälsotjänst upptäcker ett problem och de tas bort automatiskt först efter att Hälsotjänst inte längre kan observera problemet. I allmänhet återspeglar detta att problemet har åtgärdats.

I vissa fall kan dock fel återupptäckas av Hälsotjänst, till exempel efter en redundansväxling, tillfälliga anslutningar och så vidare. Av den anledningen kan det vara klokt att bevara din egen representation av fel, så att du enkelt kan deduplicera. Detta är särskilt viktigt om du skickar e-postaviseringar eller motsvarande.

Felegenskaper

I följande tabell visas flera viktiga egenskaper för felobjektet. För det fullständiga schemat kontrollerar du klassen MSFT_StorageDiagnoseResult i storagewmi.mof.

Property Exempel
FaultId {12345-12345-12345-12345-12345}
FaultType Microsoft.Health.FaultType.Volume.Capacity
Anledning "Volymen får slut på tillgängligt utrymme."
PerceivedSeverity 5
FaultingObjectDescription Contoso XYZ9000 S.N. 123456789
FaultingObjectLocation Rack A06, RU 25, Fack 11
RecommendedActions {"Expandera volymen.", "Migrera arbetsbelastningar till andra volymer."}

FaultId: Unikt ID inom omfånget för ett kluster.

PerceivedSeverity: PerceivedSeverity = { 4, 5, 6 } = { "Informational", "Warning" och "Error" }, eller motsvarande färger som blå, gul och röd.

FaultingObjectDescription: Delinformation för maskinvara, vanligtvis tom för programvaruobjekt.

FaultingObjectLocation: Platsinformation för maskinvara, vanligtvis tom för programvaruobjekt.

RecommendedActions: Lista över rekommenderade åtgärder som är oberoende och inte i någon särskild ordning. I dag är den här listan ofta av längd 1.

Egenskaper för felhändelse

I följande tabell visas flera viktiga egenskaper för felhändelsen. För det fullständiga schemat kontrollerar du klassen MSFT_StorageFaultEvent i storagewmi.mof.

Observera ChangeType som anger om ett fel skapas, tas bort eller uppdateras och FaultId. En händelse innehåller också alla egenskaper för det berörda felet.

Property Exempel
ChangeType 0
FaultId {12345-12345-12345-12345-12345}
FaultType Microsoft.Health.FaultType.Volume.Capacity
Anledning "Volymen får slut på tillgängligt utrymme."
PerceivedSeverity 5
FaultingObjectDescription Contoso XYZ9000 S.N. 123456789
FaultingObjectLocation Rack A06, RU 25, Fack 11
RecommendedActions {"Expandera volymen.", "Migrera arbetsbelastningar till andra volymer."}

ChangeType ChangeType = { 0, 1, 2 } = { "Create", "Remove", "Update" }.

Täckning

I Windows Server 2019 och Azure Local tillhandahåller Hälsotjänst följande feltäckning:

PhysicalDisk (31)

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailedMedia

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken misslyckades."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.LostCommunication

  • Allvarlighetsgrad: Varning
  • Orsak: "Anslutningen har förlorats till den fysiska disken."
  • RecommendedAction: "Kontrollera att den fysiska disken fungerar och är korrekt ansluten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.Unresponsive

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken uppvisar återkommande svarsfel."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.PredictiveFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Ett fel på den fysiska disken förväntas inträffa snart."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnsupportedHardware

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken är i karantän eftersom den inte stöds av lösningsleverantören."
  • RecommendedAction: "Ersätt den fysiska disken med maskinvara som stöds."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnsupportedFirmware

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken är i karantän eftersom dess version av den inbyggda programvaran inte stöds av lösningsleverantören."
  • RecommendedAction: "Uppdatera den inbyggda programvaran på den fysiska disken till målversionen."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnrecognizedMetadata

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken har okända metadata."
  • RecommendedAction: "Den här disken kan innehålla data från en okänd lagringspool. Kontrollera först att det inte finns några användbara data på den här disken och återställ sedan disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailedFirmwareUpdate

  • Allvarlighetsgrad: Varning
  • Orsak: "Det gick inte att uppdatera den inbyggda programvaran på den fysiska disken."
  • RecommendedAction: "Prova att använda en annan binär programvara."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SblFailedMedia

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten misslyckades."
  • RecommendedAction: "Ersätt enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SblUnresponsive

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken uppvisar återkommande svarsfel."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureBadBlock

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten rapporterade felaktiga block under skrivningar. Ett tillfälligt dåligt block är normalt, men för många kan innebära att enheten krånglar, skadas eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser lägre prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureBadBlockRead

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten rapporterade felaktiga block under läsningar. Ett tillfälligt dåligt block är normalt, men för många kan innebära att enheten krånglar, skadas eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser lägre prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureIoRetry

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten behövde flera försök att läsa eller skriva. Om detta fortsätter att hända kan det innebära att enheten fungerar dåligt, skadas eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser lägre prestanda bör du överväga att ersätta enheten."

Kommentar

Det här felet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.MarginalFailure.EventBased.IoRetry.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureIoFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten kunde inte läsa eller skriva. Om detta fortsätter att hända kan det innebära att enheten fungerar dåligt, skadas eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser lägre prestanda bör du överväga att ersätta enheten."

Kommentar

Det här felet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.MarginalFailure.EventBased.IoFailure.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureSmart

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten rapporterade följande potentiella problem till Windows med hjälp av SMART (självövervakning, analys och rapporteringsteknik)"
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser lägre prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureHighWear

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har nått en hög andel av sin betygsatt skrivtålighet. Enheten kan bli skrivskyddad, vilket innebär att den inte kan utföra fler skrivningar när den når 100 % av sin rankade uthållighet. Kontrollera databladet eller be tillverkaren om mer information om uthållighetsklassificering och beteende i livets slutpunkt."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser lägre prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureReadOnly

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten nådde 100 % av sin betygsatt skrivtålighet och är nu skrivskyddad, vilket innebär att den inte kan utföra fler skrivningar. Solid state-enheter slits ut efter ett visst antal skrivningar, vilket varierar beroende på enhetens uthållighetsklassificering. Mer information finns i enhetsspecifikationerna eller fråga tillverkaren om uthållighetsklassificering och beteende i livets slutpunkt."
  • RecommendedAction: "Om detta fortsätter att hända eller om du ser lägre prestanda bör du överväga att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.SlowestIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög svarstid med hög belastning."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

Kommentar

Det här felet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.HighLatency.Threshold.Tail.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.AverageIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög genomsnittlig svarstid."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

Kommentar

Det här felet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.HighLatency.Threshold.Tail.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.Outlier.AverageIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög genomsnittlig svarstid."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.Outlier.SlowestIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög svarstid med hög belastning."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighErrorCount.AverageIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har ett stort antal fel."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighErrorCount.Outlier.AverageIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har ett stort antal fel."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.CacheReadOnly

  • Allvarlighetsgrad: Varning
  • Orsak: "Cacheenheten misslyckades med vissa läsningar eller skrivningar, så för att skydda dina data har vi flyttat dem till kapacitetsenheter."
  • RecommendedAction: "Ersätt enheten eller försök rensa och återställa den."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.CacheReadOnly.Draining

  • Allvarlighetsgrad: Varning
  • Orsak: "Cacheenheten misslyckades med vissa läsningar eller skrivningar. För att skydda dina data har vi slutat skriva till cacheenheten och vi försöker flytta dess data till kapacitetsenheter."
  • RecommendedAction: "Vänta medan vi flyttar data."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.CacheReadOnly.FailedDrain

  • Allvarlighetsgrad: Varning
  • Orsak: "Vissa data på cacheenheten kan inte läsas, vilket hindrar oss från att flytta dem till kapacitetsenheter."
  • RecommendedAction: "Ersätt enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.RotationFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Försöket att rotera SED-krypteringsnyckeln till den nya standardinställningen misslyckades."
  • RecommendedAction: "Kontrollera att enheten fungerar och är korrekt ansluten. Om enheten har misslyckats ersätter du den. Starta om SED-krypteringsnyckelrotationen när enheten är felfri."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.NotDefault

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken har en SED-krypteringsnyckel, men den matchar inte den aktuella standardnyckeln."
  • RecommendedAction: "Initiera SED-krypteringsnyckelrotation."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.NotDefined

  • Allvarlighetsgrad: Varning
  • Orsak: "Det finns ingen definierad SED-standardkrypteringsnyckel för enheten."
  • RecommendedAction: "Ange en standardkrypteringsnyckel för SED."

FaultType: Microsoft.Health.FaultType.StorageScaleUnit.SedEncKey.RotationTimeout

  • Allvarlighetsgrad: Varning
  • Orsak: "Det gick inte att slutföra roteringen av SED-krypteringsnyckeln på servern före tidsgränsen"
  • RecommendedAction: "Kontrollera att servern kan nås och att alla fysiska diskar är felfria."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.DriveArriveFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Fysiska diskar misslyckas med frågor. "
  • RecommendedAction: "Verifiera nätverkets tillförlitlighet. Om problemet kvarstår bör du överväga att ersätta enheten."

Virtuell disk (3)

FaultType: Microsoft.Health.FaultType.VirtualDisks.NeedsRepair

  • Allvarlighetsgrad: Information
  • Orsak: "Vissa data på den här volymen är inte helt motståndskraftiga. Den är fortfarande tillgänglig."
  • RecommendedAction: "Återställa återhämtning av data."

FaultType: Microsoft.Health.FaultType.VirtualDisks.Detached

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Volymen är otillgänglig. Vissa data kan gå förlorade."
  • RecommendedAction: "Kontrollera den fysiska och/eller nätverksanslutningen för alla lagringsenheter. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.VirtualDisks.NoRedundancy

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Alla kopior av data är inte tillgängliga för en region med virtuell disk. Arbetsbelastningen kan avbrytas och I/O-fel kan observeras."
  • RecommendedAction: "Om en underhållsåtgärd pågår pausar du den och återställer åtkomsten till all lagring tills lagringen stabiliseras."

Poolkapacitet (2)

FaultType: Microsoft.Health.FaultType.StoragePool.TransactionAndCleanupFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Lagringspoolen kan inte skriva till ett kvorum med metadataenheter. Arbetsbelastningen kan avbrytas och I/O-fel kan observeras."
  • RecommendedAction: "Om en underhållsåtgärd pågår pausar du den och återställer åtkomsten till all lagring tills lagringen stabiliseras."

FaultType: Microsoft.Health.FaultType.StoragePool.PoolCapacityThresholdExceededed

  • Allvarlighetsgrad: Varning
  • Orsak: "Lagringspoolen har slut på kapacitet."
  • RecommendedAction: "Lägg till ytterligare kapacitet i lagringspoolen eller frigör kapacitet."

Volymkapacitet (5)1

FaultType: Microsoft.Health.FaultType.Volume.Capacity

  • Allvarlighetsgrad: Varning
  • Orsak: "Volymen har slut på tillgängligt utrymme."
  • RecommendedAction: "Expandera volymen eller migrera arbetsbelastningar till andra volymer."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Correctable

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte ett kontrollsummor och kunde korrigera det."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte ett kontrollsummafel och kunde inte korrigera det."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable.DataRemoved

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte en skada på en fil eller mapp. Filen eller mappen har tagits bort från filsystemets namnområde."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable.DataRemovalFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte en skada på en fil eller mapp. Filsystemet kan ha misslyckats med att ta bort det från filsystemets namnområde."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

Server (12)

FaultType: Microsoft.Health.FaultType.Server.Down

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern kan inte nås."
  • RecommendedAction: "Starta eller ersätt server."

FaultType: Microsoft.Health.FaultType.Server.Isolated

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern är isolerad från klustret på grund av anslutningsproblem."
  • RecommendedAction: "Om isoleringen kvarstår kontrollerar du nätverken eller migrerar arbetsbelastningar till andra noder."

FaultType: Microsoft.Health.FaultType.Server.Quarantined

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern sätts i karantän av klustret på grund av återkommande fel."
  • RecommendedAction: "Ersätt servern eller åtgärda nätverket."

FaultType: Microsoft.Health.FaultType.Server.Temperature

  • Allvarlighetsgrad: Varning
  • Orsak: "Serverns temperatursensor har utlöst en varning."
  • RecommendedAction: "Kontrollera servertemperaturen."

FaultType: Microsoft.Health.FaultType.Server.Storage.Degraded

  • Allvarlighetsgrad: Varning
  • Orsak: "Servern har lagring som inte är fullständig eller uppdaterad, så vi måste synkronisera den med data från andra servrar i klustret. Detta är normalt när en server startas om eller en enhet misslyckas."
  • RecommendedAction: "Vänta medan vi synkroniserar lagringen. Ta inte bort några enheter eller starta inte om några servrar i klustret förrän vi har bekräftat att synkroniseringen är klar."

FaultType: Microsoft.Health.FaultType.Node.CPUOverloaded

  • Allvarlighetsgrad: Varning
  • Orsak: "Serverns CPU-användning är konsekvent över tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till andra servrar med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret (vanligtvis genom att lägga till servrar)."

FaultType: Microsoft.Health.FaultType.Node.VCPUToLCPU

  • Allvarlighetsgrad: Varning
  • Orsak: "Förhållandet mellan virtuella processorer och logiska processorer (trådar) på den här servern har överskridit det konfigurerade tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret."

FaultType: Microsoft.Health.FaultType.Node.LowFreeRam

  • Allvarlighetsgrad: Varning
  • Orsak: "Tillgängligt minne ligger under det konfigurerade tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret."

FaultType: Microsoft.Health.FaultType.Node.HighRootPartitionMemoryUsage

  • Allvarlighetsgrad: Varning
  • Orsak: "Windows Server förbrukar mycket fysiskt minne, vilket överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Sök efter processer eller appar som förbrukar för mycket minne, flytta virtuella datorer till andra servrar eller lägg till minne på servrarna."

FaultType: Microsoft.Health.FaultType.Node.TooHighCpuReservation

  • Allvarlighetsgrad: Varning
  • Orsak: "Den kombinerade CPU-reservationen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras CPU-reservationer."

FaultType: Microsoft.Health.FaultType.Node.TooHighMemoryUseAfterReclamation

  • Allvarlighetsgrad: Varning
  • Orsak: "Den kombinerade minnestilldelningen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras tilldelade minne."

FaultType: Microsoft.Health.FaultType.Node.SustainedHighCpuUsage

  • Allvarlighetsgrad: Varning
  • Orsak: "Servern har en processoranvändning som konsekvent överskrider tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till mer beräkningskapacitet."

Kluster (6)

FaultType: Microsoft.Health.FaultType.ClusterQuorumWitness.Error

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Klustret är ett serverfel från att gå ned."
  • RecommendedAction: "Kontrollera vittnesresursen och starta om efter behov. Starta eller ersätt misslyckade servrar."

FaultType: Microsoft.Health.FaultType.Cluster.ValidationReport.Failed

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Klusterverifiering har hittat problem."
  • RecommendedAction: "Klusterverifiering har hittat fel i vissa kategorier av tester. Se rapporten för klusterverifiering."

FaultType: Microsoft.Health.FaultType.Cluster.ValidationReportDcb.Failed

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Validate-DCB har hittat problem."
  • RecommendedAction: "Validate-DCB har hittat nätverksfel. Se DCB-valideringsrapport."

FaultType: Microsoft.Health.FaultType.Cluster.TooHighCpuReservation

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Den kombinerade CPU-reservationen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras CPU-reservationer."

FaultType: Microsoft.Health.FaultType.Cluster.TooHighMemoryUseAfterReclamation

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Den kombinerade minnestilldelningen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras tilldelade minne."

FaultType: Microsoft.Health.FaultType.Cluster.SustainedHighCpuUsage

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern har en processoranvändning som konsekvent överskrider tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till mer beräkningskapacitet."

Nätverkskort/gränssnitt (6)

FaultType: Microsoft.Health.FaultType.NetworkAdapter.Disconnected

  • Allvarlighetsgrad: Varning
  • Orsak: "Nätverksgränssnittet har kopplats från."
  • RecommendedAction: "Återanslut nätverkskabeln."

FaultType: Microsoft.Health.FaultType.NetworkInterface.Missing

  • Allvarlighetsgrad: Varning
  • Orsak: "Servern {server} saknar nätverkskort som är anslutna till klusternätverket {klusternätverk}."
  • RecommendedAction: "Anslut servern till det klusternätverk som saknas."

FaultType: Microsoft.Health.FaultType.NetworkAdapter.Hardware

  • Allvarlighetsgrad: Varning
  • Orsak: "Nätverksgränssnittet har haft ett maskinvarufel."
  • RecommendedAction: "Ersätt nätverksgränssnittskortet."

FaultType: Microsoft.Health.FaultType.NetworkAdapter.Disabled

  • Allvarlighetsgrad: Varning
  • Orsak: "Nätverksgränssnittet {nätverksgränssnitt} är inte aktiverat och används inte."
  • RecommendedAction: "Aktivera nätverksgränssnittet."

FaultType: Microsoft.Health.FaultType.StorageSubsystem.RDMA.Alert

  • Allvarlighetsgrad: Varning
  • Orsak: "Klustret upptäckte problem med nätverksanslutningen som hindrar Lagringsutrymmen Direct från att fungera korrekt."
  • RecommendedAction: "Kontrollera att nätverket är korrekt konfigurerat och fungerar. Om du använder RDMA Over Converged Ethernet (RoCE) kontrollerar du att Data Center Bridging (DCB), Enhanced Transmission Service (ETS) och Priority Flow Control (PFC) har konfigurerats korrekt och konsekvent på varje klusternod och fysisk växel. Om du inte vet hur du gör detta ber du din leverantör eller någon du litar på att hjälpa dig."

FaultType: Microsoft.Health.FaultType.StorageSubsystem.RDMA.Disabled

  • Allvarlighetsgrad: Varning
  • Orsak: "Klustret upptäckte problem med nätverksanslutningen som hindrar Lagringsutrymmen Direct från att fungera korrekt. För att säkerställa konsekvent prestanda och datasäkerhet har Lagringsutrymmen Direct slutat använda fjärråtkomst till direkt minne (RDMA) även om RDMA-kompatibel maskinvara finns och är aktiverad. Lagringstrafiken fortsätter att flöda men med sämre prestanda med TCP/IP."
  • RecommendedAction: "Kontrollera att nätverket är korrekt konfigurerat och fungerar och aktivera sedan RDMA igen. Om du använder RDMA Over Converged Ethernet (RoCE) kontrollerar du att Data Center Bridging (DCB), Enhanced Transmission Service (ETS) och Priority Flow Control (PFC) har konfigurerats korrekt och konsekvent på varje klusternod och fysisk växel. Om du inte vet hur du gör detta kan du be din leverantör eller någon du litar på att hjälpa dig. Om du vill fortsätta med RDMA inaktiverat kan du stänga den här aviseringen."

Hölje (6)

FaultType: Microsoft.Health.FaultType.StorageEnclosure.LostCommunication

  • Allvarlighetsgrad: Varning
  • Orsak: "Kommunikationen har gått förlorad till lagringskabinettet."
  • RecommendedAction: "Starta eller ersätt lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.FanError

  • Allvarlighetsgrad: Varning
  • Orsak: "Fläkten på position {position} för lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt fläkten i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.CurrentSensorError

  • Allvarlighetsgrad: Varning
  • Orsak: "Den aktuella sensorn på position {position} i lagringskabinettet har misslyckats."
  • RecommendedAction: "Ersätt en aktuell sensor i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.VoltageSensorError

  • Allvarlighetsgrad: Varning
  • Orsak: "Spänningssensorn vid position {position} i lagringskabinettet har misslyckats."
  • RecommendedAction: "Byt ut en spänningssensor i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.IoControllerError

  • Allvarlighetsgrad: Varning
  • Orsak: "I/O-styrenheten på position {position} i lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt en I/O-styrenhet i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.TemperatureSensorError

  • Allvarlighetsgrad: Varning
  • Orsak: "Temperatursensorn vid position {position} i lagringskabinettet har misslyckats."
  • RecommendedAction: "Ersätt en temperatursensor i lagringskabinettet."

Distribution av inbyggd programvara (3)

FaultType: Microsoft.Health.FaultType.FaultDomain.FailedMaintenanceMode

  • Allvarlighetsgrad: Varning
  • Orsak: "Det går för närvarande inte att göra framsteg när den inbyggda programvaran distribueras."
  • RecommendedAction: "Kontrollera att alla lagringsutrymmen är felfria och att ingen feldomän för närvarande är i underhållsläge."

FaultType: Microsoft.Health.FaultType.FaultDomain.FirmwareVerifyVersionFailed

  • Allvarlighetsgrad: Varning
  • Orsak: "Utrullning av inbyggd programvara avbröts på grund av oläsbar eller oväntad versionsinformation för inbyggd programvara efter att en uppdatering av den inbyggda programvaran har tillämpats."
  • RecommendedAction: "Starta om den inbyggda programvaran när problemet med den inbyggda programvaran har lösts."

FaultType: Microsoft.Health.FaultType.FaultDomain.TooManyFailedUpdates

  • Allvarlighetsgrad: Varning
  • Orsak: "Utrullningen av inbyggd programvara avbröts på grund av att för många fysiska diskar misslyckades med ett uppdateringsförsök för inbyggd programvara."
  • RecommendedAction: "Starta om den inbyggda programvaran när problemet med den inbyggda programvaran har lösts."

QoS för lagring (3)2

FaultType: Microsoft.Health.FaultType.StorQos.InsufficientThroughput

  • Allvarlighetsgrad: Varning
  • Orsak: "Lagringsdataflödet är otillräckligt för att uppfylla reserver."
  • RecommendedAction: "Konfigurera om QoS-principer för lagring."

FaultType: Microsoft.Health.FaultType.StorQos.LostCommunication

  • Allvarlighetsgrad: Varning
  • Orsak: "QoS-principhanteraren för lagring har förlorat kommunikationen med volymen."
  • RecommendedAction: "Starta om noderna {noder}"

FaultType: Microsoft.Health.FaultType.StorQos.MisconfiguredFlow

  • Allvarlighetsgrad: Varning
  • Orsak: "En eller flera lagringskonsumenter (vanligtvis virtuella datorer) använder en princip som inte finns med ID {id}."
  • RecommendedAction: "Återskapa eventuella saknade QoS-principer för lagring."

VM/VHD (7)

FaultType: Microsoft.Health.FaultType.Vm.BadHealthState

  • Allvarlighetsgrad: Varning
  • Orsak: "Hälsotillståndet för den virtuella datorn är inte OK."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.BadOperationalStatus

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorns driftstatus är inte OK."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.GuestUnhealthy

  • Allvarlighetsgrad: Varning
  • Orsak: "Gästoperativsystemet på den virtuella datorn rapporterar ett feltillstånd."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.ConfigIsOffline

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorns konfigurationsresurs är offline, vilket innebär att den virtuella datorn inte kan administreras."
  • RecommendedAction: "Bring the virtual machine configuration online."

FaultType: Microsoft.Health.FaultType.Vm.NotRespondingToControlCodes

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorn svarar inte på klusterkontrollkoder."
  • RecommendedAction: "Kontrollera tillståndet för den virtuella datorklusterresursen."

FaultType: Microsoft.Health.FaultType.Vm.IsNearMemoryLimit

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorn behöver mer av sitt konfigurerade maximala minne."
  • RecommendedAction: "Sök efter processer eller appar som förbrukar för mycket minne eller överväg att öka dess maximala minne."

FaultType: Microsoft.Health.FaultType.Vhd.IsNearlyFull

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella hårddisken har nått sin kapacitet. Inga fler data kan skrivas till den, vilket kan påverka de virtuella datorerna negativt."
  • RecommendedAction: "Ändra storlek på den virtuella hårddisken eller ta bort oönskade filer."

1 Anger att volymen har nått 80 % full (mindre allvarlighetsgrad) eller 90 % full (allvarlighetsgrad). 2 Anger att vissa .vhd(er) på volymen inte har uppfyllt sin lägsta IOPS för över 10 % (mindre), 30 % (större) eller 50 % (kritisk) för ett rullande 24-timmarsfönster.

Kommentar

Hälsotillståndet för komponenter i lagringshöljet, till exempel fläktar, strömförsörjning och sensorer, härleds från SCSI Enclosure Services (SES). Om leverantören inte ger den här informationen kan inte hälsotjänsten visa den.

Ytterligare referenser