Dela via


Hantera resursförbrukning och belastning i Service Fabric med mått

Mått är de resurser som dina tjänster bryr sig om och som tillhandahålls av noderna i klustret. Ett mått är allt som du vill hantera för att förbättra eller övervaka prestanda för dina tjänster. Du kan till exempel titta på minnesförbrukning för att veta om tjänsten är överbelastad. En annan användning är att ta reda på om tjänsten kan flyttas någon annanstans där minnet är mindre begränsat för att få bättre prestanda.

Saker som minnes-, disk- och CPU-användning är exempel på mått. Dessa mått är fysiska mått, resurser som motsvarar fysiska resurser på noden som måste hanteras. Mått kan också vara (och är ofta) logiska mått. Logiska mått är saker som "MyWorkQueueDepth" eller "MessagesToProcess" eller "TotalRecords". Logiska mått är programdefinierade och motsvarar indirekt viss fysisk resursförbrukning. Logiska mått är vanliga eftersom det kan vara svårt att mäta och rapportera förbrukning av fysiska resurser per tjänst. Komplexiteten i att mäta och rapportera dina egna fysiska mått är också anledningen till att Service Fabric tillhandahåller vissa standardmått.

Standardmått

Anta att du vill komma igång med att skriva och distribuera tjänsten. Nu vet du inte vilka fysiska eller logiska resurser som används. Det är okej! Service Fabric Cluster Resource Manager använder vissa standardmått när inga andra mått anges. Dessa är:

  • PrimaryCount – antal primära repliker på noden
  • ReplicaCount – antalet totalt tillståndskänsliga repliker på noden
  • Antal – antal tjänstobjekt (tillståndslösa och tillståndskänsliga) på noden
Metric Tillståndslös instansinläsning Tillståndskänslig sekundär belastning Tillståndskänslig primär belastning Grovlek
PrimaryCount 0 0 1 Högt
ReplicaCount 0 1 1 Medium
Antal 1 1 1 Låg

För grundläggande arbetsbelastningar ger standardmåtten en anständig fördelning av arbetet i klustret. I följande exempel ska vi se vad som händer när vi skapar två tjänster och förlitar oss på standardmåtten för balansering. Den första tjänsten är en tillståndskänslig tjänst med tre partitioner och en målreplikuppsättningsstorlek på tre. Den andra tjänsten är en tillståndslös tjänst med en partition och ett instansantal på tre.

Det här får vi:

Klusterlayout med standardmått

Några saker att notera:

  • Primära repliker för den tillståndskänsliga tjänsten distribueras över flera noder
  • Repliker för samma partition finns på olika noder
  • Det totala antalet primär- och sekundärfiler distribueras i klustret
  • Det totala antalet tjänstobjekt allokeras jämnt på varje nod

Bra!

Standardmåtten fungerar bra till att börja med. Standardmåtten kommer dock bara att bära dig hittills. Till exempel: Vad är sannolikheten för att partitioneringsschemat som du valde resulterar i en perfekt jämn användning av alla partitioner? Vad är chansen att belastningen för en viss tjänst är konstant över tid, eller till och med bara samma över flera partitioner just nu?

Du kan köra med bara standardmåtten. Detta innebär dock vanligtvis att klusteranvändningen är lägre och mer ojämn än du vill. Det beror på att standardmåtten inte är anpassningsbara och förutsätter att allt är likvärdigt. Till exempel en primär som är upptagen och en som inte båda bidrar med "1" till Måttet PrimaryCount. I värsta fall kan användning av endast standardmått också resultera i överplanerade noder som resulterar i prestandaproblem. Om du är intresserad av att få ut mesta möjliga av klustret och undvika prestandaproblem måste du använda anpassade mått och dynamisk belastningsrapportering.

Anpassade mått

Mått konfigureras per namngiven tjänstinstans när du skapar tjänsten.

Alla mått har vissa egenskaper som beskriver det: ett namn, en vikt och en standardbelastning.

  • Måttnamn: Måttets namn. Måttnamnet är en unik identifierare för måttet i klustret från Resource Manager-perspektivet.

Kommentar

Anpassat måttNamn får inte vara något av systemmåttnamnen, t.ex. servicefabric:/_CpuCores eller servicefabric:/_MemoryInMB eftersom det kan leda till odefinierat beteende. Från och med Service Fabric version 9.1 utfärdas en hälsovarning för att indikera att måttnamnet är felaktigt för befintliga tjänster med dessa anpassade måttnamn.

  • Vikt: Måttvikt definierar hur viktigt det här måttet är i förhållande till de andra måtten för den här tjänsten.
  • Standardinläsning: Standardbelastningen representeras på olika sätt beroende på om tjänsten är tillståndslös eller tillståndskänslig.
    • För tillståndslösa tjänster har varje mått en enda egenskap med namnet DefaultLoad
    • För tillståndskänsliga tjänster som du definierar:
      • PrimaryDefaultLoad: Standardbeloppet för det här måttet som den här tjänsten förbrukar när det är en primär
      • SecondaryDefaultLoad: Standardbeloppet för det här måttet som den här tjänsten förbrukar när det är en sekundär

Kommentar

Om du definierar anpassade mått och även vill använda standardmåtten måste du uttryckligen lägga till standardmåtten tillbaka och definiera vikter och värden för dem. Det beror på att du måste definiera relationen mellan standardmåtten och dina anpassade mått. Du kanske till exempel bryr dig om ConnectionCount eller WorkQueueDepth mer än primär distribution. Som standard är måttet PrimaryCount hög, så du vill minska det till Medel när du lägger till dina andra mått för att säkerställa att de har företräde.

Definiera mått för din tjänst – ett exempel

Anta att du vill ha följande konfiguration:

  • Tjänsten rapporterar ett mått med namnet "ConnectionCount"
  • Du vill också använda standardmåtten
  • Du har gjort några mått och vet att normalt tar en primär replik av tjänsten upp 20 enheter av "ConnectionCount"
  • Sekundärfiler använder 5 enheter av "ConnectionCount"
  • Du vet att "ConnectionCount" är det viktigaste måttet när det gäller att hantera prestanda för den här tjänsten
  • Du vill fortfarande att primära repliker ska balanseras. Att balansera primära repliker är i allmänhet en bra idé oavsett vad. Detta förhindrar att förlust av vissa noder eller feldomäner påverkar en majoritet av de primära replikerna tillsammans med den.
  • Annars är standardmåtten bra

Här är den kod som du skulle skriva för att skapa en tjänst med den måttkonfigurationen:

Kod:

StatefulServiceDescription serviceDescription = new StatefulServiceDescription();
StatefulServiceLoadMetricDescription connectionMetric = new StatefulServiceLoadMetricDescription();
connectionMetric.Name = "ConnectionCount";
connectionMetric.PrimaryDefaultLoad = 20;
connectionMetric.SecondaryDefaultLoad = 5;
connectionMetric.Weight = ServiceLoadMetricWeight.High;

StatefulServiceLoadMetricDescription primaryCountMetric = new StatefulServiceLoadMetricDescription();
primaryCountMetric.Name = "PrimaryCount";
primaryCountMetric.PrimaryDefaultLoad = 1;
primaryCountMetric.SecondaryDefaultLoad = 0;
primaryCountMetric.Weight = ServiceLoadMetricWeight.Medium;

StatefulServiceLoadMetricDescription replicaCountMetric = new StatefulServiceLoadMetricDescription();
replicaCountMetric.Name = "ReplicaCount";
replicaCountMetric.PrimaryDefaultLoad = 1;
replicaCountMetric.SecondaryDefaultLoad = 1;
replicaCountMetric.Weight = ServiceLoadMetricWeight.Low;

StatefulServiceLoadMetricDescription totalCountMetric = new StatefulServiceLoadMetricDescription();
totalCountMetric.Name = "Count";
totalCountMetric.PrimaryDefaultLoad = 1;
totalCountMetric.SecondaryDefaultLoad = 1;
totalCountMetric.Weight = ServiceLoadMetricWeight.Low;

serviceDescription.Metrics.Add(connectionMetric);
serviceDescription.Metrics.Add(primaryCountMetric);
serviceDescription.Metrics.Add(replicaCountMetric);
serviceDescription.Metrics.Add(totalCountMetric);

await fabricClient.ServiceManager.CreateServiceAsync(serviceDescription);

PowerShell:

New-ServiceFabricService -ApplicationName $applicationName -ServiceName $serviceName -ServiceTypeName $serviceTypeName –Stateful -MinReplicaSetSize 3 -TargetReplicaSetSize 3 -PartitionSchemeSingleton –Metric @("ConnectionCount,High,20,5”,"PrimaryCount,Medium,1,0”,"ReplicaCount,Low,1,1”,"Count,Low,1,1”)

Kommentar

I exemplen ovan och resten av det här dokumentet beskrivs hur du hanterar mått per namngiven tjänst. Det är också möjligt att definiera mått för dina tjänster på tjänsttypsnivå. Detta görs genom att ange dem i tjänstmanifesten. Att definiera typnivåmått rekommenderas inte av flera orsaker. Den första orsaken är att måttnamn ofta är miljöspecifika. Om det inte finns ett fast kontrakt på plats kan du inte vara säker på att måttet "Kärnor" i en miljö inte är "MiliCores" eller "CoReS" i andra. Om dina mått definieras i manifestet måste du skapa nya manifest per miljö. Detta leder vanligtvis till en spridning av olika manifest med endast mindre skillnader, vilket kan leda till hanteringssvårigheter.

Måttbelastningar tilldelas ofta per namngiven tjänstinstans. Anta till exempel att du skapar en instans av tjänsten för CustomerA som planerar att endast använda den lättvindigt. Anta också att du skapar en till för CustomerB som har en större arbetsbelastning. I det här fallet skulle du förmodligen vilja justera standardbelastningarna för dessa tjänster. Om du har mått och belastningar som definierats via manifest och du vill stödja det här scenariot krävs olika program- och tjänsttyper för varje kund. Värdena som definieras vid skapandetiden för tjänsten åsidosätter de som definierats i manifestet, så du kan använda det för att ange de specifika standardvärdena. Detta gör dock att de värden som deklareras i manifesten inte matchar de som tjänsten faktiskt körs med. Detta kan leda till förvirring.

Som en påminnelse: om du bara vill använda standardmåtten behöver du inte röra måttsamlingen alls eller göra något speciellt när du skapar din tjänst. Standardmåtten används automatiskt när inga andra definieras.

Nu ska vi gå igenom var och en av de här inställningarna i detalj och prata om det beteende som det påverkar.

Inläsning

Hela poängen med att definiera mått är att representera viss belastning. Belastning är hur mycket av ett visst mått som används av någon tjänstinstans eller replik på en viss nod. Belastningen kan konfigureras nästan när som helst. Till exempel:

  • Belastning kan definieras när en tjänst skapas. Den här typen av inläsningskonfiguration kallas för standardbelastning.
  • Måttinformationen, inklusive standardinläsningar, för en tjänst kan uppdateras när tjänsten har skapats. Den här måttuppdateringen görs genom att uppdatera en tjänst.
  • Belastningarna för en viss partition kan återställas till standardvärdena för den tjänsten. Den här måttuppdateringen kallas återställning av partitionsbelastning.
  • Belastningen kan rapporteras per tjänstobjekt dynamiskt under körning. Den här måttuppdateringen kallas rapporteringsbelastning.
  • Belastningen för partitionens repliker eller instanser kan också uppdateras genom att rapportera inläsningsvärden via ett Fabric API-anrop. Den här måttuppdateringen kallas rapporteringsbelastning för en partition.

Alla dessa strategier kan användas inom samma tjänst under dess livslängd.

Standardinläsning

Standardbelastning är hur mycket av måttet varje tjänstobjekt (tillståndslös instans eller tillståndskänslig replik) för den här tjänsten förbrukar. Klusterresurshanteraren använder det här numret för belastningen på tjänstobjektet tills det tar emot annan information, till exempel en rapport för dynamisk inläsning. För enklare tjänster är standardbelastningen en statisk definition. Standardbelastningen uppdateras aldrig och används under tjänstens livslängd. Standardbelastningar fungerar bra för enkla kapacitetsplaneringsscenarier där vissa mängder resurser är dedikerade till olika arbetsbelastningar och inte ändras.

Kommentar

Mer information om kapacitetshantering och definition av kapaciteter för noderna i klustret finns i den här artikeln.

Med Klusterresurshanteraren kan tillståndskänsliga tjänster ange en annan standardbelastning för sina primär- och sekundärfiler. Tillståndslösa tjänster kan bara ange ett värde som gäller för alla instanser. För tillståndskänsliga tjänster är standardbelastningen för primära och sekundära repliker vanligtvis olika eftersom repliker utför olika typer av arbete i varje roll. Till exempel hanterar primärvärden vanligtvis både läsningar och skrivningar och hanterar det mesta av beräkningsbelastningen, medan sekundärfiler inte gör det. Standardbelastningen för en primär replik är vanligtvis högre än standardbelastningen för sekundära repliker. De verkliga talen bör vara beroende av dina egna mått.

Dynamisk belastning

Anta att du har kört tjänsten ett tag. Med viss övervakning har du märkt att:

  1. Vissa partitioner eller instanser av en viss tjänst förbrukar mer resurser än andra
  2. Vissa tjänster har belastning som varierar över tid.

Det finns många saker som kan orsaka dessa typer av belastningsfluktuationer. Till exempel är olika tjänster eller partitioner associerade med olika kunder med olika krav. Belastningen kan också ändras eftersom mängden arbete som tjänsten utför varierar under dagen. Oavsett orsak finns det vanligtvis inget enskilt tal som du kan använda som standard. Detta gäller särskilt om du vill få ut mesta möjliga av klustret. Alla värden som du väljer för standardinläsning är fel en del av tiden. Felaktiga standardinläsningar resulterar i att Klusterresurshanteraren antingen är över eller under allokering av resurser. Därför har du noder som är över eller underutnyttjade trots att Klusterresurshanteraren tror att klustret är balanserat. Standardbelastningar är fortfarande bra eftersom de tillhandahåller viss information för den första placeringen, men de är inte en fullständig historia för verkliga arbetsbelastningar. Om du vill samla in ändrade resurskrav korrekt tillåter Klusterresurshanteraren varje tjänstobjekt att uppdatera sin egen belastning under körningen. Detta kallas för dynamisk inläsningsrapportering.

Dynamiska inläsningsrapporter gör det möjligt för repliker eller instanser att justera allokeringen/den rapporterade belastningen på mått under sin livslängd. En tjänstreplik eller instans som var kall och inte utför något arbete rapporterar vanligtvis att den använde låga mängder av ett visst mått. En upptagen replik eller instans rapporterar att de använder mer.

Med rapporteringsbelastning per replik eller instans kan Klusterresurshanteraren omorganisera de enskilda tjänstobjekten i klustret. Genom att omorganisera tjänsterna ser du till att de får de resurser de behöver. Upptagna tjänster får effektivt "återta" resurser från andra repliker eller instanser som för närvarande är kalla eller utför mindre arbete.

I Reliable Services ser koden för att rapportera inläsning dynamiskt ut så här:

Kod:

this.Partition.ReportLoad(new List<LoadMetric> { new LoadMetric("CurrentConnectionCount", 1234), new LoadMetric("metric1", 42) });

En tjänst kan rapportera om något av de mått som definierats för den när den skapas. Om en tjänst rapporterar inläsning för ett mått som den inte är konfigurerad att använda ignorerar Service Fabric den rapporten. Om det finns andra mått som rapporteras samtidigt som är giltiga godkänns dessa rapporter. Tjänstkoden kan mäta och rapportera alla mått som den vet hur, och operatörer kan ange den måttkonfiguration som ska användas utan att behöva ändra tjänstkoden.

Rapporteringsbelastning för en partition

I föregående avsnitt beskrivs hur tjänstrepliker eller instanser själva läses in. Det finns ytterligare ett alternativ för att dynamiskt rapportera inläsning för en partitions repliker eller instanser via Service Fabric API. När du rapporterar inläsning för en partition kan du rapportera för flera partitioner samtidigt.

Dessa rapporter kommer att användas på exakt samma sätt som inläsningsrapporter som kommer från själva replikerna eller instanserna. Rapporterade värden är giltiga tills nya inläsningsvärden rapporteras, antingen av repliken eller instansen eller genom att rapportera ett nytt inläsningsvärde för en partition.

Med det här API:et finns det flera sätt att uppdatera belastningen i klustret:

  • En tillståndskänslig tjänstpartition kan uppdatera den primära replikbelastningen.
  • Både tillståndslösa och tillståndskänsliga tjänster kan uppdatera belastningen på alla sina sekundära repliker eller instanser.
  • Både tillståndslösa och tillståndskänsliga tjänster kan uppdatera belastningen på en specifik replik eller instans på en nod.

Det är också möjligt att kombinera någon av dessa uppdateringar per partition på samma gång. Kombination av belastningsuppdateringar för en viss partition bör anges via objektet PartitionMetricLoadDescription, som kan innehålla motsvarande lista över belastningsuppdateringar som visas i exemplet nedan. Belastningsuppdateringar representeras via objektet MetricLoadDescription, som kan innehålla aktuellt eller förutsagt belastningsvärde för ett mått, som anges med ett måttnamn.

Kommentar

Förutsagda måttinläsningsvärden är för närvarande en förhandsversionsfunktion. Det gör att förutsagda inläsningsvärden kan rapporteras och användas på Service Fabric-sidan, men den funktionen är för närvarande inte aktiverad.

Det går att uppdatera inläsningar för flera partitioner med ett enda API-anrop, i vilket fall utdata innehåller ett svar per partition. Om partitionsuppdateringen inte har tillämpats av någon anledning hoppas uppdateringar för partitionen över och motsvarande felkod för en riktad partition tillhandahålls:

  • PartitionNotFound – angivet partitions-ID finns inte.
  • Omkonfiguration väntar – partitionen konfigureras för närvarande om.
  • InvalidForStatelessServices – Ett försök gjordes att ändra belastningen på en primär replik för en partition som tillhör en tillståndslös tjänst.
  • ReplicaDoesNotExist – Sekundär replik eller instans finns inte på en angiven nod.
  • InvalidOperation – kan inträffa i två fall: uppdatering av belastningen för en partition som tillhör systemprogrammet eller uppdatering av förväntad belastning är inte aktiverad.

Om några av dessa fel returneras kan du uppdatera indata för en specifik partition och försöka uppdatera den igen.

Kod:

Guid partitionId = Guid.Parse("53df3d7f-5471-403b-b736-bde6ad584f42");
string metricName0 = "CustomMetricName0";
List<MetricLoadDescription> newPrimaryReplicaLoads = new List<MetricLoadDescription>()
{
    new MetricLoadDescription(metricName0, 100)
};

string nodeName0 = "NodeName0";
List<MetricLoadDescription> newSpecificSecondaryReplicaLoads = new List<MetricLoadDescription>()
{
    new MetricLoadDescription(metricName0, 200)
};

OperationResult<UpdatePartitionLoadResultList> updatePartitionLoadResults =
    await this.FabricClient.UpdatePartitionLoadAsync(
        new UpdatePartitionLoadQueryDescription
        {
            PartitionMetricLoadDescriptionList = new List<PartitionMetricLoadDescription>()
            {
                new PartitionMetricLoadDescription(
                    partitionId,
                    newPrimaryReplicaLoads,
                    new List<MetricLoadDescription>(),
                    new List<ReplicaMetricLoadDescription>()
                    {
                        new ReplicaMetricLoadDescription(nodeName0, newSpecificSecondaryReplicaLoads)
                    })
            }
        },
        this.Timeout,
        cancellationToken);

I det här exemplet utför du en uppdatering av den senaste rapporterade belastningen för en partition 53df3d7f-5471-403b-b736-bde6ad584f42. Den primära replikbelastningen för måttet CustomMetricName0 uppdateras med värdet 100. Samtidigt uppdateras belastningen för samma mått för en specifik sekundär replik som finns på noden NodeName0 med värdet 200.

Uppdatera en tjänsts måttkonfiguration

Listan över mått som är associerade med tjänsten och egenskaperna för dessa mått kan uppdateras dynamiskt medan tjänsten är live. Detta möjliggör experimentering och flexibilitet. Några exempel på när detta är användbart är:

  • inaktivera ett mått med en buggrapport för en viss tjänst
  • konfigurera om måttvikterna baserat på önskat beteende
  • aktivera ett nytt mått först när koden redan har distribuerats och verifierats via andra mekanismer
  • ändra standardbelastningen för en tjänst baserat på observerat beteende och förbrukning

De viktigaste API:erna för att ändra måttkonfigurationen finns FabricClient.ServiceManagementClient.UpdateServiceAsync i C# och Update-ServiceFabricService i PowerShell. Den information du anger med dessa API:er ersätter den befintliga måttinformationen för tjänsten omedelbart.

Blanda standardinläsningsvärden och rapporter för dynamisk inläsning

Standardbelastning och dynamiska inläsningar kan användas för samma tjänst. När en tjänst använder både standardinläsningsrapporter och dynamiska inläsningsrapporter fungerar standardbelastningen som en uppskattning tills dynamiska rapporter visas. Standardbelastningen är bra eftersom den ger Klusterresurshanteraren något att arbeta med. Med standardbelastningen kan Klusterresurshanteraren placera tjänstobjekten på bra platser när de skapas. Om ingen standardinläsningsinformation tillhandahålls är placeringen av tjänster i praktiken slumpmässig. När inläsningsrapporter kommer senare är den första slumpmässiga placeringen ofta fel och Klusterresurshanteraren måste flytta tjänster.

Låt oss ta vårt tidigare exempel och se vad som händer när vi lägger till några anpassade mått och dynamisk belastningsrapportering. I det här exemplet använder vi "MemoryInMb" som ett exempelmått.

Kommentar

Minne är ett av systemmåtten som Service Fabric kan resursstyra, och att rapportera det själv är vanligtvis svårt. Vi förväntar oss faktiskt inte att du rapporterar om minnesförbrukning. Minnet används här som ett hjälpmedel för att lära sig om funktionerna i Klusterresurshanteraren.

Anta att vi först skapade den tillståndskänsliga tjänsten med följande kommando:

PowerShell:

New-ServiceFabricService -ApplicationName $applicationName -ServiceName $serviceName -ServiceTypeName $serviceTypeName –Stateful -MinReplicaSetSize 3 -TargetReplicaSetSize 3 -PartitionSchemeSingleton –Metric @("MemoryInMb,High,21,11”,"PrimaryCount,Medium,1,0”,"ReplicaCount,Low,1,1”,"Count,Low,1,1”)

Som en påminnelse är den här syntaxen ("MetricName, MetricWeight, PrimaryDefaultLoad, SecondaryDefaultLoad").

Nu ska vi se hur en möjlig klusterlayout kan se ut:

Klusterbalanserad med både standard- och anpassade mått

Några saker som är värda att notera:

  • Sekundära repliker i en partition kan var och en ha sin egen belastning
  • Sammantaget ser måtten ut att vara balanserade. För Minne är förhållandet mellan den maximala och lägsta belastningen 1,75 (noden med mest belastning är N3, minst N2 och 28/16 = 1,75).

Det finns några saker som vi fortfarande behöver förklara:

  • Vad fastställde om ett förhållande på 1,75 var rimligt eller inte? Hur vet Klusterresurshanteraren om det är tillräckligt bra eller om det finns mer arbete att göra?
  • När sker balanseringen?
  • Vad betyder det att minnet viktades "Högt"?

Måttvikter

Det är viktigt att spåra samma mått mellan olika tjänster. Den globala vyn är det som gör att Klusterresurshanteraren kan spåra förbrukningen i klustret, balansera förbrukningen mellan noder och se till att noderna inte går över kapaciteten. Tjänsterna kan dock ha olika vyer om vikten av samma mått. I ett kluster med många mått och många tjänster kanske inte perfekt balanserade lösningar finns för alla mått. Hur ska Klusterresurshanteraren hantera dessa situationer?

Med måttvikter kan Klusterresurshanteraren bestämma hur klustret ska balanseras när det inte finns något perfekt svar. Måttvikter gör det också möjligt för Klusterresurshanteraren att balansera specifika tjänster på olika sätt. Mått kan ha fyra olika viktnivåer: Noll, Låg, Medel och Hög. Ett mått med en vikt på Noll bidrar ingenting när du överväger om saker och ting är balanserade eller inte. Belastningen bidrar dock fortfarande till kapacitetshantering. Mått med nollvikt är fortfarande användbara och används ofta som en del av tjänstbeteende och prestandaövervakning. Den här artikeln innehåller mer information om användningen av mått för övervakning och diagnostik av dina tjänster.

Den verkliga effekten av olika måttvikter i klustret är att Klusterresurshanteraren genererar olika lösningar. Måttvikter anger för Klusterresurshanteraren att vissa mått är viktigare än andra. När det inte finns någon perfekt lösning kan Klusterresurshanteraren föredra lösningar som balanserar de högre viktade måtten bättre. Om en tjänst anser att ett visst mått är oviktigt kan deras användning av måttet vara obalanserad. Detta gör att en annan tjänst kan få en jämn fördelning av vissa mått som är viktiga för den.

Nu ska vi titta på ett exempel på vissa inläsningsrapporter och hur olika måttvikter resulterar i olika allokeringar i klustret. I det här exemplet ser vi att växling av måttens relativa vikt gör att Klusterresurshanteraren skapar olika tjänstearrangemang.

Exempel på måttvikt och dess inverkan på balanslösningar

I det här exemplet finns det fyra olika tjänster som alla rapporterar olika värden för två olika mått, MetricA och MetricB. I ett fall är alla tjänster som definierar MetricA den viktigaste (vikt = hög) och MetricB som oviktig (vikt = låg). Därför ser vi att Klusterresurshanteraren placerar tjänsterna så att MetricA är bättre balanserat än MetricB. "Bättre balanserad" innebär att MetricA har en lägre standardavvikelse än MetricB. I det andra fallet ändrar vi måttvikterna. Därför byter Cluster Resource Manager tjänster A och B för att komma fram till en allokering där MetricB är bättre balanserat än MetricA.

Kommentar

Måttvikter avgör hur Klusterresurshanteraren ska balansera, men inte när utjämning ska ske. Mer information om balansering finns i den här artikeln

Globala måttvikter

Anta att ServiceA definierar MetricA som hög vikt och ServiceB anger vikten för MetricA till Låg eller Noll. Vad är den faktiska vikten som används i slutänden?

Det finns flera vikter som spåras för varje mått. Den första vikten är den som definieras för måttet när tjänsten skapas. Den andra vikten är en global vikt som beräknas automatiskt. Klusterresurshanteraren använder båda dessa vikter vid bedömning av lösningar. Att ta hänsyn till båda vikterna är viktigt. Detta gör att Klusterresurshanteraren kan balansera varje tjänst enligt sina egna prioriteringar och även se till att klustret som helhet allokeras korrekt.

Vad skulle hända om Klusterresurshanteraren inte brydde sig om både global och lokal balans? Tja, det är enkelt att skapa lösningar som är globalt balanserade, men som resulterar i dålig resursbalans för enskilda tjänster. I följande exempel ska vi titta på en tjänst som konfigurerats med bara standardmåtten och se vad som händer när endast globalt saldo beaktas:

Effekten av en global lösning

I det översta exemplet som endast baseras på global balans är klustret som helhet verkligen balanserat. Alla noder har samma antal primärvärden och samma antal totala repliker. Men om du tittar på den faktiska effekten av den här allokeringen är det inte så bra: förlusten av en nod påverkar en viss arbetsbelastning oproportionerligt, eftersom den tar ut alla dess primärvärden. Om den första noden till exempel misslyckas går de tre primärvalen för de tre olika partitionerna i Circle-tjänsten förlorade. Omvänt förlorar tjänsterna Triangle och Hexagon sina partitioner en replik. Detta orsakar inga avbrott, förutom att du måste återställa den nedrepliken.

I det nedre exemplet har Klusterresurshanteraren distribuerat replikerna baserat på både det globala saldot och saldot per tjänst. När du beräknar poängen för lösningen ger den den största delen av vikten till den globala lösningen och en (konfigurerbar) del till enskilda tjänster. Det globala saldot för ett mått beräknas baserat på medelvärdet av måttvikterna från varje tjänst. Varje tjänst balanseras enligt sina egna definierade måttvikter. Detta säkerställer att tjänsterna balanseras inom sig själva efter sina egna behov. Om samma första nod misslyckas distribueras felet därför över alla partitioner av alla tjänster. Effekten för var och en är densamma.

Nästa steg