Freigeben über


Verwalten und Erhöhen der Kontingente für Ressourcen mit Azure KI Studio

Wichtig

Die in diesem Artikel markierten Elemente (Vorschau) sind aktuell als öffentliche Vorschau verfügbar. Diese Vorschauversion wird ohne Vereinbarung zum Servicelevel bereitgestellt und sollte nicht für Produktionsworkloads verwendet werden. Manche Features werden möglicherweise nicht unterstützt oder sind nur eingeschränkt verwendbar. Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.

Das Kontingent bietet die Flexibilität, die Zuordnung von Ratenbegrenzungen für die Bereitstellungen in Ihrem Abonnement aktiv zu verwalten. Dieser Artikel führt Sie durch den Prozess der Verwaltung des Kontingents für Ihre virtuellen Azure KI Studio-Computer und Azure OpenAI-Modelle.

In Azure werden Grenzwerte und Kontingente verwendet, um Budgetüberschreitungen aufgrund von Betrug zu vermeiden und Azure-Kapazitätseinschränkungen durchzusetzen. Es ist auch eine gute Möglichkeit, Kosten für Administratoren zu steuern. Berücksichtigen Sie diese Grenzwerte bei der Skalierung für Produktionsworkloads.

In diesem Artikel lernen Sie Folgendes:

  • Standardgrenzwerte für Azure-Ressourcen
  • Erstellen von Azure KI Studio-Kontingenten auf Hubebene.
  • Anzeigen Ihrer Kontingente und Grenzwerte
  • Anfordern von Kontingent- und Grenzwerterhöhungen

Besondere Überlegungen

Kontingente werden auf jedes Abonnement in Ihrem Konto angewendet. Wenn Sie über mehrere Abonnements verfügen, müssen Sie eine Kontingenterhöhung für jedes Abonnement anfordern.

Ein Kontingent ist eine Guthabengrenze für Azure-Ressourcen, keine Kapazitätsgarantie. Wenn Sie einen umfangreichen Kapazitätsbedarf haben, wenden Sie sich an den Azure-Support, um Ihr Kontingent zu erhöhen.

Hinweis

Azure KI Studio Compute verfügt über ein vom Kerncomputekontingent getrenntes Kontingent.

Die Standardgrenzwerte variieren je nach angebotenem Kategorietyp, z. B. kostenlose Testversion, nutzungsbasierte Bezahlung und VM-Serien (wie Dv2, F und G).

Azure KI Studio-Kontingent

Die folgenden Aktionen in Azure KI Studio verbrauchen Kontingent:

  • Erstellen einer Compute-Instanz.
  • Erstellen eines Vektorindexes.
  • Bereitstellen offener Modelle aus dem Modellkatalog.

Azure KI Studio Compute

Azure KI Studio Compute verfügt über eine Standardkontingentgrenze für die Anzahl von Kernen und eindeutigen Computeressourcen, die pro Region in einem Abonnement zulässig sind.

  • Das Kontingent für die Anzahl der Kerne wird auf jede VM-Familie und die kumulative Gesamtzahl der Kerne aufgeteilt.
  • Das Kontingent für die Anzahl der eindeutigen Computeressourcen pro Region ist vom VM-Kernkontingent getrennt, da es nur für die verwalteten Computeressourcen gilt

Um die Grenzwerte für Compute zu erhöhen, können Sie im Azure KI Studio eine Kontingenterhöhung anfordern.

Zu den verfügbaren Ressourcen gehören:

  • Dedizierte Kerne pro Region haben je nach Typ Ihres Abonnementangebots einen Standardgrenzwert von 24 bis 300. Sie können die Anzahl dedizierter Kerne pro Abonnement für jede VM-Familie erhöhen. Spezialisierte VM-Familien wie die Serien NCv2, NCv3 oder ND beginnen mit einem Standardwert von null Kernen. GPUs sind auch standardmäßig auf null Kerne festgelegt.
  • Für Computelimit gesamt pro Region gilt innerhalb eines bestimmten Abonnements ein Standardgrenzwert von 500 pro Region, der auf einen Maximalwert von 2.500 pro Region erhöht werden kann. Dieser Grenzwert gilt für Compute-Instanzen und verwaltete Onlineendpunktbereitstellungen. Eine Compute-Instanz wird in Bezug auf Kontingente als Cluster mit nur einem Knoten angesehen. Wenn Sie den Grenzwert erhöhen möchten, erstellen Sie eine Online-Kundensupportanfrage.

Geben Sie beim Öffnen der Supportanfrage zum Erhöhen des Berechnungslimits die folgenden Informationen an:

  1. Wählen Sie unter Problemtyp die Option Technisch aus.

  2. Wählen Sie das Abonnement aus, für das Sie das Kontingent erhöhen möchten.

  3. Wählen Sie als Diensttyp die Option Machine Learning aus.

  4. Wählen Sie die Ressource aus, für die Sie das Kontingent erhöhen möchten.

  5. Geben Sie im Feld Zusammenfassung „Compute-Grenzwerte insgesamt erhöhen“ ein

  6. Wählen Sie Computeinstanz als Problemtyp und Kontingent als Problemuntertyp aus.

    Screenshot: Seite zum Übermitteln von Computekontingentanforderungen im Azure-Portal.

  7. Wählen Sie Weiter aus.

  8. Geben Sie auf der Seite Zusätzliche Details die Abonnement-ID, die Region, den neuen Grenzwert (zwischen 500 und 2.500) und eine geschäftliche Begründung an, um die Grenzwerte für das Computelimit in der Region zu erhöhen.

  9. Wählen Sie Erstellen aus, um das Supportanfrage-Ticket zu übermitteln.

Freigegebenes Azure KI Studio-Kontingent

Azure KI Studio bietet einen Pool mit gemeinsam genutztem Kontingent, das verschiedenen Benutzern in verschiedenen Regionen zur gleichzeitigen Verwendung zur Verfügung steht. Abhängig von der Verfügbarkeit können Benutzer vorübergehend über den freigegebenen Pool auf das Kontingent zugreifen und das Kontingent verwenden, um Tests für einen begrenzten Zeitraum durchzuführen. Die spezifische Dauer hängt vom Anwendungsfall ab. Wenn Sie vorübergehend ein Kontingent aus dem Kontingentpool verwenden, müssen Sie kein Supportticket mehr für eine kurzfristige Kontingenterhöhung erstellen oder warten, bis Ihre Kontingentanforderung genehmigt wurde, bevor Sie mit Ihrem Workload fortfahren können.

Die Verwendung des freigegebenen Kontingentpools steht für das Testen der Rückschlüsse für Llama-2-, Phi-, Nemotron-, Mistral-, Dolly- und Deci-DeciLM-Modelle aus dem Modellkatalog zur Verfügung. Sie sollten das freigegebene Kontingent nur zum Erstellen temporärer Testendpunkte und nicht für Produktionsendpunkte verwenden. Für Endpunkte in der Produktion sollten Sie ein dediziertes Kontingent anfordern. Die Abrechnung für das freigegebene Kontingent erfolgt wie die Abrechnung für dedizierte VM-Familien auf Nutzungsbasis.

Container Instances

Weitere Informationen finden Sie unter Grenzwerte für Container Instances.

Storage

Für Azure Storage gilt ein Grenzwert von 250 Speicherkonten pro Region und Abonnement. Dieser Grenzwert umfasst sowohl Standard- als auch Storage Premium-Konten.

Anzeigen und Anfordern von Kontingenten in Azure KI Studio

Verwenden Sie Kontingente, um die Computezielzuordnung zwischen mehreren Azure KI Studio-Hubs im selben Abonnement zu verwalten.

Standardmäßig nutzen alle Hubs dasselbe Kontingent als Kontingent für VM-Familien auf Abonnementebene. Sie können jedoch ein maximales Kontingent für einzelne VM-Familien festlegen, um die Kostenkontrolle und Governance für Hubs in einem Abonnement genauer zu steuern. Mit Kontingenten für einzelne VM-Familien können Sie Kapazität freigeben und Ressourcenkonflikte vermeiden.

  1. Wechseln Sie in Azure KI Studio zur Startseite, und wählen Sie entweder Modellkontingent oder VM-Kontingent im Abschnitt Verwaltung aus.

    Screenshot: Einträge für Modell- und VM-Kontingent im Abschnitt „Verwaltung“

  2. Wenn Sie Modellkontingent auswählen, können Sie das Kontingent für die Modelle in der ausgewählten Azure-Region anzeigen. Um ein höheres Kontingent anzufordern, wählen Sie das Modell und dann Kontingent anfordern aus.

    • Verwenden Sie die Umschaltfläche Alle Kontingente anzeigen, um alle Kontingente oder nur das aktuell zugewiesene Kontingent anzuzeigen.
    • Verwenden Sie die Dropdownliste Gruppieren nach, um die Liste nach Kontingenttyp, Region und Modell, Kontingenttyp, Modell und Region oder nicht (mit der Option Keine) zu gruppieren. Die Gruppierung Keine zeigt eine Liste der Modellbereitstellungen an.
    • Erweitern Sie die Gruppierungen, um Informationen zu bestimmten Modellbereitstellungen anzuzeigen. Wählen Sie beim Anzeigen einer Modellbereitstellung das Bleistiftsymbol in der Spalte Kontingentzuordnung aus, um die Kontingentzuordnung für die Modellbereitstellung zu bearbeiten.
    • Verwenden Sie die Diagramme am Seitenrand, um weitere Details zur Kontingentnutzung anzuzeigen. Die Diagramme sind interaktiv. Wenn Sie auf einen Abschnitt des Diagramms zeigen, werden weitere Informationen angezeigt, und wenn Sie das Diagramm auswählen, wird die Liste der Modelle gefiltert. Wenn Sie die Diagrammlegende auswählen, werden die im Diagramm angezeigten Daten gefiltert.
    • Verwenden Sie den Link Azure OpenAI Provisioned, um Informationen zu bereitgestellten Modellen anzuzeigen, einschließlich eines Kapazitätsrechners.

    Screenshot: Seite „Modellkontingent“ in Azure KI Studio

  3. Wenn Sie VM-Kontingent auswählen, können Sie das Kontingent und die Nutzung für die VM-Familien in der ausgewählten Azure-Region anzeigen. Um ein weiteres Kontingent anzufordern, wählen Sie die VM-Familie und dann Kontingent anfordern aus.

    Screenshot: Seite „VM-Kontingent“ in Azure KI Studio

Nächste Schritte