Usługa Azure OpenAI Service i funkcje w usłudze Azure Government
W tym artykule przedstawiono różnice podczas korzystania z usługi Azure OpenAI w usłudze Azure Government w porównaniu z ofertą chmury komercyjnej. Dowiedz się więcej o samej usłudze Azure OpenAI Service w dokumentacji usługi Azure OpenAI Service.
Modele usługi Azure OpenAI
Dowiedz się więcej o różnych możliwościach każdego modelu w modelach usługi Azure OpenAI Service. W przypadku klientów z zagadnieniami dotyczącymi ciągłości działania i odzyskiwania po awarii (BCDR, Business Continuity and Disaster Recovery) należy pamiętać o typach wdrożeń, regionach i dostępności modeli poniżej, ponieważ nie wszystkie kombinacje modelu/typu są dostępne w obu regionach.
W poniższych sekcjach przedstawiono dostępność modelu według regionu i typu wdrożenia.
Dostępność modelu wdrażania w warstwie Standardowa
Region | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | gpt-4, 1106-Preview | gpt-35-turbo, 0125 | gpt-35-turbo, 1106 | osadzanie tekstu — 3 duże, 1 | text-embedding-ada-002, 2 |
---|---|---|---|---|---|---|---|
usgovarizona | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ |
usgovvirginia | ✅ | - | ✅ | ✅ | ✅ | - | ✅ |
Aby zażądać zwiększenia limitu przydziału dla tych modeli, prześlij żądanie pod adresem https://aka.ms/AOAIGovQuota. Zwróć uwagę na następujące maksymalne limity przydziału, które zostaną przyznane za pośrednictwem tego formularza:
gpt-4o | gpt-4o-mini | gpt-4 | gpt-35-turbo | osadzanie tekstu —3 — duże | text-embedding-ada-002 |
---|---|---|---|---|---|
300 tys. | 600 tys. | 200 tys. | 500 tys. | 700 tys. | 700 tys. |
Aprowizowana dostępność modelu wdrażania
Region | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | gpt-4, 1106-Preview | gpt-35-turbo, 0125 | gpt-35-turbo, 1106 |
---|---|---|---|---|---|
usgovarizona | ✅ | - | - | ✅ | - |
usgovvirginia | ✅ | - | - | ✅ | - |
[UWAGA]
Aprowizowanie jednostek przepływności (PTU) różni się od standardowego limitu przydziału w usłudze Azure OpenAI i nie jest domyślnie dostępne w usłudze Azure Government. Aby dowiedzieć się więcej o tej ofercie, skontaktuj się z zespołem ds. kont Microsoft.
Funkcje usługi Azure OpenAI
Podczas porównywania usługi Azure OpenAI w usłudze Azure Government i w chmurze komercyjnej istnieją następujące różnice funkcji.
Funkcja | opis |
---|---|
Dane wyjściowe ze strukturą | Obecnie nieobsługiwane. |
Zakupy oparte na rezerwacjach | Obecnie nieobsługiwane. |
Wdrożenia wsadowe | Obecnie nieobsługiwane. |
Połącz swoje dane | Obsługiwane są sieci wirtualne i łącza prywatne. Wdrażanie w aplikacji internetowej lub copilot w programie Copilot Studio nie jest obsługiwane. |
Monitorowanie nadużyć | Nie wszystkie funkcje monitorowania nadużyć są włączone dla usługi Azure OpenAI w usłudze Azure Government. Użytkownik jest odpowiedzialny za wdrożenie rozsądnych środków technicznych i operacyjnych w celu wykrywania i ograniczania wszelkich naruszeń warunków użytkowania usługi. Automatyczna klasyfikacja i filtrowanie zawartości pozostaje domyślnie włączona dla usługi Azure Government. Jeśli wymagane są zmodyfikowane filtry zawartości, zastosuj pod adresem https://aka.ms/AOAIGovModifyContentFilter |
Magazyn danych | W usłudze Azure Government nie są obecnie włączone żadne funkcje usługi Azure OpenAI, które przechowują dane klientów w spoczynku. Jednak klucze zarządzane przez klienta (CMK) nadal można włączyć w usłudze Azure Government, aby obsługiwać korzystanie z tych samych zasad w usłudze Azure Government, co w chmurze publicznej. Należy również pamiętać, że jeśli w przyszłości zostaną włączone funkcje usługi Azure OpenAI, które przechowują dane klientów w usłudze Azure Government, wszystkie istniejące wdrożenia klucza zarządzanego przez klienta zostaną zastosowane do tych danych w tym czasie. Dowiedz się więcej na temat prywatności danych usługi Azure OpenAI. |
Zgodność | Wyświetlanie bieżącego stanu zgodności usługi Azure OpenAI w usłudze Azure Government w zakresie inspekcji usług Azure Government Services |
Punkty końcowe usługi | openai.azure.us |
Portale kluczy |
|
Aprowizowania wdrożeń w usłudze Azure Government
Poniższy przewodnik przeprowadzi Cię przez proces konfigurowania aprowizowanego wdrożenia za pomocą zasobu usługi Azure OpenAI Service w usłudze Azure Government.
Wymagania wstępne
- Subskrypcja platformy Azure Government
- Zasób usługi Azure OpenAI
- Zatwierdzony limit przydziału dla aprowizowanego wdrożenia i zakupił zobowiązanie
Zarządzanie zobowiązaniami w zakresie aprowizowanej przepływności
W przypadku usługi Azure OpenAI w usłudze Azure Government aprowizowanie wdrożeń przepływności wymaga wstępnie utworzonych zobowiązań utworzonych i zarządzanych z poziomu widoku Zarządzanie zobowiązaniami w usłudze Azure OpenAI Studio. Możesz przejść do tego widoku, wybierając pozycję Zarządzaj zobowiązaniami w okienku Limit przydziału.
W widoku Zarządzanie zobowiązaniami można wykonać kilka czynności:
- Kupowanie nowych zobowiązań lub edytowanie istniejących zobowiązań.
- Monitoruj wszystkie zobowiązania w ramach subskrypcji.
- Zidentyfikuj i podejmij działania dotyczące zobowiązań, które mogą powodować nieoczekiwane rozliczenia.
Ustawienie | Uwagi |
---|---|
Wybierz zasób | Wybierz zasób, w którym tworzysz aprowizowane wdrożenie. Po zakupie zobowiązania nie możesz użyć limitu przydziału w innym zasobie do momentu wygaśnięcia bieżącego zobowiązania. |
Wybierz typ zobowiązania | Wybierz pozycję Aprowizowana. (Aprowizowany jest odpowiednikiem aprowizowania zarządzanego) |
Bieżący niezatwierdzony przydział aprowizacji | Liczba jednostek PTU, które są obecnie dostępne do zatwierdzenia tego zasobu. |
Kwota zatwierdzenia (PTU) | Wybierz liczbę jednostek PTU, do których zobowiązujesz się. Tę liczbę można zwiększyć w okresie zobowiązania, ale nie można jej zmniejszyć. Wprowadź wartości w przyrostach 50 dla typu zobowiązania Zainicjowano obsługę administracyjną. |
Warstwa zobowiązania dla bieżącego okresu | Okres zobowiązania jest ustawiony na jeden miesiąc. |
Ustawienia odnawiania | Autorenew na bieżących jednostkach PTU Autorenew przy niższych jednostkach PTU Nie autorenuj |
Ważne
Nowe zobowiązanie jest rozliczane z góry za cały okres. Jeśli ustawienia odnawiania są ustawione na automatyczne odnawianie, opłaty będą naliczane ponownie na każdą datę odnowienia na podstawie ustawień odnawiania.
Ważne
Po dodaniu jednostek PTU do zobowiązania będą one rozliczane natychmiast na podstawie proporcjonalnej kwoty od bieżącej daty do końca istniejącego okresu zobowiązania. Dodanie jednostek PTU nie powoduje zresetowania terminu zobowiązania.
Zmienianie ustawień odnawiania
Ustawienia odnowienia zobowiązania można zmienić w dowolnym momencie przed datą wygaśnięcia zobowiązania.
Ważne
Jeśli zezwolisz na wygaśnięcie lub zmniejszenie rozmiaru zobowiązania, tak aby wdrożenia w ramach zasobu wymagały więcej jednostek PTU niż w ramach zobowiązania dotyczącego zasobów, otrzymasz opłaty godzinowe za nadwyżkowe jednostki PTU. Na przykład zasób, który zawiera wdrożenia obejmujące łącznie 500 jednostek PTU i zobowiązanie dla 300 jednostek PTU, spowoduje wygenerowanie opłat za nadwyżkowe opłaty godzinowe za 200 jednostek PTU.
Typowe scenariusze zarządzania zobowiązaniem
Zaprzestanie korzystania z aprowizowanej przepływności
Aby zakończyć korzystanie z aprowizowanej przepływności i zapobiegać naliczaniu opłat godzinowych po wygaśnięciu zobowiązania, należy wykonać dwa kroki:
- Ustaw zasady odnawiania dla wszystkich zobowiązań nie autorenew.
- Usuń aprowidowane wdrożenia przy użyciu limitu przydziału.
Przenoszenie zobowiązania/wdrożenia do nowego zasobu w tej samej subskrypcji/regionie
W usłudze Azure OpenAI Studio nie można bezpośrednio przenieść wdrożenia ani zobowiązania do nowego zasobu. Zamiast tego należy utworzyć nowe wdrożenie w zasobie docelowym i przenieść do niego ruch. Ten proces wymaga nowego zakupu zobowiązania dla nowego zasobu. Ponieważ zobowiązania są naliczane z góry przez okres 30 dni, konieczne jest, aby ten ruch upływał wraz z wygaśnięciem pierwotnego zobowiązania, aby zminimalizować nakładanie się na nowe zobowiązanie i "podwójne rozliczenia" podczas nakładania się.
Istnieją dwa podejścia, które można zastosować do wdrożenia tego przejścia.
Opcja 1. Przełączanie bez nakładania się
Ta opcja wymaga przestoju, ale nie wymaga dodatkowego limitu przydziału i nie generuje dodatkowych kosztów.
Kroki | Uwagi |
---|---|
Ustawianie zasad odnawiania istniejącego zobowiązania w celu wygaśnięcia | Ta akcja uniemożliwia odnawianie i generowanie dodatkowych opłat przez zobowiązanie |
Przed wygaśnięciem istniejącego zobowiązania usuń wdrożenie | Przestój rozpoczyna się w tym momencie i trwa do momentu utworzenia nowego wdrożenia i przeniesienia ruchu. Możesz zminimalizować czas trwania, określając czas usunięcia tak blisko daty/godziny wygaśnięcia, jak to możliwe. |
Po wygaśnięciu istniejącego zobowiązania utwórz zobowiązanie dotyczące nowego zasobu | Zminimalizuj przestój, wykonując ten krok i następny krok jak najszybciej po wygaśnięciu. |
Tworzenie wdrożenia w nowym zasobie i przenoszenie ruchu do niego |
Opcja 2. Nakładające się przełączanie
Ta opcja nie ma przestoju, ponieważ zarówno istniejące, jak i nowe wdrożenia działają w tym samym czasie. Ta metoda wymaga również udostępnienia limitu przydziału w celu utworzenia nowego wdrożenia i wygenerowania dodatkowych kosztów podczas nakładających się wdrożeń.
Kroki | Uwagi |
---|---|
Ustawianie zasad odnawiania istniejącego zobowiązania w celu wygaśnięcia | Zapobiega to odnowieniu i wygenerowaniu dodatkowych opłat przez zobowiązanie. |
Przed wygaśnięciem istniejącego zobowiązania: 1. Utwórz zobowiązanie dotyczące nowego zasobu. 2. Utwórz nowe wdrożenie. 3. Przełącz ruch 4. Usuwanie istniejącego wdrożenia |
Upewnij się, że pozostawisz wystarczająco dużo czasu na wszystkie kroki przed wygaśnięciem istniejącego zobowiązania. W przeciwnym razie opłaty nadwyżkowe zostaną wygenerowane (zobacz następną sekcję) dla opcji. |