Monitorowanie kosztów obsługi modelu

Artykuł
12/09/2024

W tym artykule przedstawiono przykłady używania tabel systemowych do monitorowania kosztów punktów końcowych obsługi modelu sztucznej inteligencji mozaiki na koncie usługi Azure Databricks.

Wymagania

Aby uzyskać dostęp do tabel systemowych, obszar roboczy musi być włączony dla wykazu aparatu Unity. Aby uzyskać więcej informacji, zobacz Włączanie schematów tabel systemowych.

Jednostka SKU tabeli użycia rozliczeń

Koszty obsługi modeli można śledzić w usłudze Azure Databricks przy użyciu rozliczanej tabeli systemu użycia. Po włączeniu tabeli systemu użycia rozliczeń tabela zostanie automatycznie wypełniona najnowszym użyciem na koncie usługi Databricks. Koszty są wyświetlane w system.billing.usage tabeli z kolumną sku_name jako jedna z następujących:

`sku_name`	opis
`<tier>_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_<region>`	Ta jednostka SKU obejmuje wszystkie jednostki DBU naliczane po uruchomieniu punktu końcowego po skalowaniu do zera.
`<tier>_SERVERLESS_REAL_TIME_INFERENCE_<region>`	Wszystkie inne koszty obsługi modelu są pogrupowane w ramach tej jednostki SKU. Gdzie `tier` odpowiada warstwie platformy usługi Azure Databricks i `region` odpowiada regionowi chmury wdrożenia usługi Azure Databricks.

Wykonywanie zapytań i wizualizowanie użycia

Możesz wysłać zapytanie do tabeli, system.billing.usage aby zagregować wszystkie jednostki DBU (jednostki usługi Databricks) skojarzone z obsługą modelu sztucznej inteligencji mozaiki. Poniżej przedstawiono przykładowe zapytanie, które agreguje model obsługujący jednostki DBU dziennie w ciągu ostatnich 30 dni przy użyciu języka SQL:


SELECT SUM(usage_quantity) AS model_serving_dbus,
usage_date
FROM system.billing.usage
WHERE sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
GROUP BY(usage_date)
ORDER BY usage_date DESC

LIMIT 30

Pulpit nawigacyjny możliwości obserwowania kosztów

Aby ułatwić rozpoczęcie monitorowania kosztów obsługi modelu, pobierz przykładowy pulpit nawigacyjny przypisywania kosztów z usługi GitHub. Zobacz Pulpit nawigacyjny przypisywania kosztów do obsługi modelu.

Po pobraniu pliku JSON zaimportuj pulpit nawigacyjny do obszaru roboczego. Aby uzyskać instrukcje dotyczące importowania pulpitów nawigacyjnych, zobacz Importowanie pliku pulpitu nawigacyjnego.

Jak używać tego pulpitu nawigacyjnego

Ten pulpit nawigacyjny jest obsługiwany przez sztuczną inteligencję/usługę BI i musisz mieć dostęp do tabel systemowych. Zapewnia wgląd w koszty i użycie punktów końcowych obsługujących na poziomie obszaru roboczego.

Aby rozpocząć pracę, wykonaj następujące kroki:

Wprowadź identyfikator obszaru roboczego.
Wybierz datę rozpoczęcia i datę zakończenia.
Filtruj pulpit nawigacyjny, wybierając konkretną nazwę punktu końcowego z listy rozwijanej (jeśli interesuje Cię określony punkt końcowy).
Oddzielnie wprowadź klucz tagu, jeśli używasz tagów niestandardowych dla punktu końcowego.

Uwaga

Obsługa modelu wymusza domyślne limity w obszarze roboczym, aby upewnić się, że nie ma wydatków na wypadek. Zobacz Limity i regiony obsługi modeli.

Wykresy, których można użyć

Poniższe wykresy znajdują się na tym pulpicie nawigacyjnym. Są one przeznaczone do punktu wyjścia, aby utworzyć własną dostosowaną wersję modelu obsługującego pulpit nawigacyjny przypisywania kosztów.

Ostatnie 7 dni najwyższego użycia punktu końcowego
Dzienne łączne użycie $DBU
Model obsługujący koszty według typu punktu końcowego
- Płatność za token
- CPU/GPU
- Model podstawy
Dzienne zużycie na typ obsługi modelu
10 najbardziej kosztownych punktów końcowych obsługujących
10 najbardziej kosztownych punktów końcowych płatności za token
Dostrajanie grzywny LLM w ciągu ostatnich 7 dni
Dostrajanie drobnych wydatków na pocztę e-mail

Monitorowanie kosztów przy użyciu tagów

Początkowo zagregowane koszty mogą być wystarczające do obserwowania ogólnych kosztów obsługi modelu. Jednak wraz ze wzrostem liczby punktów końcowych możesz podzielić koszty na podstawie przypadków użycia, jednostki biznesowej lub innych identyfikatorów niestandardowych. Obsługa modelu obsługuje tworzenie tagów niestandardowych, które można zastosować do punktów końcowych obsługujących model.

Wszystkie tagi niestandardowe stosowane do modelu obsługujące punkty końcowe są propagowane do system.billing.usage tabeli w custom_tags kolumnie i mogą służyć do agregowania i wizualizowania kosztów. Usługa Databricks zaleca dodawanie tagów opisowych do każdego punktu końcowego w celu precyzyjnego śledzenia kosztów.

Przykładowe zapytania

Najważniejsze punkty końcowe według kosztów:


SELECT
  usage_metadata.endpoint_name AS endpoint_name,
  SUM(usage_quantity) AS model_serving_dbus
FROM
  system.billing.usage
WHERE
  sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
  AND usage_metadata.endpoint_name IS NOT NULL
GROUP BY endpoint_name
ORDER BY model_serving_dbus DESC
LIMIT 30;

Koszt z tagami ("business_unit": "nauka o danych") w czasie:


SELECT
  SUM(usage_quantity) AS model_serving_dbus,
  usage_date
FROM
  system.billing.usage
WHERE sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
  AND custom_tags['business_unit'] = 'data science'
GROUP BY usage_date
ORDER BY usage_date DESC

LIMIT 30

Dodatkowe zasoby

Aby zapoznać się z przykładami monitorowania kosztów zadań na koncie, zobacz sekcję , dotyczącą monitorowania kosztów zadań i &, dotyczącą wydajności za pomocą tabel systemowych.

Udostępnij za pośrednictwem

Monitorowanie kosztów obsługi modelu

Wymagania

Jednostka SKU tabeli użycia rozliczeń

Wykonywanie zapytań i wizualizowanie użycia

Pulpit nawigacyjny możliwości obserwowania kosztów

Jak używać tego pulpitu nawigacyjnego

Wykresy, których można użyć

Monitorowanie kosztów przy użyciu tagów

Przykładowe zapytania

Dodatkowe zasoby

Opinia

Dodatkowe zasoby