Mosaic AI Gateway
Viktigt!
Den här funktionen finns som allmänt tillgänglig förhandsversion.
Den här artikeln beskriver Mosaic AI Gateway, Databricks-lösningen för styrning och övervakning av åtkomst till generativa AI-modeller som stöds och deras associerade modell som betjänar slutpunkter.
Vad är Mosaic AI Gateway?
Mosaic AI Gateway är utformad för att effektivisera användningen och hanteringen av generativa AI-modeller inom en organisation. Det är en centraliserad tjänst som ger styrnings-, övervaknings- och produktionsberedskap för att modellera serverdelsslutpunkter. Du kan också köra, skydda och styra AI-trafik för att demokratisera och påskynda AI-implementeringen för din organisation.
Alla data loggas in i Delta-tabeller i Unity Catalog.
Om du vill börja visualisera insikter från dina AI Gateway-data laddar du ned ai Gateway-exempelinstrumentpanelen från GitHub. Den här instrumentpanelen utnyttjar data från inferenstabellerna för användningsspårning och nyttolastloggning.
När du har laddat ned JSON-filen importerar du instrumentpanelen till din arbetsyta. Anvisningar om hur du importerar instrumentpaneler finns i Importera en instrumentpanelsfil.
AI Gateway stöder följande funktioner:
- Behörighet och hastighetsbegränsning för att styra vem som har åtkomst och hur mycket åtkomst.
- Nyttolastloggning för att övervaka och granska data som skickas till modell-API:er med hjälp av slutsatsdragningstabeller.
- Användningsspårning för att övervaka driftanvändning på slutpunkter och associerade kostnader med hjälp av systemtabeller.
- AI Guardrails för att förhindra oönskade data och osäkra data i begäranden och svar.
- Trafikroutning för att minimera produktionsstopp under och efter distributionen.
Mosaic AI Gateway debiteras på en aktiverad funktionsbas. Under förhandsversionen inkluderar dessa betalda funktioner AI Guardrails, nyttolastloggning och användningsspårning. Funktioner som frågebehörigheter, hastighetsbegränsning och trafikroutning är kostnadsfria. Alla nya funktioner debiteras.
Följande tabell visar databricks-enheter (DBUs) per miljon token (M) för de betalda AI Gateway-funktionerna. Avgifter visas under SKU:n Serverless Real-time Inference
.
Funktion | DBU-hastighet |
---|---|
AI-skyddsräcken | 21.429 DBUs per M-token |
Nyttolastloggning | 2,857 DBUs per M-token |
Användningsspårning | 0,571 DBUs per M-token |
AI-skyddsräcken
MED AI Guardrails kan användare konfigurera och framtvinga dataefterlevnad på den modell som betjänar slutpunktsnivå och minska skadligt innehåll på alla begäranden som skickas till den underliggande modellen. Felaktiga begäranden och svar blockeras och ett standardmeddelande returneras till användaren. Se hur du konfigurerar skyddsräcken på en modell som betjänar slutpunkten.
Viktigt!
AI Guardrails är endast tillgängliga i regioner som stöder Foundation Model API:er betala per token.
I följande tabell sammanfattas de konfigurerbara skyddsräckena.
Skyddsräcke | Definition |
---|---|
Säkerhetsfiltrering | Säkerhetsfiltrering hindrar din modell från att interagera med osäkert och skadligt innehåll, till exempel våldsbrott, självskadebeteende och hatpropaganda. Säkerhetsfiltret för AI Gateway skapas med Meta Llama 3. Databricks använder Llama Guard 2-8b som säkerhetsfilter. Mer information om Llama Guard-säkerhetsfiltret och vilka ämnen som gäller för säkerhetsfiltret finns i Meta Llama Guard 2 8B-modellkortet. Meta Llama 3 är licensierad under LLAMA 3 Community License, Copyright © Meta Platforms, Inc. Alla rättigheter reserverade. Kunderna ansvarar för att säkerställa efterlevnaden av tillämpliga modelllicenser. |
Identifiering av personligt identifierbar information (PII) | Kunder kan identifiera känslig information, till exempel namn, adresser, kreditkortsnummer för användare. För den här funktionen använder AI Gateway Presidio för att identifiera följande amerikanska kategorier av PII: kreditkortsnummer, e-postadresser, telefonnummer, bankkontonummer och personnummer. PII-klassificeraren kan hjälpa till att identifiera känslig information eller PII i strukturerade och ostrukturerade data. Men eftersom den använder automatiserade identifieringsmekanismer finns det ingen garanti för att tjänsten hittar all känslig information. Därför bör ytterligare system och skydd användas. Dessa klassificeringsmetoder är främst begränsade till amerikanska kategorier av PII, till exempel amerikanska telefonnummer och personnummer. |
Ämnesmoderering | Möjlighet att lista en uppsättning tillåtna ämnen. Med en chattbegäran flaggar det här skyddsräcket begäran om ämnet inte finns med i de tillåtna ämnena. |
Nyckelordsfiltrering | Kunder kan ange olika uppsättningar med ogiltiga nyckelord för både indata och utdata. Ett potentiellt användningsfall för nyckelordsfiltrering är att modellen inte talar om konkurrenter. Det här skyddsräcket använder nyckelords- eller strängmatchning för att avgöra om nyckelordet finns i innehållet för begäran eller svar. |
Använda AI Gateway
Du kan konfigurera AI Gateway-funktioner på din modell som betjänar slutpunkter med hjälp av användargränssnittet för servering. Se Konfigurera AI Gateway på modell som betjänar slutpunkter.
Begränsningar
Följande är begränsningar under förhandsversionen:
- AI Gateway stöds endast för modeller som betjänar slutpunkter som hanterar externa modeller.
- När skyddsräcken används får batchstorleken för begäran, som är en inbäddningsbatchstorlek, batchstorlek för slutföranden eller parametern
n
för chattbegäranden, inte överstiga 16.