Rekommendationer för resursval för AI-arbetsbelastningar i Azure
Den här artikeln innehåller rekommendationer för resursval för organisationer som kör AI-arbetsbelastningar i Azure. Den fokuserar på PaaS-lösningar (plattform som en tjänst) i Azure AI, inklusive Azure AI Studio, Azure OpenAI, Azure Machine Learning och Azure AI Services. Den omfattar både generativa och icke-generativa AI-arbetsbelastningar.
Genom att göra välgrundade AI-resursval kan organisationer uppnå bättre prestanda, skalbarhet och kostnadseffektivitet när de hanterar AI-arbetsbelastningar. Följande tabell innehåller en översikt över de primära Azure AI PaaS-lösningarna och viktiga beslutskriterier.
AI-plattform | AI-typ | beskrivning | Krävda färdigheter |
---|---|---|---|
Azure OpenAI | Generativ AI | Plattform för åtkomst till OpenAI-modeller | Utvecklar- och datavetenskapskunskaper |
Azure AI Studio | Generativ AI | Plattform för snabb teknik och distribution av generativa AI-slutpunkter | Utvecklar- och datavetenskapskunskaper |
Azure AI-tjänster | Ai-analys | Plattform för användning av fördefinierade maskininlärningsmodeller | Utvecklarkunskaper |
Azure Machine Learning | Maskininlärning | Plattform för träning och distribution av maskininlärningsmodeller | Utvecklarkunskaper och avancerade datavetenskapskunskaper |
Välj resurser för generativa AI-arbetsbelastningar
Generativ AI kräver en kombination av olika resurser för att bearbeta och generera meningsfulla utdata baserat på indata. Korrekt urval säkerställer att generativa AI-program, till exempel de som använder hämtning av utökad generering (RAG) levererar korrekt genom att grunda AI-modeller.
I en typisk RAG-arbetsbelastning tar (1) arbetsbelastningen emot användarfrågan. (2) En orkestrerare, till exempel Prompt Flow, Semantic Kernel eller LangChain, hanterar dataflödet. (3) En sök- och hämtningsmekanism hittar lämpliga (4) jordningsdata som ska skickas till den generativa AI-slutpunkten. (5) En generativ AI-modellslutpunkt genererar ett svar baserat på användarfrågan och grunddata. Använd följande rekommendationer som ramverk för att skapa generativa RAG-arbetsbelastningar.
Välj en generativ AI-plattform. Använd Azure OpenAI eller Azure AI Studio för att distribuera och hantera generativa AI-modeller. Azure OpenAI Service ger åtkomst till OpenAI-modeller för privata nätverk och innehållsfiltrering. Azure AI Studio erbjuder en kod första plattform för att utveckla AI-arbetsbelastningar. Den har inbyggda verktyg för att skapa och distribuera program. Den har också en stor modellkatalog, promptflöde, finjustering, innehållssäkerhetsfilter med mera.
Välj lämplig AI-beräkningstyp. Azure AI Studio kräver beräkningsinstanser för promptflöde, skapande av index och öppning av Visual Studio Code (webb eller skrivbord) i studion. Välj en beräkningstyp baserat på dina prestanda- och budgetbehov.
Välj en orkestrerare. Populära orkestratorer för generativ AI är semantisk kernel, promptflöde och LangChain. Semantisk kernel integreras med Azure-tjänster. LangChain ger utökningsbarhet utanför Microsofts ekosystem.
Välj en sök- och kunskapshämtningsmekanism. Skapa en index- eller vektordatabas för relevant datahämtning för att jorda generativa AI-modeller. Använd Azure AI Search för att skapa traditionella index och vektorindex från olika datakällor, tillämpa datasegmentering och använda flera frågetyper. Om dina data finns i strukturerade databaser bör du överväga att använda Azure Cosmos DB, Azure Database for PostgreSQL och Azure Cache for Redis.
Välj en datakälla för jordning av data. För bilder, ljud, video eller stora datamängder lagrar du jordningsdata i Azure Blob Storage. Du kan också använda databaser som stöds av Azure AI Search - eller vektordatabaser.
Välj en beräkningsplattform. Använd beslutsträdet för Azure-beräkning för att välja rätt plattform för din arbetsbelastning.
Välj resurser för icke-generativa AI-arbetsbelastningar
Icke-generativa AI-arbetsbelastningar förlitar sig på plattformar, beräkningsresurser, datakällor och databearbetningsverktyg för att stödja maskininlärningsuppgifter. Genom att välja rätt resurser kan du skapa AI-arbetsbelastningar med hjälp av både fördefinierade och anpassade lösningar.
I en icke-generativ AI-arbetsbelastning matar (1) arbetsbelastningen in data. (2) En valfri mekanism för databehandling extraherar eller manipulerar inkommande data. (3) En AI-modellslutpunkt analyserar data. (4) Data stöder träning eller finjustering av AI-modeller. Använd följande rekommendationer som ramverk för att skapa icke-generativa AI-arbetsbelastningar.
Välj en icke-generativ AI-plattform. Azure AI-tjänster erbjuder fördefinierade AI-modeller som inte kräver datavetenskapskunskaper. Vägledning om hur du väljer rätt Azure AI-tjänst finns i Välj en Azure AI-tjänstteknik. Azure Machine Learning tillhandahåller en plattform för att skapa maskininlärningsmodeller med dina egna data och använda dessa modeller i AI-arbetsbelastningar.
Välj lämplig AI-beräkning. För Azure Machine Learning behöver du beräkningsresurser för att köra ett jobb eller vara värd för en slutpunkt. Använd den beräkningstyp som uppfyller dina prestanda- och budgetbehov. Azure AI-tjänster kräver inte beräkningsresurser.
Välj en datakälla. För Azure Machine Learning använder du en av de datakällor som stöds för att vara värd för dina träningsdata. För Azure AI-tjänster kräver många av tjänsterna inte finjusteringsdata, och vissa, till exempel Azure AI Custom Vision, tillhandahåller ett alternativ för att ladda upp lokala filer till en hanterad datalagringslösning.
Välj en beräkningsplattform. Använd beslutsträdet för Azure-beräkning för att välja rätt arbetsbelastningsplattform.
Välj en databehandlingstjänst (valfritt). Azure Functions är ett vanligt val för databehandling eftersom det ger ett serverlöst alternativ. Azure Event Grid är också en vanlig utlösarmekanism för att starta en databearbetningspipeline.