Distributionsfasen i livscykeln för Team Datavetenskap Process
Den här artikeln beskriver mål, uppgifter och slutprodukt som är associerade med distributionen av Team Datavetenskap Process (TDSP). Den här processen ger en rekommenderad livscykel som ditt team kan använda för att strukturera dina datavetenskapsprojekt. Livscykeln beskriver de viktigaste stegen som ditt team utför, ofta iterativt:
- Affärsförstelse
- Datainsamling och förståelse
- Modellering
- Distribution
- Kundgodkännande
Här är en visuell representation av TDSP-livscykeln:
Goal
Målet med distributionssteget är att distribuera modeller med en datapipeline till en produktions- eller produktionsliknande miljö för slutlig kundgodkännande.
Så här slutför du uppgiften
Huvuduppgiften för den här fasen är att operationalisera modellen. Distribuera modellen och pipelinen till en produktions- eller produktionsliknande miljö för programförbrukning.
Operationalisera en modell
När du har en uppsättning modeller som fungerar bra kan ditt team operationalisera dem så att andra program kan använda dem. Beroende på affärskraven görs förutsägelser antingen i realtid eller i batch. Om du vill distribuera modeller exponerar du dem med ett API-gränssnitt. Med ett gränssnitt kan användarna enkelt använda modellen från olika program, till exempel:
- Webbplatser
- Kalkylblad
- Instrumentpaneler
- Verksamhetsspecifika appar
- Serverdelsprogram
Exempel på modelldriftsättning med Azure Machine Learning finns i Distribuera maskininlärningsmodeller till Azure. Det är en bra idé att bygga in övervakning i produktionsmodellen och den datapipeline som du distribuerar. Den här metoden hjälper till med efterföljande systemstatusrapportering och felsökning.
Integrera med MLflow
För att stödja den här fasen kan du använda följande Azure Machine Learning-funktioner:
Modellhantering: För att förbereda en distribution placerar du en modell i en produktions- eller driftmiljö. MLflow hanterar och versioner distributionsklara modeller, vilket hjälper till att förbättra driftsättningen.
Modellservering och distribution: MLflows modell som betjänar funktioner underlättar distributionsprocessen, så att du enkelt kan hantera modeller i olika miljöer.
Artifacts
I det här skedet levererar ditt team:
En statusinstrumentpanel som visar systemets hälsotillstånd och nyckelmått. Vi rekommenderar att du använder Power BI för att skapa en instrumentpanel.
En slutlig modelleringsrapport med distributionsinformation.
Ett slutligt lösningsarkitekturdokument.
Peer-granskad litteratur
Forskare publicerar studier om TDSP i peer-granskad litteratur. Citaten ger en möjlighet att undersöka andra program eller liknande idéer som TDSP, inklusive distributionens livscykelfas.
Deltagare
Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.
Huvudförfattare:
- Markera Tabladillo | Senior Cloud Solution Architect
Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.
Relaterade resurser
I de här artiklarna beskrivs de andra stegen i TDSP-livscykeln: