參與 AI 工作負載的工作負載小組角色
在建置 AI 工作負載的內容中,不同於傳統程式代碼部署,非決定性模型需要跨多個角色和小組進行反覆的實驗和共同作業。 作業、應用程式開發和數據小組的早期整合,對於增進相互了解至關重要。 此共同作業需要多樣化的技能和持續學習,以跟上技術進步的步伐。
有效的共同作業取決於 整合工具、流程和人員,全都由工作負載需求和特定目標驅動。 建議的策略包括:
- 建立明確的角色和責任。
- 利用小組的技能集進行適當的工作。
- 將流程和轉包處理標準化,例如追蹤工作做為共用待辦專案的一部分。
- 依賴自動化來達到一致性和重現性。
角色可以是具體化這些策略和標準化責任的有效工具。 本文探討 AI 工作負載中找到的角色概念、其在工作負載設計方面的優點,並提供範例和工具,以有效地定義及利用這些小組層級的角色。
什麼是角色?
角色代表參與建立和執行工作負載的人類和程式子集,不僅擷取其角色,而且擷取其實際行為和責任。 個人可以根據內容來體現一或多個角色。 有趣的是,角色不必是一個人;它也可以是自動進程,例如架構中的代理程序進程。
您的工作負載可能有可推動功能開發的使用者角色,這些角色不在本文的範圍內。
與角色不同,這些角色通常是更靜態的函式或組織內的位置,角色是動態且面向目標的角色。 它們可用來將技能需求對應至流程和工具,例如架構元件。 角色主要有助於定義責任範圍,並在專案內設定內容。 它們提供數個其他優點,例如:
識別資源差距,有助於決定是否要招募、訓練或重新設計解決方案。 如果您的工作負載小組缺少適合必要角色的個人,您可能需要調整架構、修改程式,或讓新人員上線。 例如,如果遺漏資深數據科學角色,則可以考慮在一般用途 SaaS AI 解決方案或併入第三方 AI 解決方案上提高可靠性,來重新設計架構。
增強的技能。 將角色對應至特定架構元件也有助於教育機會,提供課程和在線課程來增強技能。
請確定適當的存取層級。 角色應該用來定義安全性和存取需求,方法是將它們對應至程式、架構和服務,以確保適當的存取層級。
項目規劃和通訊 在項目規劃中,角色有助於識別關鍵互動,促進同步會議設定和整體規劃。 一般而言,角色會整合到追蹤使用者劇本、功能和需求階層中,簡化專案管理。
如何定義角色
識別小組成員的特製化,並將其與 AI 作業或設計中的適當角色一致。 建立範本,以記錄角色的技能期望、小組資訊,以及他們將參與的程式。
以下是基準範本範例:
角色範本 |
---|
🔹 角色名稱:[插入角色名稱] 🔹小組:[負責此角色的小組] 🔹主要互動:[此角色與其他小組互動] 🔹元件存取:[行程和系統元件的安全性和存取需求] 🔹程式:[角色負責或參與的程式] 🔹技能:[完成工作所需的技能,包括模型定型或搜尋索引優化等領域和技術細節。] |
工具
使用數據表有助於組織和可視化每個角色的資訊。 優點是您可以建立並連結其他數據表以取得更深入的資訊。 例如,您可以將架構元件連結至另一個數據表,其中識別型訪問控制是針對每個服務和環境指定(開發、階段、生產環境)。
權衡。 角色太少,因此難以以最低許可權存取實作角色型訪問控制,並有效地分配工作責任。 相反地,擁有太多角色會增加管理額外負荷。 從 5-10 個角色開始是很好的平衡點,您應該只新增作業所需的角色。
卡片也可以用來定義角色。 這些卡片包含與數據表或快速摘要相同的資訊。 您可以使用 Microsoft PowerPoint 或作為一組 Markdown 檔案來建立這些卡片。
在某些情況下,您可以使用一組合並的工具。 例如,角色卡片中的每個架構元件都可以針對每個服務和環境開啟具有數據表對應安全性和角色型訪問控制的 Markdown 檔案。 如需參考範例,請參閱 MLOps 加速器:身分識別 RBAC。
範例角色
使用卡片,您可以定義角色在程式中需要存取的服務,並概述每個角色所需的必要技能(無論是人員還是代理程式)。
重要
雖然這裏定義的角色可作為基準範例,但建議使用數據表、角色範本卡片和圖形等工具來建立您自己的角色。
請務必讓這些角色與您的特定程式、組織和使用者保持一致。
AI 資料工程師 (P001) |
---|
小組:數據擷取小組 🔹 主要互動:AI 開發小組 🔹元件存取:Azure Data Factory、Azure Databricks、Azure SQL 資料庫、Azure 儲存體 🔹 進程:DataOps、ETL、ELT 🔹 技能:SQL、Python、PySpark |
BI 分析師 (P003) |
---|
小組:分析小組 🔹 主要互動:數據擷取小組 🔹元件存取:Power BI、Azure 數據總管、Azure 儲存體 🔹 進程:數據分析、數據倉儲程式 🔹 技能:SQL、Python、PySpark |
歧視 AI 資料科學家 (P004) |
---|
小組:AI 小組 🔹 主要互動:數據擷取小組、DevOps 小組 🔹元件存取:Azure 機器學習、Azure Databricks、Azure 儲存體、Azure 金鑰保存庫 🔹 進程:MLOps、MLflow 🔹技能:Azure 機器學習、Python、模型定型 |
GenAI 資料科學家 (P006) |
---|
小組:AI 小組 🔹 主要互動:數據擷取小組、DevOps 小組 🔹元件存取:Azure AI Studio、Azure OpenAI、Azure AI 搜尋服務、Azure 儲存體、Azure 金鑰保存庫 🔹 程式:GenAIOps 🔹技能:Azure 機器學習、Python、Model(LLM、SLM) 知識、微調、RAG、代理概念 |
GenAI 聊天開發人員 (P007) |
---|
小組:工程小組 🔹 主要互動:AI 小組 🔹 元件存取:Azure WebApps、Azure API 管理、Cosmos DB、Azure Container Apps、Azure Functions 🔹 進程:DevOps、事件驅動處理、微服務 🔹 技能:Web 應用程式架構(前端/後端)、React、Node.js、HTML、CSS |
BuildAgent MLOps (P009) |
---|
小組:工程小組 🔹 主要互動:AI 小組 🔹元件存取:Azure 機器學習、Azure Devops、GitHub 🔹 進程:LAMBDA 的進程/服務、OUTER 迴圈 MLOps 🔹 技能:Python、Pyspark |
使用案例:AI 流程的角色
與 AI 工作負載相關的主要程式如下:
- DataOps 著重於數據擷取和準備。
- MLOps 牽涉到將機器學習模型運作。
- GenAIOps 與探索和評估現有模型有關,然後將這些模型精簡至您的工作負載內容。
- 內部迴圈會在研究期間或由外部迴圈監視觸發,在開發環境中精簡解決方案。
- 外部迴圈會使用持續監視和評估,將解決方案從開發移至生產環境,以找出必要的改善。
將角色對應至這些進程,可提供每個角色的內容。 這有助於識別角色可能需要提升技能的程式。
此影像顯示生產環境中 DataOps、MLOps 和 GenAIOps 的工作流程。 使用持續整合/持續部署(CI/CD) 做法,從擷取到模型部署和評估的數據流。 主要工作包括精簡數據模型、批次評估、部署端點、即時模型評估,以及微調模型。 範例角色會參與整個工作流程。
使用案例:架構設計的角色
將程式連線到支持架構,可協助您識別角色需要與之互動的服務,並醒目提示潛在向上技能的區域。
若要將此連線可視化,請建立圖形化影像,顯示架構元件連線的方式。 這可以說明服務之間的數據流和互動,以及流程在部署中的自動化方式。 此視覺輔助可協助項目關係人瞭解其內不同角色的架構和角色。
下圖顯示 Azure 上新式分析的 LAMBDA 架構:
後續步驟
現在,請繼續進行評估工具,以評估您的設計。