ML Studio (傳統) 模組描述
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
本主題概述機器學習 Studio (傳統) 中包含的所有模組,這是可輕鬆建立和測試預測模型的互動式視覺化工作區。
什麼是課程模組?
在機器學習 Studio (傳統) 中,模組是用來建立實驗的建立區塊。 每個模組都會封裝特定的機器學習演算法、函式或程式碼程式庫,以處理您工作區中的資料。 這些模組是設計來接受來自其他模組的連接,以共用和修改資料。
在每個模組中執行的程式碼來自許多來源。 這些包括開放原始碼程式庫和語言、Microsoft Research 所開發的演算法,以及使用 Azure 和其他雲端服務的工具。
藉由連接和設定模組,您可以建立工作流程,從外部來源讀取資料、準備資料以進行分析、套用機器學習演算法,以及產生結果。
當實驗在機器學習 Studio (傳統) 中開啟時,您可以在左側導覽窗格中看到目前模組的完整清單。 您可以將這些建築物區塊拖曳到您的實驗中,然後連接它們來建立完整的機器學習工作流程,稱為實驗。
有時模組會更新以新增功能,或移除較舊的程式碼。 發生這種情況時,您所建立且使用此模組的任何實驗都會繼續執行。 但是,當您下次開啟實驗時,系統會提示您升級模組,或使用不同的模組。
範例
如需如何建立完整機器學習實驗的範例,請參閱下列教學課程:
模組類別
為了讓您更輕鬆地找到相關的模組,機器學習 Studio 中的機器學習工具 (傳統) 依這些類別分組。
資料格式轉換
這些模組可讓您將資料轉換成其他機器學習工具或格式所使用的其中一種格式。
-
使用這些模組從雲端資料來源(包括 Hadoop 叢集、Azure 資料表儲存體和 web Url)讀取資料和模型。 您也可以使用這些模組,將結果寫入至儲存體或資料庫。
-
這些模組可讓您準備資料以便進行分析。 您可以變更資料類型、將資料行標示為特徵或標籤、產生功能,以及調整或正規化資料。
-
轉換衍生自數位信號處理的數值資料。
-
使用聯合機率分佈來建立簡潔地描述大型資料集的功能。
-
此群組提供各種不同的資料科學工具。 例如,您可以移除或取代遺漏值、選擇資料行的子集、加入資料行,或串連兩個資料集。
-
依準則或大小來分割資料集、建立定型集和測試集,或隔離特定資料列。
-
轉換數值資料。
特徵選取
這些模組可讓您使用廣泛用於研究之統計方法識別資料中的最佳特徵。
Machine Learning
此群組包含機器學習所支援的大部分機器學習演算法。
它也包含可透過定型模型、產生分數和評估模型效能來支援演算法的模組。
-
定型模型之後,請使用這些工具來測量模型的精確度。
-
這些模組提供機器學習演算法,您可以藉由設定參數自訂此演算法。 此區段中的演算法會依類型分組:
-
使用這些模組透過演算法傳遞新的資料,並產生一組評估結果。 您也可以使用評分的結果做為預測性服務的一部分。
-
這些模組會針對您所提供的資料,將已初始化的機器學習模型定型。
OpenCV 程式庫模組
這些模組可讓您輕鬆存取常用的影像處理和影像分類開放原始碼程式庫。
R 語言模組
這些模組可讓您將自訂 R 程式碼加入實驗中,或實作以 R 封裝為基礎的機器學習模型。
Python 語言模組
這些模組可讓您將自訂 Python 程式碼加入的實驗中。
統計函數
這些模組可讓您計算機率分配、建立自訂計算,以及執行多種與數值變數相關的其他工作。
文字分析
使用這些模組來執行特徵雜湊和命名實體辨識,或使用自然語言處理工具來前置處理文字。
時間序列
使用這些模組來評估趨勢中的異常狀況,方法是使用特別針對時間序列資料設計的演算法。
相關工作
機器學習 Studio (傳統) 模組不會嘗試複製其他工具所支援的資料整合工具,例如 Azure Data Factory。 相反地,模組會提供機器學習服務的特定功能:
- 標準化、群組和調整資料
- 計算資料的統計分佈
- 轉換成其他機器學習格式
- 匯入用於機器學習實驗和匯出結果的資料
- 文字分析、特徵選取和維度縮減
如果您需要更精密的資料操作和儲存設備,請參閱下列各項:
- Azure Data Factory: Enterprise 就緒的雲端資料處理管線。
- Azure SQL Database:可擴充的儲存體,並整合存取機器學習服務。
- CosmosDB: NoSQL 資料存放區;將資料匯入機器學習 Studio (傳統) 。
- Azure Data Lake Analytics:大型資料的分散式分析。
- 串流分析:物聯網的事件處理。
- Azure 文字分析:用於文字處理的多個選項,以及適用于語音、影像和臉部辨識的相關認知服務。
- Azure Databricks:以 Spark 為基礎的分析平臺。