共用方式為


使用 SQL Server 資料庫搭配 機器學習 Studio 執行分析(傳統版)

適用於:適用。機器學習 Studio (傳統版) 不適用。Azure 機器學習

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

使用內部部署數據的企業通常會想要利用雲端的規模和靈活度,為其機器學習工作負載。 但是,他們不想藉由將內部部署數據移至雲端來中斷其目前的商務程式和工作流程。 機器學習 Studio(傳統版)現在支援從 SQL Server 資料庫讀取您的數據,然後使用此數據定型和評分模型。 您不再需要手動複製和同步雲端與內部部署伺服器之間的數據。 相反地,機器學習 Studio (傳統版) 中的匯入數據模組現在可以直接從 SQL Server 資料庫讀取,以取得定型和評分作業。

本文提供如何將 SQL Server 數據輸入至 機器學習 Studio (傳統版) 的概觀。 它假設您已熟悉 Studio (傳統) 概念,例如工作區、模組、數據集、實驗

注意

此功能不適用於免費工作區。 如需 機器學習 定價層的詳細資訊,請參閱 機器學習 Studio (傳統) 定價

安裝 Data Factory 自我裝載整合運行時間

若要在 機器學習 Studio 中存取 SQL Server 資料庫(傳統版),您必須下載並安裝 Data Factory 自我裝載整合運行時間,先前稱為 資料管理 閘道。 當您在 機器學習 Studio 中設定連線時,您有機會使用以下所述的 [下載和註冊數據閘道] 對話方塊來下載並安裝 Integration Runtime (IR)。

您也可以從 Microsoft 下載中心下載和執行 MSI 安裝套件,以事先安裝 IR。MSI 也可以用來將現有的 IR 升級至最新版本,並保留所有設定。

Data Factory 自我裝載整合運行時間具有下列必要條件:

  • Data Factory 自我裝載整合需要具有 .NET Framework 4.6.1 或更新版本的 64 位作業系統。
  • 支援的 Windows 操作系統版本包括 Windows 10 、Windows Server 2012、Windows Server 2012 R2、Windows Server 2016。
  • IR 機器的建議設定至少為 2 GHz、4 核心 CPU、8GB RAM 和 80GB 磁碟。
  • 如果主電腦休眠,IR 將不會響應數據要求。 因此,請先在計算機上設定適當的電源計劃,再安裝 IR。 如果機器設定為休眠,IR 安裝會顯示訊息。
  • 因為複製活動是以特定頻率發生,因此計算機上的資源使用量(CPU、記憶體)也會遵循尖峰和閑置時間相同的模式。 資源使用率也仰賴要移動的資料量。 當多個複製作業進行中時,您會在尖峰時間觀察資源使用量上升。 雖然上述最低設定在技術上已足夠,但根據數據移動的特定負載,您可能想要擁有比最小設定更多的資源組態。

設定及使用Data Factory自我裝載整合運行時間時,請考慮下列事項:

  • 您只能在單一電腦上安裝一個 IR 實例。

  • 您可以針對多個內部部署數據源使用單一 IR。

  • 您可以將不同電腦上的多個 IR 連線到相同的內部部署資料來源。

  • 您一次只設定一個工作區的 IR。 目前,無法在工作區之間共用 IR。

  • 您可以為單一工作區設定多個 IR。 例如,當您準備好運作時,您可能想要使用在開發期間連線到測試數據源的 IR,以及生產 IR。

  • IR 不需要位於與數據源相同的電腦上。 但離數據源更近,可縮短網關聯機至數據源的時間。 建議您在與裝載內部部署數據源不同的計算機上安裝 IR,讓閘道和數據源不會競爭資源。

  • 如果您已在提供 Power BI 或 Azure Data Factory 案例的電腦上安裝 IR,請在另一部電腦上安裝個別的 IR for 機器學習 Studio(傳統版)。

    注意

    您無法在同一部電腦上執行 Data Factory 自我裝載整合運行時間和 Power BI 閘道。

  • 即使您將 Azure ExpressRoute 用於其他數據,您也必須針對 機器學習 Studio(傳統版)使用 Data Factory 自我裝載整合運行時間。 即使您使用 ExpressRoute,您也應該將數據源視為內部部署數據源(防火牆後方)。 使用 Data Factory 自我裝載整合運行時間來建立 機器學習 與數據源之間的連線。

您可以在 Data Factory 整合運行時間一文中找到安裝必要條件、安裝步驟和疑難解答秘訣的詳細資訊。

從 SQL Server 資料庫輸入資料到 機器學習

在本逐步解說中,您會在 Azure 機器學習 工作區中設定 Azure Data Factory Integration Runtime、進行設定,然後從 SQL Server 資料庫讀取數據。

提示

開始之前,請先停用 studio.azureml.net瀏覽器的快顯封鎖程式。 如果您使用Google Chrome 瀏覽器,請下載並安裝Google Chrome WebStore 單擊一次應用程式延伸模組所提供的數個外掛程式之一。

注意

Azure Data Factory 自我裝載整合運行時間先前稱為 資料管理 閘道。 逐步教學課程會繼續將它稱為網關。

步驟 1:建立閘道

第一個步驟是建立和設定閘道來存取您的 SQL 資料庫。

  1. 登入 機器學習 Studio(傳統版),然後選取您想要使用的工作區。

  2. 按兩下左側的 [設定] 刀鋒視窗,然後按兩下 頂端的 [資料閘道] 索引標籤。

  3. 按兩下畫面底部的 [ 新增數據閘道 ]。

    新增數據閘道

  4. 在 [ 新增數據閘道 ] 對話框中,輸入 [閘道名稱 ],並選擇性地新增 [描述]。 按兩下角的箭號,移至設定的下一個步驟。

    輸入閘道名稱和描述

  5. 在 [下載並註冊數據閘道] 對話框中,將 [閘道註冊金鑰] 複製到剪貼簿。

    下載並註冊數據閘道

  6. 如果您尚未下載並安裝 Microsoft 資料管理 閘道,請按兩下 [下載資料管理閘道]。 這會帶您前往Microsoft下載中心,您可以在其中選取所需的網關版本、下載並安裝它。 您可以在使用 資料管理 閘道在內部部署來源與雲端之間行動資料一文的開頭小節中找到安裝必要條件、安裝步驟和疑難解答秘訣的詳細資訊。

  7. 安裝閘道之後,資料管理 閘道組態管理員隨即開啟,並顯示 [註冊閘道] 對話方塊。 貼上您複製到剪 貼簿的閘道註冊金鑰 ,然後按下 [ 註冊]。

  8. 如果您已安裝閘道,請執行 資料管理 Gateway Configuration Manager。 按兩下 [變更金鑰],貼 上您在上一個步驟中複製到剪貼簿的閘道註冊密鑰 ,然後按下 [ 確定]。

  9. 安裝完成時,會顯示 Microsoft 資料管理 Gateway Configuration Manager 的 [註冊閘道] 對話方塊。 將您在上一個步驟中複製到剪貼簿的閘道註冊密鑰貼上,然後按兩下 [ 註冊]。

    註冊閘道

  10. 當 [首頁] 索引標籤上的 [首頁] 索引卷標上設定下列值 Microsoft 資料管理 閘道組態管理員時,網關組態就會完成:

    • 閘道名稱和實例名稱會設定為閘道的名稱。

    • 註冊設定為 [已註冊]。

    • 狀態 設定為 [已啟動]。

    • 底部的狀態列會顯示 [連線到 資料管理 閘道雲端服務],以及綠色複選標記。

      資料管理 閘道管理員

      機器學習 Studio(傳統版)在註冊成功時也會更新。

    閘道註冊成功

  11. 在 [ 下載並註冊數據網關 ] 對話框中,按下複選標記以完成設定。 [ 設定] 頁面會將閘道狀態顯示為 [在線]。 在右側窗格中,您會發現狀態和其他實用資訊。

    閘道設定

  12. 在 [Microsoft 資料管理 閘道組態管理員] 切換至 [憑證] 索引標籤。此索引標籤上指定的憑證可用來加密/解密您在入口網站中指定的內部部署資料存放區認證。 此憑證是預設憑證。 Microsoft建議您將此變更為您在憑證管理系統中備份的您自己的憑證。 按兩下 [ 變更 ] 以改用您自己的憑證。

    變更閘道憑證

  13. (選擇性)如果您想要啟用詳細資訊記錄以針對閘道的問題進行疑難解答,請在 [Microsoft 資料管理 網關組態管理員] 切換至 [診斷] 索引卷標,然後核取 [啟用詳細資訊記錄以進行疑難解答] 選項。 您可以在 [應用程式及服務記錄] ->資料管理 [網關] 節點下的 Windows 事件檢視器 中找到記錄資訊。 您也可以使用 [ 診斷] 索引 標籤,使用閘道來測試與內部部署數據源的連線。

    啟用詳細資訊記錄

這會在 機器學習 Studio 中完成閘道設定程式(傳統版)。 您現在已準備好使用內部部署數據。

您可以在 Studio 中為每個工作區建立及設定多個閘道。 例如,您可能有想要在開發期間連線到測試數據源的閘道,以及生產數據源的不同閘道。 機器學習 Studio(傳統版)可讓您根據公司環境彈性設定多個閘道。 目前您無法在工作區之間共用閘道,而且單一計算機上只能安裝一個閘道。 如需詳細資訊,請參閱使用 資料管理 閘道在內部部署來源與雲端之間行動數據。

步驟 2:使用閘道從內部部署數據源讀取數據

設定閘道之後,您可以將匯入資料模組新增至實驗,以從 SQL Server 資料庫輸入數據。

  1. 在 機器學習 Studio(傳統版)中,選取 [實驗] 索引標籤,按兩下左下角的 [+新增],然後選取 [空白實驗] (或選取數個可用的範例實驗之一)。

  2. 尋找 [匯入數據] 模組並將其拖曳至實驗畫布。

  3. 按兩下 畫布下方的 [另存新檔 ]。 針對實驗名稱輸入「機器學習 Studio(傳統版)內部部署 SQL Server 教學課程」,選取工作區,然後按兩下 [確定] 複選標記。

    使用新名稱儲存實驗

  4. 按兩下 [匯入資料] 模組加以選取,然後在畫布右側的 [屬性] 窗格中,選取 [資料源] 下拉式清單中的 [內部部署 SQL 資料庫]。

  5. 選取您安裝並註冊的數據閘道。 您可以選取 [新增數據網關...],以設定另一個閘道。

    選取匯入數據模組的數據閘道

  6. 輸入 SQL Database 伺服器名稱和資料庫名稱,以及您想要執行的 SQL Database 查詢

  7. 按兩下 [使用者名稱和密碼] 底下的 [輸入值],然後輸入您的資料庫認證。 視 SQL Server 的設定方式而定,您可以使用 Windows 整合式驗證或 SQL Server 驗證。

    輸入資料庫認證

    訊息「必要值」會以綠色複選標記變更為「值集」。 您只需要輸入認證一次,除非資料庫資訊或密碼變更。 機器學習 Studio (傳統版) 會使用您在安裝閘道時所提供的憑證來加密雲端中的認證。 Azure 絕不會儲存內部部署認證,而不需要加密。

    匯入資料模組屬性

  8. 按兩下 [執行] 以執行實驗。

實驗完成執行之後,您可以按兩下 [匯入資料] 模組的輸出埠,然後選取 [可視化],將您從資料庫匯入的數據可視化。

完成開發實驗之後,您就可以部署和運作模型。 使用批次執行服務,匯入數據模組中設定之 SQL Server 資料庫的數據將會讀取並用於評分。 雖然您可以使用要求回應服務來評分內部部署數據,但Microsoft建議改用 Excel載入 巨集。 目前,在您的實驗或已發佈的 Web 服務中,不支援透過 匯出數據 寫入 SQL Server 資料庫。