共用方式為


SQL Server 巨量資料叢集的機器學習指南

適用於:SQL Server 2019 (15.x)

本文描述如何針對機器學習案例使用 SQL Server 巨量資料叢集。

重要

Microsoft SQL Server 2019 巨量資料叢集附加元件將會淘汰。 SQL Server 2019 巨量資料叢集的支援將於 2025 年 2 月 28 日結束。 平台上將完全支援含軟體保證 SQL Server 2019 的所有現有使用者,而且軟體將會持續透過 SQL Server 累積更新來維護,直到該時間為止。 如需詳細資訊,請參閱公告部落格文章Microsoft SQL Server 平台上的巨量資料選項

SQL Server 巨量資料叢集中機器學習的簡介

SQL Server 巨量資料叢集會使用不同的技術堆疊來啟用機器學習案例和解決方案:SQL Server 機器學習服務Apache Spark ML

SQL Server 巨量資料叢集使用已建立的 SQL Server 機器學習服務技術堆疊,在 SQL Server 引擎內提供機器學習服務功能;可實現高效能、資料庫內的機器學習推斷和評分案例。

針對巨量資料型機器學習案例,將 HDFS 用於巨量資料裝載和 Apache Spark ML 功能會更具成本效益、可調整且功能強大。

機器學習案例

機器學習功能可實現不同的應用程式和解決方案,例如:詐騙偵測、預測、流失,以及一般分類和迴歸工作。 不過,請務必針對案例使用最佳技術。

層面 SQL Server 機器學習服務 Apache Spark ML
資料放置 利用 SQL Server 上的表格式資料位置。 進階資料層。 使用 HDFS 的可調整巨量資料層;可以是非結構化、半結構化和結構化資料。
適用對象 低延遲推斷和評分案例 1. 採用巨量資料的分散式批次定型和評分機器學習模型
2. ML 的 ETL 接收和大規模資料準備和特徵化
摘要 支援 ML 的 BI 儀表板、報表和應用程式。 需要低延遲 批次評分資料可能會升階至 SQL Server,以驅動 ML 支援的案例
Latency 需要低延遲 可接受較高延遲
閱讀更多資訊 對安裝有機器學習服務的 SQL Server 巨量資料叢集執行 Python 與 R 指令碼 SQL Server 巨量資料叢集上的 Spark 機器學習簡介

下一步

如需詳細資訊,請參閱 SQL Server 巨量資料叢集簡介