共用方式為


AKS 上的 HDInsight 新功能? (預覽)

注意

AKS 上的 Azure HDInsight 將於 2025 年 1 月 31 日退場。 請於 2025 年 1 月 31 日之前,將工作負載移轉至 Microsoft Fabric 或對等的 Azure 產品,以免工作負載突然終止。 訂用帳戶中剩餘的叢集將會停止,並會從主機移除。

在淘汰日期之前,只有基本支援可用。

重要

此功能目前為預覽功能。 Microsoft Azure 預覽版增補使用規定包含適用於 Azure 功能 (搶鮮版 (Beta)、預覽版,或尚未正式發行的版本) 的更多法律條款。 若需此特定預覽版的相關資訊,請參閱 Azure HDInsight on AKS 預覽版資訊。 如有問題或功能建議,請在 AskHDInsight 上提交要求並附上詳細資料,並且在 Azure HDInsight 社群上追蹤我們以獲得更多更新資訊。

在 AKS 上的 HDInsight 中,所有叢集管理和作業都原生支援個別叢集的 Azure 入口網站上的服務管理

在 AKS 上的 HDInsight 中,引進了兩個新的概念:

  • 叢集集區可用來分組和管理叢集。
  • 叢集用於開放原始碼計算,它們裝載在叢集集區內。

叢集集區

AKS 上的 HDInsight 會在 Azure Kubernetes Service (AKS) 上執行。 最上層資源是叢集集區,並管理在相同 AKS 叢集上執行的所有叢集。 當您建立叢集集區時,會同時建立基礎 AKS 叢集,以裝載集區中的所有叢集。 叢集集區是叢集的邏輯群組,可協助跨多個叢集類型建立穩固的互通性,並允許企業在相同的虛擬網路中擁有叢集。 叢集集區可提供快速且符合成本效益地存取,存取隨選和大規模建立的所有叢集類型。在 AKS 基礎結構中,一個叢集集區對應至一個叢集。

叢集

叢集是個別的開放原始碼計算工作負載,例如 Apache Spark、Apache Flink 和 Trino,其可透過預先設定組態和幾次點擊,在幾分鐘內快速建立。 雖然在相同的叢集集區上執行,但每個叢集都可以有自己的設定,例如叢集類型、版本、節點 VM 大小、節點計數。 叢集會以自己的 DNS 和端點,在個別的計算資源上執行。

功能目前處於預覽狀態

下表列出目前為預覽狀態的 AKS 上的 HDInsight 功能。 預覽功能依字母順序排序。

區域 功能
基本項目 使用入口網站建立集區和叢集、Web 安全殼層 (ssh) 支援、在叢集建立期間選擇背景工作角色節點數目的能力
儲存體 ADLS Gen2 儲存體支援
Metastore TrinoSparkFlink 的外部中繼存放區支援,與 HDInsight 整合
安全性 支援 ARM RBAC、支援 MSI 型驗證、提供叢集存取權給其他使用者的選項
記錄和監視 Azure 記錄分析中的記錄彙總,適用於透過受控 Prometheus 和 Grafana 的伺服器記錄、叢集和服務計量、支援 Azure 監視器中的伺服器計量、監視服務健康情況的服務狀態頁面
自動擴充 基於負載的自動調整,以及基於排程的自動調整
自訂和設定叢集 在叢集建立期間支援指令碼動作、支援程式庫管理、叢集建立後的服務組態設定
Trino 支援 Trino 目錄Trino CLI 支援DBeaver 支援查詢提交、新增或移除外掛程式連接器、支援記錄查詢事件、支援 Trino 儀錶板中任何連接器掃描查詢統計資料、支援 Trino 儀錶板來監視查詢、查詢快取、與 Power BI 整合、與 Apache Superset 整合、Redash、支援多個 連接器
Flink 支援 Flink 原生 Web UI、Flink 支援 HMS for DStream、使用 REST API 和 Azure 入口網站將作業提交至叢集、透過 Flink CLI 執行封裝為 JAR 檔案的程式、支援永續性儲存點、支援作業執行時更新設定選項、連線到多個 Azure 服務:Azure Cosmos DBAzure DatabricksAzure Data ExplorerAzure 事件中樞Azure IoT 中樞Azure PipelinesAzure Data Factory 工作流程協調管理員HDInsight Kafka、使用 Flink CLICDC 搭配 Flink 將作業提交至叢集
Spark Jupyter Notebook、支援 Delta Lake 2.0、Zeppelin 支援、支援 ATS、支援 Yarn 歷程記錄伺服器介面、使用 SSH 提交作業、使用 SDK 和 Machine Learning Notebook 提交作業

功能藍圖

功能 預估發行時間表 狀態
自動調整 - 基於負載 - Trino Q1 2024 已完成
Spark 基於隨機感知負載的自動調整 Q2 2024 進行中
就地升級 Q2 2024 已完成
保留執行個體支援 Q2 2024 進行中
中繼存放區的 MSI 型驗證 (SQL) Q1 2024 進行中
Spark 3.4 Q2 2024 進行中
Trino 426 Q1 2024 已完成
RBAC 的 Ranger Q2 2024 進行中
Flink 的應用程式模式支援 Q1 2024 已完成
Flink 1.17 Q1 2024 已完成
Spark ACID 支援 Q1 2024 進行中
Headnode、SSH 的可設定 SKU Q2 2024 進行中
Flink SQL 閘道支援 Q1 2024 已完成
AKS 上的 HDInsight 私人叢集 Q1 2024 已完成
Spark SQL 的 Ranger 支援 Q4 2024 進行中
儲存層上的 Ranger ACL Q4 2024 進行中
支援 One Lake 作為主要容器 Q2 2024 進行中