資料和 AI
本文將核心 Azure 數據和 AI 服務與對應的 Amazon Web Services (AWS) 服務進行比較。
如需其他 AWS 和 Azure 服務的比較,請參閱適用於 AWS 專業人員的 Azure 。
數據控管、管理和平臺
Microsoft Purview 和下表所述的 AWS 服務組合,旨在提供完整的數據控管解決方案。 這些解決方案可讓組織有效地管理、探索、分類及提供其數據資產的安全性。
Microsoft 服務 | AWS 服務 | 描述 |
---|---|---|
Microsoft Purview | AWS Glue 資料目錄、AWS Lake Formation、Amazon Macie、AWS Identity and Access Management (IAM)、AWS Config | 這兩個選項都提供健全的數據控管、編錄和合規性功能。 Microsoft Purview 是統一的數據控管解決方案,可讓組織探索、分類及管理跨內部部署、多重雲端和 SaaS 環境的數據。 它也提供數據譜系和合規性功能。 AWS 提供多個服務的類似功能:AWS Glue 資料目錄 用於元數據管理、適用於數據湖建立和治理的 AWS Lake Formation、適用於數據分類和保護的 Amazon Macie、用於存取控制的 AWS IAM,以及用於組態管理和合規性追蹤的 AWS Config。 |
全方位平臺與 AWS 服務
Microsoft Fabric 提供一個全方位平臺,以統一新式分析解決方案所需的數據和 AI 服務。 其可簡化在服務之間行動數據、提供統一治理和安全性,以及簡化定價模式的程式。 這種統一方法與 AWS 方法形成鮮明對比,其中服務通常會分開使用,而且需要更努力地整合。 Fabric 提供跨這些函式的無縫整合,可協助貴組織加速 Azure 生態系統中的數據驅動計劃。
AWS 和 Fabric 都為數據整合、處理、分析、機器學習和商業智慧提供服務。
AWS 服務 | 網狀架構 | 描述 |
---|---|---|
AWS Glue、 AWS 數據管線 | 數據與 Azure Data Factory 整合 | AWS 提供一組可結合的個別服務,以建置數據和分析解決方案。 這種方法提供彈性,但需要更多精力將服務整合到端對端解決方案中。 Fabric 在單一整合平臺內提供這些功能,以簡化工作流程、共同作業和管理。 |
AWS 服務與網狀架構元件的詳細比較
數據整合和 ETL 工具
數據整合和擷取、轉換、載入(ETL)工具可協助您擷取、轉換、將數據從多個來源載入統一系統進行分析。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
AWS Glue | Data Factory | AWS Glue 和 Azure Data Factory 是完全受控的 ETL 服務,可協助跨各種來源進行數據整合。 |
適用於 Apache Airflow 的 Amazon 受控工作流程 (MWAA) | 使用 Azure Synapse Analytics 管線的 Data Factory | Apache Airflow 為複雜的數據管線提供受控工作流程協調流程。 Azure Synapse Analytics 管線整合 Apache Airflow 與 Azure Data Factory,以取得更整合的體驗。 AWSMWAA 是受控的 Airflow 解決方案。 |
AWS 數據管線 | Data Factory | AWS 資料管線和 Azure Data Factory 可讓您跨服務和位置移動和處理數據。 |
AWS 資料移轉服務 (DMS) | Azure 資料庫移轉服務 | 這些服務可協助您以最短停機時間將資料庫移轉至雲端。 主要差異在於,Azure 服務已針對無縫移轉至 Azure 資料庫進行優化,提供評量和建議工具,而 AWS DMS 則著重於 AWS 環境中的移轉。 AWS DMS 提供混合式架構的持續複寫功能。 |
Amazon AppFlow | Azure Logic 應用程式 | 這些服務可讓雲端應用程式和服務之間的自動化數據流,而不需要程序代碼。 Logic Apps 提供廣泛的整合功能與各種連接器和可視化設計工具。 AppFlow 著重於特定 SaaS 應用程式和 AWS 服務之間的安全數據傳輸,並提供內建的數據轉換功能。 |
AWS 步驟函式 | 使用 Logic Apps 的 Data Factory | 這些服務提供協調分散式應用程式和微服務的工作流程協調流程。 Step Functions 是專為在無伺服器應用程式中協調 AWS 服務和微服務而設計。 Logic Apps 同時用於數據整合和企業工作流程自動化。 |
資料倉儲
這些解決方案的設計目的是儲存和管理大量結構化數據,這些結構化數據已針對查詢和報告進行優化。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon Redshift | Azure Synapse Analytics | Amazon Redshift 和 Azure Synapse Analytics 是完全受控、PB 規模的數據倉儲服務,專為大規模數據分析和報告而設計。 主要差異在於 Azure Synapse Analytics 提供整合的分析平臺,結合數據倉儲和巨量數據處理,而 Redshift 主要著重於數據倉儲。 |
Amazon Redshift Spectrum | Azure Synapse Analytics 與 Data Lake 整合 | 這些服務可讓您跨數據倉儲和數據湖查詢數據,而不需要移動數據。 Azure Synapse Analytics 提供整合式 SQL 和 Spark 引擎。 Redshift Spectrum 會將 Redshift 的 SQL 查詢延伸至 Amazon S3 中的數據。 |
AWS Lake Formation | Azure Synapse Analytics 與 Azure Data Lake Storage | 這些服務可協助您建立安全的數據湖以進行分析。 Azure 結合 Azure Synapse Analytics 中的數據湖和數據倉儲功能。 AWS 為 Data Lake 和 Redshift 提供 Lake Formation 作為個別的數據倉儲服務。 |
Amazon RDS 與 Redshift 同盟查詢 | Azure SQL Database | 這些服務支援跨操作資料庫和數據倉儲進行查詢。 Azure Synapse Analytics 提供統一的內建分析體驗。 AWS 要求您結合 RDS 和 Redshift,以取得類似的跨服務查詢功能。 |
Amazon Aurora 與 Redshift 整合 | 適用於 Azure Cosmos DB 的 Azure Synapse Link | 這些服務會針對作業數據提供高效能分析。 AWS 會要求您設定極光與 Redshift 之間的數據管線。 使用 Azure Synapse Link 時,您不需要行動資料。 |
Data Lake 解決方案
這些平臺會以原生格式儲存大量的未經結構化和結構化數據,以供日後處理。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon S3 | Azure Data Lake 儲存體 | Amazon S3 和 Azure Data Lake Storage 是可調整的記憶體解決方案,可建置 Data Lake 來儲存和分析大量數據。 Data Lake Storage 提供階層式命名空間。 Amazon S3 使用平面結構。 |
AWS Lake Formation | Azure Synapse Analytics | AWS Lake Formation 和 Azure Synapse Analytics 可協助您設定、管理及保護 Data Lake 以進行分析。 主要差異在於,Azure Synapse Analytics 提供整合 Data Lake、數據倉儲和巨量數據分析的全方位分析服務,而 Lake Formation 則著重於使用強大的安全性和治理功能簡化 Data Lake 建立和管理。 |
Amazon Athena | Azure Synapse Analytics 無伺服器 SQL 集區 | 這些服務可讓您使用 SQL 查詢儲存在 Data Lake 中的數據,而不需要設定基礎結構。 Amazon Athena 是與其他 AWS 服務整合的獨立解決方案。 無伺服器 SQL 集區是 Azure Synapse Analytics 平臺的一部分。 |
AWS Glue 資料目錄 | Microsoft Purview | 這些服務提供集中式元數據存放庫,用於儲存和管理 Data Lake 的數據架構和元數據。 AWS Glue 提供 Purview 功能Microsoft子集。 Microsoft Purview 支援數據編錄、譜系追蹤和敏感數據分類,不論數據位於內部部署、雲端或 SaaS 應用程式中。 |
巨量資料分析
這些服務會處理和分析大型且複雜的數據集,以找出模式、見解和趨勢。 下表提供個別巨量數據服務的直接比較。 Microsoft Fabric 是巨量數據和分析的全方位服務。 它提供下列服務等等。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon EMR | Azure HDInsight | 這兩項服務都提供受控巨量數據架構,以處理儲存在 Data Lake 中的數據。 EMR 提供受控 Hadoop 和 Spark 架構。 HDInsight 是完全受控的企業解決方案,可支援Hadoop、Spark、Kafka和其他 開放原始碼 分析。 |
Amazon EMR | Azure Databricks | 這些服務可透過受控環境中的 Apache Spark 進行巨量數據處理。 EMR 可讓您使用彈性的設定和調整選項來執行 Apache Spark 叢集。 Azure Databricks 提供優化的 Apache Spark 平臺,其中包含共同作業筆記本和整合式工作流程。 |
Amazon Kinesis | Azure 事件中樞 和 Azure 串流分析 | 這些服務提供實時數據流和分析,以處理和分析大量數據串流。 |
AWS Glue 與 AWS Glue Studio | Azure Synapse Analytics 搭配 Apache Spark 集區 | 這兩項服務都提供具有整合式數據轉換和分析的巨量數據處理功能。 |
商業智慧和報告
這些服務提供數據視覺效果、報告和儀錶板,以協助企業做出明智的決策。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon QuickSight | Power BI | QuickSight 和 Power BI 為數據視覺效果和互動式儀錶板提供商務分析工具。 |
Amazon Managed Grafana | Azure 受控 Grafana | 這些服務提供受控 Grafana,可讓您將多個數據源的計量、記錄和追蹤可視化。 |
AWS 資料交換 | Azure Data Share | 這些服務可協助組織之間安全地共用和交換數據。 Data Exchange 提供市集模型。 Data Share 著重於跨租用戶數據共用。 |
Amazon OpenSearch Service with Kibana | 具有儀錶板的 Azure 數據 總管 | 這些服務提供大量數據的實時數據探索和互動式分析。 OpenSearch 會使用Kibana進行搜尋和視覺效果。 Azure 數據總管會使用 Kusto,其已針對快速數據擷取和查詢進行優化。 |
實時數據處理
這些系統會擷取和分析數據,因為它會產生以提供立即的深入解析和回應。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon Kinesis | Azure 事件中樞 和 Azure 串流分析 | 這些服務提供實時數據流和分析,以處理和分析大量數據串流。 Kinesis 提供整合式套件,可用於 AWS 內的數據流和分析。 Azure 會分隔擷取 (事件中樞) 和處理 (串流分析)。 |
適用於 Apache Kafka 的 Amazon 受控串流 (MSK) | Azure HDInsight 與 Apache Kafka | 這些服務提供受控 Apache Kafka 叢集,以建立即時串流數據管線和應用程式。 |
AWS Lambda | Azure Functions | 這些無伺服器計算平臺會執行程式碼來回應事件,並自動管理基礎計算資源。 |
Amazon DynamoDB 串流 | Azure Cosmos DB 變更摘要 | 這些服務藉由擷取並提供數據修改串流來啟用即時數據處理。 |
Amazon ElastiCache 與 Redis 串流 | 具有 Redis 數據流的 Azure Cache for Redis | 這些服務提供受控 Redis 實例,可支援 Redis 串流進行實時數據擷取和處理。 |
Amazon IoT 分析 | 使用 Azure 串流分析 Azure IoT 中樞 | 這些服務可讓您即時處理和分析來自IoT裝置的數據。 AWS IoT 分析提供內建的數據儲存和分析功能。 Azure 提供模組化服務:IoT 中樞 處理擷取,串流分析會處理數據。 |
機器學習服務
這些工具和平臺可讓您開發、定型和部署機器學習模型。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon SageMaker | Azure Machine Learning | 這些完整的平臺可讓您建置、定型及部署機器學習模型。 |
AWS 深度學習AMIS | Azure 資料科學虛擬機器 | 這些服務提供預先設定的虛擬機,這些虛擬機已針對機器學習和數據科學工作負載進行優化。 |
Amazon SageMaker Autopilot | 自動化機器學習 (AutoML) | 這些服務提供自動化機器學習服務來建置和定型模型。 |
Amazon SageMaker Studio | Azure Machine Learning studio | 這些服務提供機器學習的整合開發環境。 SageMaker Studio 為所有機器學習開發步驟提供統一介面,包括偵錯和分析工具。 |
AI 服務
AI 服務可為應用程式提供預先建置、可自定義的 AI 功能,包括視覺、語音、語言和決策制定。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon Rekognition | 使用 OCR 和 AI 的 Azure AI 視覺 | 這些服務提供影像和視訊分析功能,包括對象辨識和 con 帳篷模式 ration。 |
Amazon Polly | Azure AI 語音 (文字到語音轉換) | 您可以使用這些服務,將文字轉換成類似語音,讓應用程式能夠與自然聲音的用戶互動。 |
Amazon Transcribe | Azure AI 語音 | 這些服務會將口語轉換成文字,讓應用程式能夠轉譯音訊串流。 |
Amazon Translate | Azure AI 翻譯工具 | 這些服務提供機器翻譯功能,將文字從一種語言翻譯成另一種語言。 |
Amazon Comprehend | Azure AI 語言 | 這些服務會分析文字,以擷取情感、關鍵片語、實體和語言偵測等深入解析。 |
Amazon Lex | Azure AI Bot Service | 您可以使用這些服務來建立使用自然語言理解的對話介面和聊天機器人。 Azure 為 Bot 開發架構和語言理解提供個別服務,提供模組化方法。 Amazon Lex 提供整合式解決方案,可在 AWS 內建置交談介面。 |
Amazon Textract | Azure AI 文件智慧服務 | 這兩項服務都會使用機器學習,自動從掃描的檔和窗體擷取文字和數據。 Azure 會針對特定文件類型提供可自定義的模型,以啟用量身打造的數據擷取。 Textract 提供複雜數據結構的現用擷取。 |
Amazon OpenSearch Service | Azure AI 搜尋 (再生式搜尋) | OpenSearch 和 AI 搜尋提供強大的搜尋和分析功能。 您可以將它們用於常見的 AI 模式,例如擷取增強世代 (RAG)。 |
生成式 AI 服務
這些 AI 服務會建立類似人為產生輸出的新內容或數據,例如文字、影像或音訊。
AWS 服務 | Azure 服務 | 分析 |
---|---|---|
Amazon Bedrock | Azure OpenAI Service、 Azure AI Studio | Amazon Bedrock、Azure AI Studio 和 Azure OpenAI 服務提供建立和部署產生式 AI 應用程式的基礎模型。 |
參與者
本文由 Microsoft 維護。 原始投稿人如下。
主要作者:
- Regina Hackenberg |資深技術專家
其他投稿人:
- Adam Cerini |合作夥伴技術策略師董事
若要查看非公開的 LinkedIn 設定檔,請登入 LinkedIn。