데이터 및 AI
이 문서에서는 핵심 Azure 데이터 및 AI 서비스를 해당 AWS(Amazon Web Services) 서비스와 비교합니다.
다른 AWS 및 Azure 서비스를 비교하려면 AWS 전문가를 위한 Azure을 참조하세요.
데이터 거버넌스, 관리 및 플랫폼
Microsoft Purview와 다음 표에 설명된 AWS 서비스의 조합은 모두 포괄적인 데이터 거버넌스 솔루션을 제공하는 것을 목표로 합니다. 이러한 솔루션을 통해 조직은 데이터 자산에 대한 보안을 효과적으로 관리, 검색, 분류 및 제공할 수 있습니다.
Microsoft Service | AWS 서비스 | 설명 |
---|---|---|
Microsoft Purview | AWS Glue 데이터 카탈로그, AWS Lake Formation, Amazon Macie, AWS ID 및 액세스 관리(IAM), AWS 구성 | 두 옵션 모두 강력한 데이터 거버넌스, 카탈로그 및 규정 준수 기능을 제공합니다. Microsoft Purview는 조직에서 온-프레미스, 다중 클라우드 및 SaaS 환경에서 데이터를 검색, 분류 및 관리할 수 있는 통합 데이터 거버넌스 솔루션입니다. 또한 데이터 계보 및 규정 준수 기능을 제공합니다. AWS는 메타데이터 관리를 위한 AWS Glue Data Catalog, 데이터 레이크 생성 및 거버넌스를 위한 AWS Lake Formation, 데이터 분류 및 보호를 위한 Amazon Macie, 액세스 제어를 위한 AWS IAM, 구성 관리 및 규정 준수 추적을 위한 AWS 구성 등 여러 서비스와 유사한 기능을 제공합니다. |
올인원 플랫폼과 AWS 서비스 비교
Microsoft Fabric은 최신 분석 솔루션에 필요한 데이터와 AI 서비스를 통합하는 올인원 플랫폼을 제공합니다. 서비스 간에 데이터를 이동하는 프로세스를 간소화하고, 통합 거버넌스 및 보안을 제공하며, 가격 책정 모델을 간소화합니다. 이 통합 접근 방식은 서비스가 별도로 사용되는 AWS 접근 방식과 대조를 이루며 통합에 더 많은 노력이 필요합니다. 패브릭은 조직이 Azure 에코시스템에서 데이터 기반 이니셔티브를 가속화하는 데 도움이 되는 이러한 함수 간에 원활한 통합을 제공합니다.
AWS와 Fabric은 데이터 통합, 처리, 분석, 기계 학습 및 비즈니스 인텔리전스를 위한 서비스를 제공합니다.
AWS 서비스 | Fabric | 설명 |
---|---|---|
AWS Glue, AWS 데이터 파이프라인 | Azure Data Factory와 데이터 통합 | AWS는 데이터 및 분석 솔루션을 빌드하기 위해 결합할 수 있는 개별 서비스 제품군을 제공합니다. 이 방법은 유연성을 제공하지만 서비스를 엔드 투 엔드 솔루션에 통합하는 데 더 많은 노력이 필요합니다. Fabric은 워크플로, 협업 및 관리를 간소화하기 위해 단일 통합 플랫폼 내에서 이러한 기능을 제공합니다. |
AWS 서비스와 패브릭 구성 요소의 자세한 비교
데이터 통합 및 ETL 도구
데이터 통합 및 ETL(추출, 변환, 로드) 도구를 사용하면 여러 원본의 데이터를 추출, 변환, 통합 시스템으로 로드하여 분석할 수 있습니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
AWS Glue | Data Factory | AWS Glue 및 Azure Data Factory는 다양한 원본 간에 데이터 통합을 용이하게 하는 완전히 관리되는 ETL 서비스입니다. |
MWAA(Amazon Managed Workflows for Apache Airflow) | Azure Synapse Analytics 파이프라인을 사용하는 Data Factory | Apache Airflow는 복잡한 데이터 파이프라인에 대한 관리되는 워크플로 오케스트레이션을 제공합니다. Azure Synapse Analytics 파이프라인은 보다 통합된 환경을 위해 Azure Data Factory와 Apache Airflow를 통합합니다. AWS MWAA는 관리되는 Airflow 솔루션입니다. |
AWS 데이터 파이프라인 | Data Factory | AWS Data Pipeline 및 Azure Data Factory를 사용하면 서비스 및 위치 간에 데이터를 이동하고 처리할 수 있습니다. |
AWS DMS(Database Migration Service) | Azure Database Migration Service | 이러한 서비스는 가동 중지 시간을 최소화하면서 데이터베이스를 클라우드로 마이그레이션하는 데 도움이 될 수 있습니다. 주요 차이점은 Azure 서비스가 Azure 데이터베이스로 원활하게 마이그레이션하도록 최적화되어 평가 및 권장 사항 도구를 제공하는 반면 AWS DMS는 AWS 환경 내의 마이그레이션에 중점을 둔다는 것입니다. AWS DMS는 하이브리드 아키텍처에 대한 지속적인 복제 기능을 제공합니다. |
Amazon AppFlow | Azure Logic Apps | 이러한 서비스를 사용하면 코드를 요구하지 않고 클라우드 애플리케이션과 서비스 간에 자동화된 데이터 흐름을 사용할 수 있습니다. Logic Apps는 광범위한 커넥터 및 비주얼 디자이너와 함께 광범위한 통합 기능을 제공합니다. AppFlow는 특정 SaaS 애플리케이션과 AWS 서비스 간의 보안 데이터 전송에 중점을 두고 기본 제공 데이터 변환 기능을 제공합니다. |
AWS 단계 함수 | Logic Apps를 사용하는 Data Factory | 이러한 서비스는 분산 애플리케이션 및 마이크로 서비스를 조정하기 위한 워크플로 오케스트레이션을 제공합니다. Step Functions는 서버리스 애플리케이션에서 AWS 서비스 및 마이크로 서비스를 오케스트레이션하도록 설계되었습니다. Logic Apps는 데이터 통합 및 엔터프라이즈 워크플로 자동화 모두에 사용됩니다. |
데이터 웨어하우징
이러한 솔루션은 쿼리 및 보고에 최적화된 많은 양의 구조화된 데이터를 저장하고 관리하도록 설계되었습니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
Amazon Redshift | Azure Synapse Analytics | Amazon Redshift 및 Azure Synapse Analytics는 대규모 데이터 분석 및 보고를 위해 설계된 완전히 관리되는 페타바이트 규모의 데이터 웨어하우징 서비스입니다. 주요 차이점은 Azure Synapse Analytics가 데이터 웨어하우징과 빅 데이터 처리를 결합하는 통합 분석 플랫폼을 제공하는 반면 Redshift는 주로 데이터 웨어하우징에 중점을 둔다는 것입니다. |
Amazon Redshift Spectrum | Data Lake 통합을 사용한 Azure Synapse Analytics | 이러한 서비스를 사용하면 데이터를 이동하지 않고도 데이터 웨어하우스 및 데이터 레이크에서 데이터를 쿼리할 수 있습니다. Azure Synapse Analytics는 통합 SQL 및 Spark 엔진을 제공합니다. Redshift Spectrum은 Redshift의 SQL 쿼리를 Amazon S3의 데이터로 확장합니다. |
AWS 레이크 형성 | Azure Data Lake Storage를 사용하는 Azure Synapse Analytics | 이러한 서비스는 분석을 위한 보안 데이터 레이크를 만드는 데 도움이 될 수 있습니다. Azure는 Azure Synapse Analytics에서 데이터 레이크 및 데이터 웨어하우스 기능을 결합합니다. AWS는 데이터 레이크 및 Redshift에 대한 Lake Formation을 별도의 데이터 웨어하우스 서비스로 제공합니다. |
Redshift 페더레이션 쿼리를 사용하는 Amazon RDS | Azure SQL Database | 이러한 서비스는 운영 데이터베이스 및 데이터 웨어하우스에서 쿼리를 지원합니다. Azure Synapse Analytics는 통합된 기본 제공 분석 환경을 제공합니다. AWS를 사용하려면 유사한 서비스 간 쿼리 기능을 위해 RDS와 Redshift를 결합해야 합니다. |
Redshift 통합을 통해 Amazon Aurora | Microsoft Azure Cosmos DB용 Azure Synapse Link | 이러한 서비스는 운영 데이터에 대한 고성능 분석을 제공합니다. AWS를 사용하려면 오로라와 Redshift 간에 데이터 파이프라인을 설정해야 합니다. Azure Synapse Link를 사용하면 데이터를 이동할 필요가 없습니다. |
데이터 레이크 솔루션
이러한 플랫폼은 향후 처리를 위해 원시 비정형 및 구조화된 데이터를 기본 형식으로 저장합니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
Amazon S3 | Azure Data Lake Storage | Amazon S3 및 Azure Data Lake Storage는 대량의 데이터를 저장하고 분석하기 위해 데이터 레이크를 빌드하기 위한 확장 가능한 스토리지 솔루션입니다. Data Lake Storage는 계층 구조 네임스페이스를 제공합니다. Amazon S3는 평면 구조를 사용합니다. |
AWS 레이크 형성 | Azure Synapse Analytics | AWS Lake Formation 및 Azure Synapse Analytics는 분석을 위해 데이터 레이크를 설정, 관리 및 보호하는 데 도움이 될 수 있습니다. 주요 차이점은 Azure Synapse Analytics가 데이터 레이크, 데이터 웨어하우스 및 빅 데이터 분석을 결합하는 올인원 분석 서비스를 제공하는 반면, Lake Formation은 강력한 보안 및 거버넌스 기능을 사용하여 데이터 레이크 만들기 및 관리를 간소화하는 데 중점을 두고 있다는 것입니다. |
Amazon Athena | Azure Synapse Analytics 서버리스 SQL 풀 | 이러한 서비스를 사용하면 인프라를 설정하지 않고 SQL을 사용하여 데이터 레이크에 저장된 데이터를 쿼리할 수 있습니다. Amazon Athena는 다른 AWS 서비스와 통합되는 독립 실행형 솔루션입니다. 서버리스 SQL 풀은 Azure Synapse Analytics 플랫폼의 일부입니다. |
AWS Glue 데이터 카탈로그 | Microsoft Purview | 이러한 서비스는 데이터 레이크에 대한 데이터 스키마 및 메타데이터를 저장하고 관리하기 위한 중앙 집중식 메타데이터 리포지토리를 제공합니다. AWS Glue는 Microsoft Purview 기능의 하위 집합을 제공합니다. Microsoft Purview는 데이터가 온-프레미스, 클라우드 또는 SaaS 애플리케이션에 있는지 여부에 관계없이 데이터 카탈로그, 계보 추적 및 중요한 데이터 분류를 지원합니다. |
빅 데이터 분석
이러한 서비스는 크고 복잡한 데이터 세트를 처리하고 분석하여 패턴, 인사이트 및 추세를 파악합니다. 다음 표에서는 개별 빅 데이터 서비스를 직접 비교합니다. Microsoft Fabric은 빅 데이터 및 분석을 위한 올인원 서비스입니다. 다음 서비스 등을 제공합니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
Amazon EMR | Azure HDInsight | 두 서비스 모두 데이터 레이크에 저장된 데이터를 처리하기 위한 관리형 빅 데이터 프레임워크를 제공합니다. EMR은 관리형 Hadoop 및 Spark 프레임워크를 제공합니다. HDInsight는 Hadoop, Spark, Kafka 및 기타 오픈 소스 분석을 지원하는 완전 관리형 엔터프라이즈 솔루션입니다. |
Amazon EMR | Azure Databricks | 이러한 서비스를 사용하면 관리되는 환경에서 Apache Spark를 통해 빅 데이터 처리를 수행할 수 있습니다. EMR을 사용하면 유연한 구성 및 크기 조정 옵션을 사용하여 Apache Spark 클러스터를 실행할 수 있습니다. Azure Databricks는 협업 Notebook 및 통합 워크플로가 있는 최적화된 Apache Spark 플랫폼을 제공합니다. |
Amazon Kinesis | Azure Event Hubs 및 Azure Stream Analytics | 이러한 서비스는 대용량 데이터 스트림을 처리하고 분석하기 위한 실시간 데이터 스트리밍 및 분석을 제공합니다. |
AWS Glue Studio를 사용하는 AWS Glue | Apache Spark 풀을 사용하는 Azure Synapse Analytics | 두 서비스 모두 통합 데이터 변환 및 분석을 통해 빅 데이터 처리 기능을 제공합니다. |
비즈니스 인텔리전스 및 보고
이러한 서비스는 데이터 시각화, 보고 및 대시보드를 제공하여 기업이 정보에 입각한 의사 결정을 내리는 데 도움이 됩니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
Amazon QuickSight | Power BI | QuickSight 및 Power BI는 데이터 시각화 및 대화형 대시보드를 위한 비즈니스 분석 도구를 제공합니다. |
Amazon Managed Grafana | Azure Managed Grafana | 이러한 서비스는 관리되는 Grafana를 제공하므로 여러 데이터 원본에서 메트릭, 로그 및 추적을 시각화할 수 있습니다. |
AWS 데이터 교환 | Azure Data Share | 이러한 서비스는 조직 간에 데이터를 안전하게 공유하고 교환할 수 있도록 지원합니다. Data Exchange는 마켓플레이스 모델을 제공합니다. 데이터 공유는 테넌트 간 데이터 공유에 중점을 둡니다. |
Kibana를 사용하는 Amazon OpenSearch 서비스 | 대시보드가 있는 Azure Data Explorer | 이러한 서비스는 대량의 데이터에 대한 실시간 데이터 탐색 및 대화형 분석을 제공합니다. OpenSearch는 검색 및 시각화에 Kibana를 사용합니다. Azure Data Explorer는 빠른 데이터 수집 및 쿼리에 최적화된 Kusto를 사용합니다. |
실시간 데이터 처리
이러한 시스템은 즉각적인 인사이트와 응답을 제공하기 위해 생성된 데이터를 수집하고 분석합니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
Amazon Kinesis | Azure Event Hubs 및 Azure Stream Analytics | 이러한 서비스는 대용량 데이터 스트림을 처리하고 분석하기 위한 실시간 데이터 스트리밍 및 분석을 제공합니다. Kinesis는 AWS 내에서 데이터 스트리밍 및 분석을 위한 통합 제품군을 제공합니다. Azure는 수집(Event Hubs) 및 처리(Stream Analytics)를 구분합니다. |
Apache Kafka(MSK)용 Amazon Managed Streaming | Apache Kafka를 사용하여 Azure HDInsight | 이러한 서비스는 실시간 스트리밍 데이터 파이프라인 및 애플리케이션을 만들기 위한 관리형 Apache Kafka 클러스터를 제공합니다. |
AWS Lambda | Azure Functions | 이러한 서버리스 컴퓨팅 플랫폼은 이벤트에 대한 응답으로 코드를 실행하고 기본 컴퓨팅 리소스를 자동으로 관리합니다. |
Amazon DynamoDB 스트림 | Azure Cosmos DB 변경 피드 | 이러한 서비스를 사용하면 데이터 수정 스트림을 캡처하고 제공하여 실시간 데이터 처리를 수행할 수 있습니다. |
Redis 스트림을 사용하는 Amazon ElastiCache | Redis 스트림을 사용하는 Azure Cache for Redis | 이러한 서비스는 실시간 데이터 수집 및 처리를 위해 Redis 스트림을 지원하는 관리형 Redis 인스턴스를 제공합니다. |
Amazon IoT Analytics | Azure Stream Analytics를 사용하는 Azure IoT Hub | 이러한 서비스를 사용하면 IoT 디바이스의 데이터를 실시간으로 처리하고 분석할 수 있습니다. AWS IoT Analytics는 기본 제공 데이터 스토리지 및 분석 기능을 제공합니다. Azure는 모듈식 서비스를 제공합니다. IoT Hub는 수집을 처리하고 Stream Analytics는 데이터를 처리합니다. |
Machine Learning Services
이러한 도구와 플랫폼을 통해 기계 학습 모델의 개발, 학습 및 배포를 수행할 수 있습니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
Amazon SageMaker | Azure Machine Learning | 이러한 포괄적인 플랫폼을 사용하면 기계 학습 모델을 빌드, 학습 및 배포할 수 있습니다. |
AWS 딥 러닝 API | Azure Data Science Virtual Machines | 이러한 서비스는 기계 학습 및 데이터 과학 워크로드에 최적화된 미리 구성된 가상 머신을 제공합니다. |
Amazon SageMaker Autopilot | AutoML(자동화된 기계 학습) | 이러한 서비스는 모델 빌드 및 학습을 위한 자동화된 기계 학습을 제공합니다. |
Amazon SageMaker Studio | Azure Machine Learning 스튜디오 | 이러한 서비스는 기계 학습을 위한 통합 개발 환경을 제공합니다. SageMaker Studio는 디버깅 및 프로파일링 도구를 포함하여 모든 기계 학습 개발 단계에 대한 통합 인터페이스를 제공합니다. |
AI 서비스
AI 서비스는 비전, 음성, 언어 및 의사 결정을 포함하여 미리 빌드된 사용자 지정 가능한 AI 기능을 애플리케이션에 제공합니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
Amazon Rekognition | OCR 및 AI를 사용하는 Azure AI Vision | 이러한 서비스는 개체 인식 및 con텐트 모드ration을 비롯한 이미지 및 비디오 분석 기능을 제공합니다. |
아마존 폴리 | Azure AI Speech(텍스트 음성 변환) | 이러한 서비스를 사용하여 텍스트를 실제 음성으로 변환하여 애플리케이션이 자연스러운 음성으로 사용자와 상호 작용할 수 있도록 할 수 있습니다. |
Amazon Transcribe | Azure AI Speech | 이러한 서비스는 음성 언어를 텍스트로 변환하여 애플리케이션이 오디오 스트림을 전사할 수 있도록 합니다. |
Amazon Translate | Azure AI 번역기 | 이러한 서비스는 텍스트를 한 언어에서 다른 언어로 번역하기 위한 기계 번역 기능을 제공합니다. |
Amazon Comprehend | Azure AI 언어 | 이러한 서비스는 텍스트를 분석하여 감정, 핵심 구, 엔터티 및 언어 감지와 같은 인사이트를 추출합니다. |
Amazon Lex | Azure AI Bot Service | 이러한 서비스를 사용하여 자연어 이해를 사용하는 대화형 인터페이스 및 챗봇을 만들 수 있습니다. Azure는 봇 개발 프레임워크 및 언어 이해를 위한 별도의 서비스를 사용하여 모듈식 접근 방식을 제공합니다. Amazon Lex는 AWS 내에서 대화형 인터페이스를 빌드하기 위한 통합 솔루션을 제공합니다. |
Amazon Textract | Azure AI 문서 인텔리전스 | 이러한 두 서비스는 기계 학습을 사용하여 스캔한 문서와 양식에서 텍스트와 데이터를 자동으로 추출합니다. Azure는 맞춤형 데이터 추출을 가능하게 하는 특정 문서 형식에 대해 사용자 지정 가능한 모델을 제공합니다. Textract는 복잡한 데이터 구조의 기본 추출을 제공합니다. |
Amazon OpenSearch 서비스 | Azure AI Search(생성 검색) | OpenSearch 및 AI Search는 강력한 검색 및 분석 기능을 제공합니다. RAG(검색 보강 생성)와 같은 일반적인 AI 패턴에 사용할 수 있습니다. |
생성형 AI 서비스
이러한 AI 서비스는 텍스트, 이미지 또는 오디오와 같이 사람이 생성한 출력과 유사한 새 콘텐츠 또는 데이터를 만듭니다.
AWS 서비스 | Azure 서비스 | 분석 |
---|---|---|
아마존 암반 | Azure OpenAI Service, Azure AI Studio | Amazon Bedrock, Azure AI Studio 및 Azure OpenAI Service는 생성 AI 애플리케이션을 만들고 배포하기 위한 기본 모델을 제공합니다. |
참가자
Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.
보안 주체 작성자:
- 레지나 하켄버그 | 선임 기술 전문가
기타 기여자:
- Adam Cerini | 파트너 기술 전략가 이사
비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.