Partilhar via


Dados e IA

Este artigo compara os principais dados do Azure e serviços de IA com os serviços correspondentes da Amazon Web Services (AWS).

Para comparar outros serviços da AWS e do Azure, consulte Azure para profissionais da AWS.

Governança, gerenciamento e plataformas de dados

Tanto o Microsoft Purview quanto a combinação de serviços da AWS descrita na tabela a seguir visam fornecer soluções abrangentes de governança de dados. Essas soluções permitem que as organizações gerenciem, descubram, classifiquem e forneçam segurança para seus ativos de dados de forma eficaz.

Serviço da Microsoft Serviços AWS Description
Microsoft Purview Catálogo de dados do AWS Glue, AWS Lake Formation, Amazon Macie, AWS Identity and Access Management (IAM), AWS Config Ambas as opções fornecem recursos robustos de governança, catalogação e conformidade de dados. O Microsoft Purview é uma solução unificada de governança de dados que permite que as organizações descubram, classifiquem e gerenciem dados em ambientes locais, multicloud e SaaS. Ele também fornece linhagem de dados e recursos de conformidade. A AWS oferece funcionalidades semelhantes com vários serviços: AWS Glue Data Catalog para gerenciamento de metadados, AWS Lake Formation para criação e governança de data lake, Amazon Macie para classificação e proteção de dados, AWS IAM para controle de acesso e AWS Config para gerenciamento de configuração e acompanhamento de conformidade.

Plataforma tudo-em-um versus serviços da AWS

O Microsoft Fabric fornece uma plataforma tudo-em-um que unifica os dados e os serviços de IA necessários para soluções de análise modernas. Ele simplifica o processo de movimentação de dados entre serviços, fornece governança e segurança unificadas e simplifica os modelos de preços. Essa abordagem unificada contrasta com a abordagem da AWS, na qual os serviços geralmente são usados separadamente e exigem mais esforço de integração. O Fabric fornece integração perfeita entre essas funções que podem ajudar sua organização a acelerar suas iniciativas orientadas por dados no ecossistema do Azure.

Tanto a AWS quanto o Fabric fornecem serviços para integração de dados, processamento, análises, aprendizado de máquina e business intelligence.

Serviços AWS Recursos de infraestrutura Description
AWS Glue, pipeline de dados da AWS Integração de dados com o Azure Data Factory A AWS fornece um conjunto de serviços individuais que podem ser combinados para criar soluções de dados e análises. Essa abordagem oferece flexibilidade, mas requer mais esforço para integrar os serviços em uma solução de ponta a ponta. O Fabric fornece esses recursos em uma única plataforma unificada para simplificar fluxos de trabalho, colaboração e gerenciamento.

Comparação detalhada dos serviços da AWS com os componentes do Fabric

Serviços AWS Recursos de infraestrutura
AWS Glue, pipeline de dados da AWS Integração de dados com o Data Factory
Sessões interativas do Amazon EMR e do AWS Glue Engenharia de dados com o Spark
Amazon Redshift Data warehousing com Synapse Data Warehouse
Amazon SageMaker Ciência de dados (integração do Azure Machine Learning)
Amazon Kinesis, Amazon Managed Service para Apache Flink Análise em tempo real (base de dados KQL)
Amazon QuickSight Power BI para business intelligence
Amazon S3 Armazenamento unificado de data lake OneLake
AWS Lake Formation, catálogo de dados do AWS Glue, Amazon Macie Governança de dados (integração com Microsoft Purview)
Amazon Bedrock, Amazon SageMaker JumpStart IA generativa (integração do Azure OpenAI Service)

Integração de dados e ferramentas ETL

As ferramentas de integração de dados e extrair, transformar, carregar (ETL) ajudam a extrair, transformar e carregar dados de várias fontes em um sistema unificado para análise.

Serviço do AWS Serviço do Azure Análise
AWS Glue Data Factory O AWS Glue e o Azure Data Factory são serviços de ETL totalmente gerenciados que facilitam a integração de dados entre várias fontes.
Fluxos de trabalho gerenciados da Amazon para o Apache Airflow (MWAA) Data Factory com pipelines do Azure Synapse Analytics O Apache Airflow fornece orquestração de fluxo de trabalho gerenciado para pipelines de dados complexos. Os pipelines do Azure Synapse Analytics integram o Apache Airflow com o Azure Data Factory para uma experiência mais integrada. O AWS MCHAA é uma solução gerenciada de fluxo de ar.
Pipeline de dados da AWS Data Factory O AWS Data Pipeline e o Azure Data Factory permitem a movimentação e o processamento de dados entre serviços e locais.
Serviço de migração de banco de dados da AWS (DMS) Azure Database Migration Service Esses serviços podem ajudá-lo a migrar bancos de dados para a nuvem com o mínimo de tempo de inatividade. A principal diferença é que o serviço do Azure é otimizado para migração contínua para bancos de dados do Azure, fornecendo ferramentas de avaliação e recomendação, enquanto o AWS DMS se concentra em migrações dentro do ambiente da AWS. O AWS DMS fornece recursos de replicação contínua para arquiteturas híbridas.
Amazon AppFlow Azure Logic Apps Esses serviços permitem fluxos de dados automatizados entre aplicativos e serviços em nuvem sem a necessidade de código. O Logic Apps fornece amplas capacidades de integração com uma vasta gama de conectores e um designer visual. O AppFlow se concentra na transferência segura de dados entre aplicativos SaaS específicos e serviços da AWS e fornece recursos integrados de transformação de dados.
Funções do AWS Step Data Factory com aplicativos lógicos Esses serviços fornecem orquestração de fluxo de trabalho para coordenar aplicativos distribuídos e microsserviços. O Step Functions foi projetado para orquestrar serviços e microsserviços da AWS em aplicativos sem servidor. Os Aplicativos Lógicos são usados para integração de dados e automação do fluxo de trabalho corporativo.

Armazenamento de dados

Essas soluções são projetadas para armazenar e gerenciar grandes volumes de dados estruturados otimizados para consultas e relatórios.

Serviço do AWS Serviço do Azure Análise
Amazon Redshift Azure Synapse Analytics O Amazon Redshift e o Azure Synapse Analytics são serviços de armazenamento de dados em escala de petabytes totalmente gerenciados, projetados para análises e relatórios de dados em grande escala. A principal diferença é que o Azure Synapse Analytics fornece uma plataforma de análise unificada que combina armazenamento de dados e processamento de big data, enquanto o Redshift se concentra principalmente no armazenamento de dados.
Espectro do Amazon Redshift Azure Synapse Analytics com integração com Data Lake Esses serviços permitem que você consulte dados em data warehouses e data lakes sem mover dados. O Azure Synapse Analytics fornece mecanismos SQL e Spark integrados. O Redshift Spectrum estende a consulta SQL do Redshift aos dados no Amazon S3.
Formação de lagos da AWS Azure Synapse Analytics com o Azure Data Lake Storage Esses serviços podem ajudá-lo a criar data lakes seguros para análises. O Azure combina funcionalidades de data lake e data warehouse no Azure Synapse Analytics. A AWS fornece o Lake Formation para data lakes e o Redshift como um serviço de data warehouse separado.
Amazon RDS com Redshift Federated Query Base de Dados SQL do Azure Esses serviços oferecem suporte à consulta entre bancos de dados operacionais e data warehouses. O Azure Synapse Analytics fornece uma experiência de análise unificada e integrada. A AWS exige que você combine o RDS e o Redshift para obter recursos semelhantes de consulta entre serviços.
Amazon Aurora com integração com Redshift Azure Synapse Link para o Azure Cosmos DB Esses serviços fornecem análises de alto desempenho sobre dados operacionais. A AWS exige que você configure pipelines de dados entre o Aurora e o Redshift. Com o Azure Synapse Link, você não precisa mover dados.

Soluções de data lake

Essas plataformas armazenam grandes quantidades de dados brutos, não estruturados e estruturados em seu formato nativo para processamento futuro.

Serviço do AWS Serviço do Azure Análise
Amazon S3 Azure Data Lake Storage O Amazon S3 e o Azure Data Lake Storage são soluções de armazenamento escaláveis para a criação de data lakes para armazenar e analisar grandes volumes de dados. O Armazenamento Data Lake fornece um namespace hierárquico. O Amazon S3 usa uma estrutura plana.
Formação de lagos da AWS Azure Synapse Analytics O AWS Lake Formation e o Azure Synapse Analytics podem ajudá-lo a configurar, gerenciar e proteger data lakes para análise. A principal diferença é que o Azure Synapse Analytics fornece um serviço de análise tudo-em-um que combina data lake, data warehouse e análise de big data, enquanto o Lake Formation se concentra em simplificar a criação e o gerenciamento de data lake com recursos robustos de segurança e governança.
Amazon Athena Pools SQL sem servidor do Azure Synapse Analytics Esses serviços permitem que você consulte dados armazenados em data lakes usando SQL, sem configurar a infraestrutura. O Amazon Athena é uma solução independente que se integra a outros serviços da AWS. Os pools SQL sem servidor fazem parte da plataforma Azure Synapse Analytics.
Catálogo de dados do AWS Glue Microsoft Purview Esses serviços fornecem um repositório centralizado de metadados para armazenar e gerenciar esquemas de dados e metadados para data lakes. O AWS Glue fornece um subconjunto dos recursos do Microsoft Purview. O Microsoft Purview oferece suporte à catalogação de dados, rastreamento de linhagem e classificação de dados confidenciais, quer os dados residam no local, em uma nuvem ou em um aplicativo SaaS.

Análise de macrodados

Esses serviços processam e analisam conjuntos de dados grandes e complexos para descobrir padrões, perceções e tendências. A tabela a seguir fornece comparações diretas de serviços individuais de big data. O Microsoft Fabric é um serviço tudo-em-um para big data e análises. Ele fornece os seguintes serviços e muito mais.

Serviço do AWS Serviço do Azure Análise
Amazon EMR Azure HDInsight Ambos os serviços fornecem estruturas gerenciadas de big data para processar dados armazenados em data lakes. O EMR fornece estruturas gerenciadas do Hadoop e do Spark. O HDInsight é uma solução empresarial totalmente gerenciada que suporta Hadoop, Spark, Kafka e outras análises de código aberto.
Amazon EMR Azure Databricks Esses serviços permitem o processamento de big data via Apache Spark em um ambiente gerenciado. O EMR permite executar clusters Apache Spark com opções flexíveis de configuração e escala. O Azure Databricks fornece uma plataforma Apache Spark otimizada com blocos de anotações colaborativos e fluxos de trabalho integrados.
Amazon Kinesis Hubs de Eventos do Azure e Azure Stream Analytics Esses serviços fornecem streaming e análise de dados em tempo real para processamento e análise de fluxos de dados de alto volume.
AWS Glue com o AWS Glue Studio Azure Synapse Analytics com pools do Apache Spark Ambos os serviços fornecem recursos de processamento de big data com transformação e análise de dados integradas.

Business intelligence e criação de relatórios

Esses serviços fornecem visualização de dados, relatórios e painéis para ajudar as empresas a tomar decisões informadas.

Serviço do AWS Serviço do Azure Análise
Amazon QuickSight Power BI O QuickSight e o Power BI fornecem ferramentas de análise de negócios para visualização de dados e painéis interativos.
Amazon Managed Grafana Azure Managed Grafana Esses serviços fornecem o Grafana gerenciado, que permite visualizar métricas, logs e rastreamentos em várias fontes de dados.
Intercâmbio de dados da AWS Compartilhamento de Dados do Azure Estes serviços facilitam a partilha e troca segura de dados entre organizações. O Data Exchange fornece um modelo de mercado. O Compartilhamento de Dados se concentra no compartilhamento de dados entre locatários.
Amazon OpenSearch Service com Kibana Azure Data Explorer com painéis Esses serviços fornecem exploração de dados em tempo real e análises interativas sobre grandes volumes de dados. O OpenSearch usa o Kibana para pesquisa e visualização. O Azure Data Explorer usa o Kusto, que é otimizado para ingestão e consulta rápidas de dados.

Processamento de dados em tempo real

Esses sistemas ingerem e analisam dados à medida que são gerados para fornecer insights e respostas imediatas.

Serviço do AWS Serviço do Azure Análise
Amazon Kinesis Hubs de Eventos do Azure e Azure Stream Analytics Esses serviços fornecem streaming e análise de dados em tempo real para processamento e análise de fluxos de dados de alto volume. O Kinesis fornece um pacote integrado para streaming e análise de dados na AWS. O Azure separa a ingestão (Hubs de Eventos) e o processamento (Stream Analytics).
Amazon Managed Streaming para Apache Kafka (MSK) Azure HDInsight com Apache Kafka Esses serviços fornecem clusters Apache Kafka gerenciados para criar pipelines de dados e aplicativos de streaming em tempo real.
AWS Lambda Funções do Azure Essas plataformas de computação sem servidor executam código em resposta a eventos e gerenciam automaticamente os recursos de computação subjacentes.
Amazon DynamoDB Streams Feed de alterações do Azure Cosmos DB Esses serviços permitem o processamento de dados em tempo real, capturando e fornecendo um fluxo de modificações de dados.
Amazon ElastiCache com fluxos Redis Cache do Azure para Redis com fluxos Redis Esses serviços fornecem instâncias Redis gerenciadas que suportam fluxos Redis para ingestão e processamento de dados em tempo real.
Análise do Amazon IoT Hub IoT do Azure com o Azure Stream Analytics Esses serviços permitem processar e analisar dados de dispositivos IoT em tempo real. O AWS IoT Analytics oferece recursos integrados de armazenamento e análise de dados. O Azure fornece serviços modulares: o Hub IoT lida com a ingestão e o Stream Analytics processa os dados.

Serviços de aprendizagem automática

Essas ferramentas e plataformas permitem o desenvolvimento, treinamento e implantação de modelos de aprendizado de máquina.

Serviço do AWS Serviço do Azure Análise
Amazon SageMaker Azure Machine Learning Essas plataformas abrangentes permitem que você crie, treine e implante modelos de aprendizado de máquina.
AWS Deep Learning AMIs Máquinas Virtuais de Ciência de Dados do Azure Esses serviços fornecem máquinas virtuais pré-configuradas que são otimizadas para cargas de trabalho de aprendizado de máquina e ciência de dados.
Piloto automático do Amazon SageMaker Aprendizado de máquina automatizado (AutoML) Esses serviços fornecem aprendizado de máquina automatizado para modelos de construção e treinamento.
Estúdio Amazon SageMaker Azure Machine Learning studio Esses serviços fornecem ambientes de desenvolvimento integrados para aprendizado de máquina. O SageMaker Studio fornece uma interface unificada para todas as etapas de desenvolvimento de aprendizado de máquina, incluindo ferramentas de depuração e criação de perfil.

Serviços de IA

Os serviços de IA fornecem recursos de IA pré-construídos e personalizáveis para aplicativos, incluindo visão, fala, linguagem e tomada de decisão.

Serviço do AWS Serviço do Azure Análise
Amazon Rekognition Azure AI Vision com OCR e IA Esses serviços fornecem recursos de análise de imagem e vídeo, incluindo reconhecimento de objetos e moderação de conteúdo.
Amazon Polly Azure AI Speech (conversão de texto em fala) Você pode usar esses serviços para converter texto em fala realista para permitir que os aplicativos interajam com os usuários com vozes de som natural.
Amazon Transcribe Azure AI Speech Esses serviços convertem a linguagem falada em texto, o que permite que os aplicativos transcrevam fluxos de áudio.
Amazon Tradutor Azure AI Translator Estes serviços fornecem capacidades de tradução automática para traduzir texto de uma língua para outra.
Amazon Comprehend Linguagem de IA do Azure Esses serviços analisam texto para extrair informações como sentimento, frases-chave, entidades e deteção de idioma.
Amazon Lex Serviço de Bot do Azure AI Você pode usar esses serviços para criar interfaces de conversação e chatbots que usam compreensão de linguagem natural. O Azure fornece uma abordagem modular com serviços separados para a estrutura de desenvolvimento de bots e compreensão de linguagem. O Amazon Lex fornece uma solução integrada para a criação de interfaces de conversação na AWS.
Amazon Textract Azure AI Document Intelligence Ambos os serviços extraem automaticamente texto e dados de documentos e formulários digitalizados usando aprendizado de máquina. O Azure fornece modelos personalizáveis para tipos de documentos específicos, o que permite a extração de dados personalizada. O Textract fornece extração pronta para uso de estruturas de dados complexas.
Serviço Amazon OpenSearch Azure AI Search (pesquisa generativa) O OpenSearch e o AI Search fornecem recursos poderosos de pesquisa e análise. Você pode usá-los para padrões comuns de IA, como geração aumentada de recuperação (RAG).

Serviços de IA generativa

Esses serviços de IA criam novos conteúdos ou dados que se assemelham à saída gerada por humanos, como texto, imagens ou áudio.

Serviço do AWS Serviços do Azure Análise
Substrato rochoso amazônico Azure OpenAI Service, Azure AI Studio O Amazon Bedrock, o Azure AI Studio e o Azure OpenAI Service fornecem modelos básicos para criar e implantar aplicativos de IA generativos.

Contribuidores

Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.

Autor principal:

Outros contribuidores:

  • Adam Cerini - Brasil | Diretor, Estrategista de Tecnologia de Parceiros

Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.

Próximos passos