Dados e IA
Este artigo compara os principais dados do Azure e serviços de IA com os serviços correspondentes da Amazon Web Services (AWS).
Para comparar outros serviços da AWS e do Azure, consulte Azure para profissionais da AWS.
Governança, gerenciamento e plataformas de dados
Tanto o Microsoft Purview quanto a combinação de serviços da AWS descrita na tabela a seguir visam fornecer soluções abrangentes de governança de dados. Essas soluções permitem que as organizações gerenciem, descubram, classifiquem e forneçam segurança para seus ativos de dados de forma eficaz.
Serviço da Microsoft | Serviços AWS | Description |
---|---|---|
Microsoft Purview | Catálogo de dados do AWS Glue, AWS Lake Formation, Amazon Macie, AWS Identity and Access Management (IAM), AWS Config | Ambas as opções fornecem recursos robustos de governança, catalogação e conformidade de dados. O Microsoft Purview é uma solução unificada de governança de dados que permite que as organizações descubram, classifiquem e gerenciem dados em ambientes locais, multicloud e SaaS. Ele também fornece linhagem de dados e recursos de conformidade. A AWS oferece funcionalidades semelhantes com vários serviços: AWS Glue Data Catalog para gerenciamento de metadados, AWS Lake Formation para criação e governança de data lake, Amazon Macie para classificação e proteção de dados, AWS IAM para controle de acesso e AWS Config para gerenciamento de configuração e acompanhamento de conformidade. |
Plataforma tudo-em-um versus serviços da AWS
O Microsoft Fabric fornece uma plataforma tudo-em-um que unifica os dados e os serviços de IA necessários para soluções de análise modernas. Ele simplifica o processo de movimentação de dados entre serviços, fornece governança e segurança unificadas e simplifica os modelos de preços. Essa abordagem unificada contrasta com a abordagem da AWS, na qual os serviços geralmente são usados separadamente e exigem mais esforço de integração. O Fabric fornece integração perfeita entre essas funções que podem ajudar sua organização a acelerar suas iniciativas orientadas por dados no ecossistema do Azure.
Tanto a AWS quanto o Fabric fornecem serviços para integração de dados, processamento, análises, aprendizado de máquina e business intelligence.
Serviços AWS | Recursos de infraestrutura | Description |
---|---|---|
AWS Glue, pipeline de dados da AWS | Integração de dados com o Azure Data Factory | A AWS fornece um conjunto de serviços individuais que podem ser combinados para criar soluções de dados e análises. Essa abordagem oferece flexibilidade, mas requer mais esforço para integrar os serviços em uma solução de ponta a ponta. O Fabric fornece esses recursos em uma única plataforma unificada para simplificar fluxos de trabalho, colaboração e gerenciamento. |
Comparação detalhada dos serviços da AWS com os componentes do Fabric
Integração de dados e ferramentas ETL
As ferramentas de integração de dados e extrair, transformar, carregar (ETL) ajudam a extrair, transformar e carregar dados de várias fontes em um sistema unificado para análise.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
AWS Glue | Data Factory | O AWS Glue e o Azure Data Factory são serviços de ETL totalmente gerenciados que facilitam a integração de dados entre várias fontes. |
Fluxos de trabalho gerenciados da Amazon para o Apache Airflow (MWAA) | Data Factory com pipelines do Azure Synapse Analytics | O Apache Airflow fornece orquestração de fluxo de trabalho gerenciado para pipelines de dados complexos. Os pipelines do Azure Synapse Analytics integram o Apache Airflow com o Azure Data Factory para uma experiência mais integrada. O AWS MCHAA é uma solução gerenciada de fluxo de ar. |
Pipeline de dados da AWS | Data Factory | O AWS Data Pipeline e o Azure Data Factory permitem a movimentação e o processamento de dados entre serviços e locais. |
Serviço de migração de banco de dados da AWS (DMS) | Azure Database Migration Service | Esses serviços podem ajudá-lo a migrar bancos de dados para a nuvem com o mínimo de tempo de inatividade. A principal diferença é que o serviço do Azure é otimizado para migração contínua para bancos de dados do Azure, fornecendo ferramentas de avaliação e recomendação, enquanto o AWS DMS se concentra em migrações dentro do ambiente da AWS. O AWS DMS fornece recursos de replicação contínua para arquiteturas híbridas. |
Amazon AppFlow | Azure Logic Apps | Esses serviços permitem fluxos de dados automatizados entre aplicativos e serviços em nuvem sem a necessidade de código. O Logic Apps fornece amplas capacidades de integração com uma vasta gama de conectores e um designer visual. O AppFlow se concentra na transferência segura de dados entre aplicativos SaaS específicos e serviços da AWS e fornece recursos integrados de transformação de dados. |
Funções do AWS Step | Data Factory com aplicativos lógicos | Esses serviços fornecem orquestração de fluxo de trabalho para coordenar aplicativos distribuídos e microsserviços. O Step Functions foi projetado para orquestrar serviços e microsserviços da AWS em aplicativos sem servidor. Os Aplicativos Lógicos são usados para integração de dados e automação do fluxo de trabalho corporativo. |
Armazenamento de dados
Essas soluções são projetadas para armazenar e gerenciar grandes volumes de dados estruturados otimizados para consultas e relatórios.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
Amazon Redshift | Azure Synapse Analytics | O Amazon Redshift e o Azure Synapse Analytics são serviços de armazenamento de dados em escala de petabytes totalmente gerenciados, projetados para análises e relatórios de dados em grande escala. A principal diferença é que o Azure Synapse Analytics fornece uma plataforma de análise unificada que combina armazenamento de dados e processamento de big data, enquanto o Redshift se concentra principalmente no armazenamento de dados. |
Espectro do Amazon Redshift | Azure Synapse Analytics com integração com Data Lake | Esses serviços permitem que você consulte dados em data warehouses e data lakes sem mover dados. O Azure Synapse Analytics fornece mecanismos SQL e Spark integrados. O Redshift Spectrum estende a consulta SQL do Redshift aos dados no Amazon S3. |
Formação de lagos da AWS | Azure Synapse Analytics com o Azure Data Lake Storage | Esses serviços podem ajudá-lo a criar data lakes seguros para análises. O Azure combina funcionalidades de data lake e data warehouse no Azure Synapse Analytics. A AWS fornece o Lake Formation para data lakes e o Redshift como um serviço de data warehouse separado. |
Amazon RDS com Redshift Federated Query | Base de Dados SQL do Azure | Esses serviços oferecem suporte à consulta entre bancos de dados operacionais e data warehouses. O Azure Synapse Analytics fornece uma experiência de análise unificada e integrada. A AWS exige que você combine o RDS e o Redshift para obter recursos semelhantes de consulta entre serviços. |
Amazon Aurora com integração com Redshift | Azure Synapse Link para o Azure Cosmos DB | Esses serviços fornecem análises de alto desempenho sobre dados operacionais. A AWS exige que você configure pipelines de dados entre o Aurora e o Redshift. Com o Azure Synapse Link, você não precisa mover dados. |
Soluções de data lake
Essas plataformas armazenam grandes quantidades de dados brutos, não estruturados e estruturados em seu formato nativo para processamento futuro.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
Amazon S3 | Azure Data Lake Storage | O Amazon S3 e o Azure Data Lake Storage são soluções de armazenamento escaláveis para a criação de data lakes para armazenar e analisar grandes volumes de dados. O Armazenamento Data Lake fornece um namespace hierárquico. O Amazon S3 usa uma estrutura plana. |
Formação de lagos da AWS | Azure Synapse Analytics | O AWS Lake Formation e o Azure Synapse Analytics podem ajudá-lo a configurar, gerenciar e proteger data lakes para análise. A principal diferença é que o Azure Synapse Analytics fornece um serviço de análise tudo-em-um que combina data lake, data warehouse e análise de big data, enquanto o Lake Formation se concentra em simplificar a criação e o gerenciamento de data lake com recursos robustos de segurança e governança. |
Amazon Athena | Pools SQL sem servidor do Azure Synapse Analytics | Esses serviços permitem que você consulte dados armazenados em data lakes usando SQL, sem configurar a infraestrutura. O Amazon Athena é uma solução independente que se integra a outros serviços da AWS. Os pools SQL sem servidor fazem parte da plataforma Azure Synapse Analytics. |
Catálogo de dados do AWS Glue | Microsoft Purview | Esses serviços fornecem um repositório centralizado de metadados para armazenar e gerenciar esquemas de dados e metadados para data lakes. O AWS Glue fornece um subconjunto dos recursos do Microsoft Purview. O Microsoft Purview oferece suporte à catalogação de dados, rastreamento de linhagem e classificação de dados confidenciais, quer os dados residam no local, em uma nuvem ou em um aplicativo SaaS. |
Análise de macrodados
Esses serviços processam e analisam conjuntos de dados grandes e complexos para descobrir padrões, perceções e tendências. A tabela a seguir fornece comparações diretas de serviços individuais de big data. O Microsoft Fabric é um serviço tudo-em-um para big data e análises. Ele fornece os seguintes serviços e muito mais.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
Amazon EMR | Azure HDInsight | Ambos os serviços fornecem estruturas gerenciadas de big data para processar dados armazenados em data lakes. O EMR fornece estruturas gerenciadas do Hadoop e do Spark. O HDInsight é uma solução empresarial totalmente gerenciada que suporta Hadoop, Spark, Kafka e outras análises de código aberto. |
Amazon EMR | Azure Databricks | Esses serviços permitem o processamento de big data via Apache Spark em um ambiente gerenciado. O EMR permite executar clusters Apache Spark com opções flexíveis de configuração e escala. O Azure Databricks fornece uma plataforma Apache Spark otimizada com blocos de anotações colaborativos e fluxos de trabalho integrados. |
Amazon Kinesis | Hubs de Eventos do Azure e Azure Stream Analytics | Esses serviços fornecem streaming e análise de dados em tempo real para processamento e análise de fluxos de dados de alto volume. |
AWS Glue com o AWS Glue Studio | Azure Synapse Analytics com pools do Apache Spark | Ambos os serviços fornecem recursos de processamento de big data com transformação e análise de dados integradas. |
Business intelligence e criação de relatórios
Esses serviços fornecem visualização de dados, relatórios e painéis para ajudar as empresas a tomar decisões informadas.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
Amazon QuickSight | Power BI | O QuickSight e o Power BI fornecem ferramentas de análise de negócios para visualização de dados e painéis interativos. |
Amazon Managed Grafana | Azure Managed Grafana | Esses serviços fornecem o Grafana gerenciado, que permite visualizar métricas, logs e rastreamentos em várias fontes de dados. |
Intercâmbio de dados da AWS | Compartilhamento de Dados do Azure | Estes serviços facilitam a partilha e troca segura de dados entre organizações. O Data Exchange fornece um modelo de mercado. O Compartilhamento de Dados se concentra no compartilhamento de dados entre locatários. |
Amazon OpenSearch Service com Kibana | Azure Data Explorer com painéis | Esses serviços fornecem exploração de dados em tempo real e análises interativas sobre grandes volumes de dados. O OpenSearch usa o Kibana para pesquisa e visualização. O Azure Data Explorer usa o Kusto, que é otimizado para ingestão e consulta rápidas de dados. |
Processamento de dados em tempo real
Esses sistemas ingerem e analisam dados à medida que são gerados para fornecer insights e respostas imediatas.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
Amazon Kinesis | Hubs de Eventos do Azure e Azure Stream Analytics | Esses serviços fornecem streaming e análise de dados em tempo real para processamento e análise de fluxos de dados de alto volume. O Kinesis fornece um pacote integrado para streaming e análise de dados na AWS. O Azure separa a ingestão (Hubs de Eventos) e o processamento (Stream Analytics). |
Amazon Managed Streaming para Apache Kafka (MSK) | Azure HDInsight com Apache Kafka | Esses serviços fornecem clusters Apache Kafka gerenciados para criar pipelines de dados e aplicativos de streaming em tempo real. |
AWS Lambda | Funções do Azure | Essas plataformas de computação sem servidor executam código em resposta a eventos e gerenciam automaticamente os recursos de computação subjacentes. |
Amazon DynamoDB Streams | Feed de alterações do Azure Cosmos DB | Esses serviços permitem o processamento de dados em tempo real, capturando e fornecendo um fluxo de modificações de dados. |
Amazon ElastiCache com fluxos Redis | Cache do Azure para Redis com fluxos Redis | Esses serviços fornecem instâncias Redis gerenciadas que suportam fluxos Redis para ingestão e processamento de dados em tempo real. |
Análise do Amazon IoT | Hub IoT do Azure com o Azure Stream Analytics | Esses serviços permitem processar e analisar dados de dispositivos IoT em tempo real. O AWS IoT Analytics oferece recursos integrados de armazenamento e análise de dados. O Azure fornece serviços modulares: o Hub IoT lida com a ingestão e o Stream Analytics processa os dados. |
Serviços de aprendizagem automática
Essas ferramentas e plataformas permitem o desenvolvimento, treinamento e implantação de modelos de aprendizado de máquina.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
Amazon SageMaker | Azure Machine Learning | Essas plataformas abrangentes permitem que você crie, treine e implante modelos de aprendizado de máquina. |
AWS Deep Learning AMIs | Máquinas Virtuais de Ciência de Dados do Azure | Esses serviços fornecem máquinas virtuais pré-configuradas que são otimizadas para cargas de trabalho de aprendizado de máquina e ciência de dados. |
Piloto automático do Amazon SageMaker | Aprendizado de máquina automatizado (AutoML) | Esses serviços fornecem aprendizado de máquina automatizado para modelos de construção e treinamento. |
Estúdio Amazon SageMaker | Azure Machine Learning studio | Esses serviços fornecem ambientes de desenvolvimento integrados para aprendizado de máquina. O SageMaker Studio fornece uma interface unificada para todas as etapas de desenvolvimento de aprendizado de máquina, incluindo ferramentas de depuração e criação de perfil. |
Serviços de IA
Os serviços de IA fornecem recursos de IA pré-construídos e personalizáveis para aplicativos, incluindo visão, fala, linguagem e tomada de decisão.
Serviço do AWS | Serviço do Azure | Análise |
---|---|---|
Amazon Rekognition | Azure AI Vision com OCR e IA | Esses serviços fornecem recursos de análise de imagem e vídeo, incluindo reconhecimento de objetos e moderação de conteúdo. |
Amazon Polly | Azure AI Speech (conversão de texto em fala) | Você pode usar esses serviços para converter texto em fala realista para permitir que os aplicativos interajam com os usuários com vozes de som natural. |
Amazon Transcribe | Azure AI Speech | Esses serviços convertem a linguagem falada em texto, o que permite que os aplicativos transcrevam fluxos de áudio. |
Amazon Tradutor | Azure AI Translator | Estes serviços fornecem capacidades de tradução automática para traduzir texto de uma língua para outra. |
Amazon Comprehend | Linguagem de IA do Azure | Esses serviços analisam texto para extrair informações como sentimento, frases-chave, entidades e deteção de idioma. |
Amazon Lex | Serviço de Bot do Azure AI | Você pode usar esses serviços para criar interfaces de conversação e chatbots que usam compreensão de linguagem natural. O Azure fornece uma abordagem modular com serviços separados para a estrutura de desenvolvimento de bots e compreensão de linguagem. O Amazon Lex fornece uma solução integrada para a criação de interfaces de conversação na AWS. |
Amazon Textract | Azure AI Document Intelligence | Ambos os serviços extraem automaticamente texto e dados de documentos e formulários digitalizados usando aprendizado de máquina. O Azure fornece modelos personalizáveis para tipos de documentos específicos, o que permite a extração de dados personalizada. O Textract fornece extração pronta para uso de estruturas de dados complexas. |
Serviço Amazon OpenSearch | Azure AI Search (pesquisa generativa) | O OpenSearch e o AI Search fornecem recursos poderosos de pesquisa e análise. Você pode usá-los para padrões comuns de IA, como geração aumentada de recuperação (RAG). |
Serviços de IA generativa
Esses serviços de IA criam novos conteúdos ou dados que se assemelham à saída gerada por humanos, como texto, imagens ou áudio.
Serviço do AWS | Serviços do Azure | Análise |
---|---|---|
Substrato rochoso amazônico | Azure OpenAI Service, Azure AI Studio | O Amazon Bedrock, o Azure AI Studio e o Azure OpenAI Service fornecem modelos básicos para criar e implantar aplicativos de IA generativos. |
Contribuidores
Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.
Autor principal:
- Regina Hackenberg - Brasil | Especialista Técnico Sénior
Outros contribuidores:
- Adam Cerini - Brasil | Diretor, Estrategista de Tecnologia de Parceiros
Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.