Quando usar o Azure HDInsight
Você pode usar o HDInsight para processar Big Data em muitos cenários, usando dados históricos ou em tempo real; mas você deve fazer isso? O grande ponto forte do HDInsight é o amplo alcance de configurações oferecidas. Nesta unidade, você considerará se o HDInsight é a opção correta para sua organização. Você analisará os seguintes critérios para ajudar a decidir:
- Intervalo de cargas de trabalho
- Escalabilidade
- Tolerância a falhas
- Segurança
Critérios de decisão
Para determinar se o HDInsight pode atender às necessidades de Big Data da organização, use os critérios descritos na seguinte tabela:
Critérios | Análise |
---|---|
Intervalo de cargas de trabalho | Se você necessitar de suporte para várias cargas de trabalho, precisará de uma plataforma que possa dar suporte a esses requisitos. |
Escalabilidade | Sua organização precisa ser dimensionada para acomodar aumentos no volume de dados e na velocidade de dados? É importante escolher uma plataforma que possa ser dimensionada automaticamente e oferecer suporte ao dimensionamento de computação e armazenamento de forma independente. |
Tolerância a falhas | Se a sua análise de dados precisar continuar apesar da falha do componente, você precisará escolher uma plataforma tolerante a falhas. |
Segurança | A maioria das organizações espera que os dados com os quais elas trabalham estejam seguros em repouso e em trânsito. Também é importante que quase todas as organizações atendam aos padrões de conformidade do governo. |
Aplicar os critérios
Considere como sua organização deseja trabalhar com Big Data. Agora, aplique os critérios de decisão para determinar se o HDInsight é uma boa opção:
Intervalo das cargas de trabalho: o HDInsight permite que você dê suporte a uma ampla variedade de cargas de trabalho. Essas cargas de trabalho podem ser processamento de dados em lote, trabalho com os dados de streaming ou gerenciamento de data warehouses e/ou cargas de trabalho de ciência de dados. Esse recurso torna o HDInsight uma opção interessante, especialmente se o seu processo de negócios contém várias cargas de trabalho.
Escalabilidade: o HDInsight dá suporte a computação e armazenamento escalonáveis de maneira independente. Além disso, os nós de trabalho podem ser dimensionados automaticamente com base na carga de trabalho ou no agendamento.
Dica
Otimizações significativas de custo podem resultar da separação da computação e do armazenamento e da adição de um dimensionamento automático do cluster.
Tolerância a falhas: os nós principais do HDInsight são resilientes a falhas e apoiados por VMs tolerantes a falhas. Isso o torna um serviço altamente disponível que tem um SLA de 99,9%.
Segurança: A integração com o Microsoft Entra oferece segurança corporativa de autenticação e autorização. Esses recursos, em conjunto com o suporte à criptografia e rede virtual, dão um controle granular de quem pode acessar os dados.
Em resumo, considere usar o HDInsight quando desejar:
Reunir grandes quantidades de dados em escala e:
- Obter informações em tempo real.
- Processar os dados com custos otimizados, mínimo esforço e segurança forte.
Migrar:
- Uma distribuição do Hadoop empacotado pelo fornecedor de software livre no local para a nuvem com o mínimo de custo e esforço possível.
- Um serviço de Big Data de software livre de uma oferta de nuvem de concorrentes para o Azure.