Maio de 2021
Esses recursos e melhorias na plataforma Azure Databricks foram lançados em maio de 2021.
Nota
Os lançamentos são encenados. Sua conta do Azure Databricks pode não ser atualizada até uma semana ou mais após a data de lançamento inicial.
Databricks Mosaic AI: uma solução colaborativa e nativa de dados para o ciclo de vida completo do ML
27 de maio de 2021
A nova persona do Machine Learning, selecionável na barra lateral da interface do usuário do Azure Databricks, oferece acesso fácil a um novo ambiente criado especificamente para ML, incluindo o registro do modelo e quatro novos recursos na Visualização Pública:
- Uma nova página de painel com recursos convenientes, links recentes e de introdução.
- Uma nova página Experimentos que centraliza a descoberta e o gerenciamento de experimentos.
- AutoML, uma maneira de gerar automaticamente modelos de ML a partir de dados e acelerar o caminho para a produção.
- Feature Store, uma forma de catalogar recursos de ML e disponibilizá-los para treinamento e serviço, aumentando a reutilização. Com uma pesquisa de recursos baseada em linhagem de dados que aproveita fontes de dados registradas automaticamente, você pode disponibilizar recursos para treinamento e veiculação com implantação de modelo simplificada que não requer alterações no aplicativo cliente.
Para obter detalhes, consulte IA e aprendizado de máquina no Databricks.
SQL Analytics é renomeado para Databricks SQL
27 de maio de 2021
O SQL Analytics é renomeado para Databricks SQL. Para obter mais detalhes, consulte a nota de versão do Databricks SQL.
Criar e gerenciar pipelines ETL usando Delta Live Tables (Visualização pública)
26 de maio de 2021
A Databricks tem o prazer de apresentar o Delta Live Tables, um serviço de nuvem que torna o desenvolvimento de extração, transformação e carregamento (ETL) simples, confiável e escalável. Mesas Delta Live:
- Fornece uma interface declarativa intuitiva e familiar para criar pipelines.
- Permite monitorar pipelines de processamento de dados, visualizar dependências e gerenciar pipelines e dependências em diferentes ambientes.
- Permite o desenvolvimento orientado a testes, a imposição de restrições de qualidade de dados e a aplicação de políticas uniformes de tratamento de erros de dados
- Automatiza a implantação de seus pipelines de processamento de dados para que você possa facilmente atualizar, reverter e reprocessar dados incrementalmente.
Consulte O que é Delta Live Tables? para obter detalhes.
As VMs spot do Azure são GA
24 de maio de 2021
A capacidade de criar clusters do Azure Databricks com as Máquinas Virtuais do Azure Spot agora está disponível ao público em geral. Agora você pode obter o benefício de instâncias spot do Azure de custo significativamente mais baixo e reduzir o custo total de propriedade (TCO) do Azure Databricks. Você pode optar por usar instâncias spot do Azure quando:
- Use a interface do usuário para criar um cluster, marcando a caixa de seleção Instâncias spot.
- Use a API para criar um cluster, especificando o
azure_attributes
campo nos atributos de cluster da solicitação. - Use a interface do usuário para criar um pool de instâncias, selecionando a opção All Spot .
- Use a API para criar um pool de instâncias, especificando o
azure_attributes
campo na solicitação de criação de pool de instâncias.
Criptografar consultas SQL do Databricks e histórico de consultas usando sua própria chave (Visualização pública)
20 de maio de 2021
Para obter detalhes, consulte as notas de versão do Databricks SQL.
Aumento do limite para o número de clusters polivalentes terminados
18 de maio de 2021: Versão 3.46
Agora você pode ter até 150 clusters multiuso encerrados em um espaço de trabalho do Azure Databricks. Anteriormente, o limite era de 120. Para obter detalhes, consulte Encerrar uma computação. O limite do número de clusters multiuso encerrados retornados pela solicitação da API de Clusters agora também é de 150.
Aumento do limite para o número de clusters fixados
18 de maio de 2021: Versão 3.46
Agora você pode ter até 70 clusters fixados em um espaço de trabalho do Azure Databricks. Anteriormente, o limite era de 50. Para obter detalhes, consulte Fixar um cálculo
Gerenciar onde os resultados do bloco de anotações são armazenados (Visualização pública)
18 de maio de 2021: Versão 3.46
Agora você pode optar por armazenar todos os resultados do bloco de anotações em sua instância raiz do Armazenamento do Azure, independentemente do tamanho ou do tipo de execução. Por padrão, alguns resultados para blocos de anotações interativos são armazenados no Azure Databricks. Uma nova configuração permite armazená-los na instância raiz do Armazenamento do Azure em sua própria conta. Para obter detalhes, consulte Configurar local de armazenamento de resultados do bloco de anotações.
Esse recurso não tem impacto em blocos de anotações executados como trabalhos, cujos resultados são sempre armazenados na instância raiz do Armazenamento do Azure.
Criptografar notebook e dados secretos no plano de controle com sua própria chave (Visualização pública)
10 de maio de 2021
Um espaço de trabalho do Azure Databricks compreende um plano de controle hospedado em uma assinatura gerenciada pelo Azure Databricks e um plano de computação implantado em sua assinatura do Azure. O plano de controle armazena seus dados de serviços gerenciados, que incluem comandos do bloco de anotações, segredos e outros dados de configuração do espaço de trabalho. Por padrão, esses dados são criptografados com uma chave gerenciada pelo Azure Databricks, mas agora você pode adicionar uma chave da sua instância do Azure Key Vault para criptografar esses dados. Consulte Habilitar chaves gerenciadas pelo cliente para serviços gerenciados.
Termina o suporte da série Databricks Runtime 7.4
3 de maio de 2021
O suporte para Databricks Runtime 7.4, Databricks Runtime 7.4 para Machine Learning e Databricks Runtime 7.4 para Genomics terminou em 3 de maio. Consulte Ciclos de vida de suporte do Databricks.
Os usuários do repositório agora podem se integrar ao Azure DevOps usando tokens de acesso pessoal
3 a 10 de maio de 2021: Versão 3.45
Além dos tokens de acesso do Microsoft Entra ID, agora você pode usar um token de acesso pessoal para autenticar com o Azure DevOps. Para obter detalhes, consulte Configurar pastas Git do Databricks (Repos).