O que se segue?
Saiba mais sobre os recursos e as alterações comportamentais nas próximas versões do Azure Databricks.
A partir de 21 de janeiro, o Databricks começará a permitir o gerenciamento de estatísticas para todas as contas com otimização preditiva habilitada. O gerenciamento de estatísticas expande a funcionalidade de otimização preditiva existente adicionando coleta de estatísticas na gravação e executando automaticamente comandos ANALYZE
para Unity Catalog gerenciado tables. Para obter mais informações sobre otimização preditiva, consulte Predictive optimization for Unity Catalog managed tables.
Alteração de comportamento quando as definições de conjunto de dados são removidas de um pipeline Delta Live Tables
Uma versão futura do Delta Live Tables mudará o comportamento quando uma visualização materializada ou streaming de table for removido de um pipeline. Com essa alteração, a visualização materializada removida ou a table de streaming não serão excluídas automaticamente quando o próximo pipeline update for executado. Em vez disso, vai poder usar o comando DROP MATERIALIZED VIEW
para eliminar uma exibição materializada ou o comando DROP TABLE
para eliminar uma tableem streaming. Depois de soltar um objeto, a execução de um pipeline update não recuperará o objeto automaticamente. Um novo objeto é criado se uma vista materializada ou uma transmissão table com a mesma definição for adicionada novamente ao pipeline. No entanto, você pode recuperar um objeto usando o comando UNDROP
.
O Azure Databricks está bloqueando o suporte para o uso de campos com o tipo de dados variante em comparações realizadas como parte dos seguintes operadores e cláusulas:
DISTINCT
INTERSECT
EXCEPT
UNION
DISTRIBUTE BY
O mesmo vale para essas funções DataFrame:
df.dropDuplicates()
df.repartition()
O Azure Databricks não oferece suporte a esses operadores e funções para comparações de tipos de dados variantes porque eles produzem resultados indefinidos.
Essas expressões serão bloqueadas ao usar tipos de variantes no Databricks Runtime 16.1 e superior. As versões de manutenção bloquearão o suporte no Databricks Runtime 15.3 e superior.
Se você usar o tipo VARIANT
em suas cargas de trabalho ou tablesdo Azure Databricks, execute as seguintes ações recomendadas:
- Encontre as consultas que usam a variante com qualquer um dos operadores listados.
- Update estas consultas usando padrões recomendados que explicitamente convertem values de variantes para tipos não-variantes.
O table a seguir tem exemplos de funcionalidade não intencional existente e soluções alternativas recomendadas:
Utilização não intencional | Utilização recomendada |
---|---|
SELECT distinct(variant_expr) FROM ... |
SELECT distinct(variant_expr?::string) FROM ... |
SELECT variant_expr FROM ... EXCEPT SELECT variant_expr FROM ... |
SELECT variant_expr?::string FROM ... EXCEPT SELECT variant_expr?::string FROM ... |
Nota
Para quaisquer campos que você planeja usar para comparação ou operações distintas, o Databricks recomenda extrair esses campos da variante column e armazená-los usando tipos não variantes.
Consulte Dados da variante de consulta. Entre em contato com seu representante de conta Databricks se precisar de suporte ou aconselhamento adicional.
Estamos a simplificar a barra lateral ao mesclar Partner Connect e Marketplace num único link Marketplace. O novo link do Marketplace estará mais acima na barra lateral.
Os blocos de anotações IPYNB se tornarão o formato de bloco de anotações padrão para o Azure Databricks
Atualmente, o Databricks cria todos os novos blocos de anotações no "formato de origem do Databricks" por padrão, que captura apenas o código. Em janeiro de 2025, o novo formato padrão de notebook será o IPYNB (.ipynb
), que também captura o ambiente do notebook, definições de visualização e widgets do notebook. Esse novo padrão pode ser alterado no painel Configurações Configurações do usuário do espaço de trabalho. Para obter mais detalhes sobre formatos de bloco de anotações, consulte Formatos de bloco de anotações.
Os arquivos de espaço de trabalho serão habilitados para todos os espaços de trabalho do Azure Databricks em 1º de fevereiro de 2025
O Databricks habilitará arquivos de espaço de trabalho para todos os espaços de trabalho Azure Databricks em 1º de fevereiro de 2025. Essa alteração impede que os usuários do espaço de trabalho usem novos recursos de arquivo do espaço de trabalho. Após 1 de fevereiro de 2025, não será possível desativar arquivos do espaço de trabalho usando a propriedade enableWorkspaceFilesystem
com a API REST do Azure Databricks para habilitar e desabilitar funcionalidades do espaço de trabalho. Para obter mais detalhes sobre arquivos de espaço de trabalho, consulte O que são arquivos de espaço de trabalho?.
O Databricks planeja alterar a configuração padrão para tables compartilhados usando o Compartilhamento Delta para incluir o histórico por padrão. Anteriormente, a partilha de histórico estava desativada por predefinição. A partilha da história de table melhora o desempenho de leitura e fornece suporte automático para otimizações avançadas do Delta.
Em 11 de novembro, o Databricks habilitará a otimização preditiva como padrão para todas as novas contas do Azure Databricks. Anteriormente, ele era desativado por padrão e podia ser ativado pelo administrador da sua conta. Quando a otimização preditiva está habilitada, o Azure Databricks executa automaticamente operações de manutenção para o Unity Catalog gerenciado tables. Para obter mais informações sobre otimização preditiva, consulte Predictive optimization for Unity Catalog managed tables.
Custo reduzido e mais controle sobre o desempenho versus custo para sua computação sem servidor para cargas de trabalho de fluxos de trabalho
Além das otimizações automáticas de desempenho atualmente suportadas, os aprimoramentos nos recursos de otimização de computação sem servidor para fluxos de trabalho lhe darão mais controle sobre se as cargas de trabalho são otimizadas para desempenho ou custo. Para saber mais, consulte Economia de custos na computação sem servidor para blocos de anotações, trabalhos e pipelines.
A Databricks recomenda o uso de painéis de IA/BI (anteriormente Lakeview dashboards). Versões anteriores de painéis, anteriormente conhecidos como painéis SQL Databricks, agora são chamados de painéis herdados. O Databricks não recomenda a criação de novos painéis herdados. Os painéis de IA/BI oferecem recursos aprimorados em comparação com a versão legada, incluindo criação assistida por IA, modos de rascunho e publicação e filtragem cruzada.
- 7 de abril de 2025: O suporte oficial para a versão herdada dos painéis terminará. Apenas os problemas críticos de segurança e as interrupções de serviço serão resolvidos.
- 3 de novembro de 2025: O Databricks começará a arquivar painéis herdados que não foram acessados nos últimos seis meses. Os painéis arquivados não estarão mais acessíveis e o processo de arquivamento ocorrerá continuamente. O acesso aos painéis usados ativamente permanecerá inalterado.
A Databricks trabalhará com os clientes para desenvolver planos de migração para painéis legados ativos após 3 de novembro de 2025.
Para ajudar na transição para painéis de IA/BI, as ferramentas de atualização estão disponíveis na interface do usuário e na API. Para obter instruções sobre como usar a ferramenta de migração integrada na interface do utilizador, consulte Clonar um painel herdado para um painel de IA/BI. Para tutoriais sobre como criar e gerenciar painéis usando a API REST em Usar APIs do Azure Databricks para gerenciar painéis.
Atualmente, o seu sistema de uso faturável table pode incluir registros de faturamento de SKU sem servidor com values nulo para run_as
, job_id
, job_run_id
e notebook_id
. Esses registros representam custos associados a recursos compartilhados que não são diretamente atribuíveis a qualquer carga de trabalho específica.
Para ajudar a simplificar os relatórios de custos, a Databricks em breve atribuirá esses custos compartilhados às cargas de trabalho específicas que os incorreram. Você não verá mais registros de faturamento com values nulo nos campos de carga de trabalho identifier. À medida que você aumenta o uso de computação sem servidor e adiciona mais cargas de trabalho, a proporção desses custos compartilhados em sua fatura diminuirá à medida que forem compartilhados em mais cargas de trabalho.
Para obter mais informações sobre como monitorar custos de computação sem servidor, consulte Monitorar o custo de computação sem servidor.
Devido a um bug, certos logs de auditoria de autorização e autenticação incluem um número de porta além do IP no sourceIPAddress
campo (por exemplo, "sourceIPAddress":"10.2.91.100:0"
). O número da porta, que é registrado como 0
, não fornece nenhum valor real e é inconsistente com o restante dos logs de auditoria do Databricks. Para melhorar a consistência dos logs de auditoria, o Databricks planeja alterar o formato do endereço IP para esses eventos de log de auditoria. Esta alteração será implementada gradualmente a partir do início de agosto de 2024.
Se o log de auditoria contiver um sourceIpAddress
de , o Databricks poderá parar de 0.0.0.0
registrá-lo.
Após 31 de janeiro de 2024, o Databricks removeintegrações legadas do notebook Git. Esse recurso está no status legado há mais de dois anos e um aviso de descontinuação foi exibido na interface do usuário do produto desde novembro de 2023.
Para obter detalhes sobre como migrar para pastas Git Databricks (anteriormente Repos) a partir da integração Git herdada, consulte Alternando para Databricks Repos a partir da integração Git herdada. Se essa remoção afetar você e você precisar de uma extensão, entre em contato com sua equipe de conta Databricks.
O Azure Databricks planeja remove suporte ao JDK 8 com a próxima versão principal do Databricks Runtime, quando o Spark 4.0 for lançado. O Azure Databricks planeja remove suporte ao JDK 11 com a próxima versão LTS do Databricks Runtime 14.x.
O Databricks começou a habilitar o Unity Catalog automaticamente para novos espaços de trabalho. Isso elimina a necessidade de os administradores de conta configurarem o Unity Catalog após a criação de um espaço de trabalho. A implementação está a decorrer gradualmente em todas as contas.
O Databricks Runtime planeja atualizar a versão sqlite-jdbc de 3.8.11.2 para 3.42.0.0 em todas as versões de manutenção do Databricks Runtime. As APIs da versão 3.42.0.0 não são totalmente compatíveis com a versão 3.8.11.2. Confirme seus métodos e tipo de retorno use a versão 3.42.0.0.
Se você estiver usando sqlite-jdbc em seu código, verifique o relatório de compatibilidade sqlite-jdbc.