Partilhar via


Fila de trabalhos no Apache Spark for Microsoft Fabric

Aplica-se a:✅ Engenharia de Dados e Ciência de Dados no Microsoft Fabric

O Microsoft Fabric oferece suporte ao enfileiramento de trabalhos em segundo plano quando você atinge os limites de computação do Spark para sua capacidade de malha. O sistema de fila de tarefas oferece repetições automáticas para trabalhos que são adicionados à fila até atingirem a expiração da fila. Quando os usuários criam uma capacidade do Microsoft Fabric no Azure, eles escolhem um tamanho de capacidade com base no tamanho de sua carga de trabalho de análise. Depois de comprar a capacidade, os administradores podem criar espaços de trabalho dentro da capacidade no Microsoft Fabric. Os trabalhos do Spark executados nesses espaços de trabalho podem usar até o máximo de núcleos alocados para uma determinada capacidade e, uma vez atingido o limite máximo, os trabalhos são limitados ou enfileirados.

Saiba mais sobre os limites de simultaneidade do Spark no Microsoft Fabric

A fila de trabalhos é suportada para trabalhos do Bloco de Anotações acionados por pipelines ou por meio do agendador, bem como para definições de trabalho do Spark. Não há suporte para enfileiramento para trabalhos de bloco de anotações interativos e trabalhos de bloco de anotações acionados por meio da API pública do bloco de anotações.

A fila opera de maneira FIFO (First-In-First-Out), onde os trabalhos são adicionados à fila com base no tempo de seu envio e são constantemente repetidos e começam a ser executados quando a capacidade é liberada.

Nota

Não há suporte para o enfileiramento de trabalhos do Spark quando a capacidade do Fabric está em seu estado limitado. Todos os novos trabalhos submetidos serão rejeitados.

Ilustração animada do processo de enfileiramento de trabalhos no Microsoft Fabric.

Depois que um trabalho é adicionado à fila, seu status é atualizado para Não iniciado no hub de monitoramento. Blocos de anotações e definições de trabalho do Spark quando são escolhidos na fila e começam a executar, seu status é atualizado de Não iniciado para Em andamento.

Nota

A expiração da fila é de 24 horas para todos os trabalhos a partir do momento em que foram admitidos na fila. Uma vez atingido o tempo de expiração, os trabalhos precisarão ser reenviados.

Tamanhos das filas

O Fabric Spark impõe tamanhos de fila com base no tamanho da SKU de capacidade anexada a um espaço de trabalho, fornecendo um mecanismo de limitação e enfileiramento onde os usuários podem enviar trabalhos com base nas SKUs de capacidade de malha adquiridas.

A seção a seguir lista vários tamanhos de fila para cargas de trabalho do Spark com base no Microsoft Fabric com base nas SKUs de capacidade:

Capacidade de malha SKU SKU equivalente do Power BI Limite de fila
F2 - 4
F4 - 4
F8 - 8
F16 - 16
F32 - 32
F64 P1 64
F128 P2 128
F256 P3 256
F512 P4 512
F1024 - 1024
F2048 - 2048
Capacidade de avaliação P1 ND

Nota

Não há suporte para filas para capacidades de avaliação do Fabric. Os usuários teriam que mudar para um Fabric F ou P SKU pago para usar a fila para trabalhos do Spark.

Depois que o limite máximo de fila for atingido para uma capacidade de malha, os novos trabalhos enviados serão limitados com uma mensagem de erro [TooManyRequestsForCapacity] Esse trabalho de faísca não pode ser executado porque você atingiu um limite de taxa de API ou computação de faísca. Para executar esse trabalho de faísca, cancele um trabalho ativo do Spark por meio do hub de monitoramento, escolha uma SKU de capacidade maior ou tente novamente mais tarde. Código de status HTTP: 430 {Saiba mais} Código de status HTTP: 430.