Configurar o armazenamento de estado do RocksDB no Azure Databricks
Você pode habilitar o gerenciamento de estado baseado em RocksDB definindo a seguinte configuração no SparkSession antes de iniciar a consulta de streaming.
spark.conf.set(
"spark.sql.streaming.stateStore.providerClass",
"com.databricks.sql.streaming.state.RocksDBStateStoreProvider")
Você pode ativar RocksDB em pipelines Delta Live Tables. Consulte Optimize configuração do pipeline para processamento com manutenção de estado.
Ativar o ponto de verificação do registo de alterações
No Databricks Runtime 13.3 LTS e superior, você pode habilitar o ponto de verificação do changelog para reduzir a duração do ponto de verificação e a latência de ponta a ponta para cargas de trabalho do Structured Streaming. O Databricks recomenda ativar o ponto de verificação do registo de alterações para todas as consultas com monitorização de estado de Transmissão em Fluxo Estruturada.
Tradicionalmente, o RocksDB State Store faz snapshots e carrega arquivos de dados durante o checkpoint. Para evitar esse custo, o ponto de verificação do changelog grava apenas os registros que foram alterados desde o último ponto de verificação para armazenamento durável."
O ponto de verificação do changelog está desativado por padrão. Você pode habilitar o ponto de verificação do changelog no nível SparkSession usando a seguinte sintaxe:
spark.conf.set(
"spark.sql.streaming.stateStore.rocksdb.changelogCheckpointing.enabled", "true")
Você pode habilitar o ponto de verificação do changelog em um fluxo existente e manter as informações de estado armazenadas no ponto de verificação.
Importante
As consultas que habilitaram o ponto de verificação do changelog só podem ser executadas no Databricks Runtime 13.3 LTS e superior. Você pode desabilitar o ponto de verificação do changelog para reverter para o comportamento de ponto de verificação herdado, mas deve continuar a executar essas consultas no Databricks Runtime 13.3 LTS ou superior. Você deve reiniciar o trabalho para que essas alterações ocorram.
Métricas do armazenamento de estado do RocksDB
Cada operador de estado coleta métricas relacionadas às operações de gerenciamento de estado executadas em sua instância RocksDB para observar o armazenamento de estado e potencialmente ajudar na depuração da lentidão do trabalho. Essas métricas são agregadas (soma) por operador de estado na tarefa em todas as tarefas where que o operador de estado está a executar. Essas métricas fazem parte do customMetrics
mapa dentro dos stateOperators
campos em StreamingQueryProgress
. A seguir está um exemplo de StreamingQueryProgress
no formulário JSON (obtido usando StreamingQueryProgress.json()
).
{
"id" : "6774075e-8869-454b-ad51-513be86cfd43",
"runId" : "3d08104d-d1d4-4d1a-b21e-0b2e1fb871c5",
"batchId" : 7,
"stateOperators" : [ {
"numRowsTotal" : 20000000,
"numRowsUpdated" : 20000000,
"memoryUsedBytes" : 31005397,
"numRowsDroppedByWatermark" : 0,
"customMetrics" : {
"rocksdbBytesCopied" : 141037747,
"rocksdbCommitCheckpointLatency" : 2,
"rocksdbCommitCompactLatency" : 22061,
"rocksdbCommitFileSyncLatencyMs" : 1710,
"rocksdbCommitFlushLatency" : 19032,
"rocksdbCommitPauseLatency" : 0,
"rocksdbCommitWriteBatchLatency" : 56155,
"rocksdbFilesCopied" : 2,
"rocksdbFilesReused" : 0,
"rocksdbGetCount" : 40000000,
"rocksdbGetLatency" : 21834,
"rocksdbPutCount" : 1,
"rocksdbPutLatency" : 56155599000,
"rocksdbReadBlockCacheHitCount" : 1988,
"rocksdbReadBlockCacheMissCount" : 40341617,
"rocksdbSstFileSize" : 141037747,
"rocksdbTotalBytesReadByCompaction" : 336853375,
"rocksdbTotalBytesReadByGet" : 680000000,
"rocksdbTotalBytesReadThroughIterator" : 0,
"rocksdbTotalBytesWrittenByCompaction" : 141037747,
"rocksdbTotalBytesWrittenByPut" : 740000012,
"rocksdbTotalCompactionLatencyMs" : 21949695000,
"rocksdbWriterStallLatencyMs" : 0,
"rocksdbZipFileBytesUncompressed" : 7038
}
} ],
"sources" : [ {
} ],
"sink" : {
}
}
As descrições detalhadas das métricas são as seguintes:
Nome da métrica | Description |
---|---|
rocksdbCommitWriteBatchLatency | Tempo (em milis) levou para aplicar as gravações em estágios na estrutura na memória (WriteBatch) ao RocksDB nativo. |
rocksdbCommitFlushLatency | Tempo (em milis) necessário para liberar as alterações na memória do RocksDB para o disco local. |
rocksdbCommitCompactLatency | Tempo (em milis) levado para compactação (opcional) durante a confirmação do ponto de verificação. |
rocksdbCommitPauseLatency | Tempo (em milis) necessário para parar os threads de trabalho em segundo plano (para compactação, etc.) como parte da confirmação do ponto de verificação. |
rocksdbCommitCheckpointLatency | Tempo (em milis) levou para tirar um instantâneo do RocksDB nativo e gravá-lo em um diretório local. |
rocksdbCommitFileSyncLatencyMs | Tempo (em milis) necessário para sincronizar os arquivos nativos relacionados ao snapshot do RocksDB com um armazenamento externo (local do ponto de verificação). |
rocksdbGetLatency | Tempo médio (em nanos) levado por chamada nativa RocksDB::Get subjacente. |
rocksdbPutCount | Tempo médio (em nanos) levado por chamada nativa RocksDB::Put subjacente. |
rocksdbGetCount | Número de chamadas nativas RocksDB::Get (não inclui Gets de WriteBatch - no lote de memória usado para gravações de preparação). |
rocksdbPutCount | Número de chamadas nativas RocksDB::Put (não inclui Puts WriteBatch - no lote de memória usado para gravações de preparação). |
rocksdbTotalBytesReadByGet | Número de bytes não compactados lidos através de chamadas nativas RocksDB::Get . |
rocksdbTotalBytesWrittenByPut | Número de bytes não compactados gravados por meio de chamadas nativas RocksDB::Put . |
rocksdbReadBlockCacheHitCount | Número de vezes que o cache de bloco nativo do RocksDB é usado para evitar a leitura de dados do disco local. |
rocksdbReadBlockCacheMissCount | Número de vezes que o cache de bloco nativo do RocksDB perdeu e exigiu a leitura de dados do disco local. |
rocksdbTotalBytesReadByCompaction | Número de bytes lidos do disco local pelo processo de compactação nativo do RocksDB. |
rocksdbTotalBytesWrittenByCompaction | Número de bytes gravados no disco local pelo processo de compactação nativo do RocksDB. |
rocksdbTotalCompactionLatencyMs | Tempo (em milis) levado para compactações RocksDB (tanto o fundo quanto a compactação opcional iniciada durante a confirmação). |
rocksdbWriterStallLatencyMs | O tempo (em milis) do gravador estagnou devido a uma compactação de fundo ou lavagem dos memtables para o disco. |
rocksdbTotalBytesReadThroughIterator | Algumas das operações com monitoração de estado (como processamento de tempo limite ou flatMapGroupsWithState marca d'água em agregações em janela) exigem a leitura de dados inteiros no banco de dados por meio do iterador. O tamanho total dos dados não compactados lidos usando o iterador. |