Implementar infraestruturas de dados de cuidados de saúde em soluções de dados de cuidados de saúde
As infraestruturas de dados de cuidados de saúde oferecem pipelines de dados prontos para execução concebidos para estruturar dados de forma eficiente para análise e modelação de IA/aprendizagem automática. Implemente a capacidade de infraestruturas de dados de cuidados de saúde primeiro antes de implementar qualquer outra capacidade de soluções de dados de cuidados de saúde.
Implementar infraestruturas de dados de cuidados de saúde
A capacidade de infraestruturas de dados de cuidados de saúde é implementada automaticamente através do assistente Configurar a sua solução na home page de soluções de dados de cuidados de saúde. A implementação desta capacidade é um passo obrigatório depois de implementar o seu ambiente de soluções de dados de cuidados de saúde. Para obter os passos detalhados, consulte Implementar infraestruturas de dados de cuidados de saúde.
Após a implementação, pode encontrar a capacidade listada na home page de soluções de dados de cuidados de saúde em Preparação de dados. Selecione a capacidade para explorar os artefactos implementados.
Artefactos
A tabela a seguir lista os detalhes do ambiente do Fabric, do pipeline de dados e dos blocos de notas implementados pela capacidade de infraestruturas de dados de cuidados de saúde. Para saber mais sobre os lakehouses implementados, consulte Design de lakehouse de medalhas.
Atenção
Os artefactos indicados a seguir são implementados com os valores pré-configurados necessários para soluções de dados de cuidados de saúde no Microsoft Fabric. Certifique-se de que não modifica nenhum dos valores de configuração para estes artefactos.
Artefacto | Type | Descrição |
---|---|---|
healthcare#_environment | Ambiente do Fabric | Pré-configura a versão runtime do Fabric necessária (Runtime 1.2 (Apache Spark 3.4 e Delta Lake 2.4)) e fornece as outras bibliotecas públicas e personalizadas exigidas pelas soluções de dados de cuidados de saúde no Microsoft Fabric. |
healthcare#_msft_config_notebook | Bloco de Notas | Ajuda a ler e preencher os valores de configuração global do lakehouse de administração. Os parâmetros deste bloco de notas são pré-configurados durante o processo de implementação. |
healthcare#_msft_bronze_silver_flatten | Bloco de Notas | Ajuda a simplificar o conjunto de dados clínicos da tabela ClinicalFhir no lakehouse de bronze para a respetiva tabela de recursos FHIR e outras tabelas no modelo de dados de cuidados de saúde do lakehouse de prata. Apenas os campos de nível primário são simplificados no lakehouse de prata. As estruturas hierárquicas aninhadas ou mais profundas dentro dos dados mantêm a respetiva estrutura original. Nota: não deve ter mais de uma instância deste bloco de notas em execução, pois isso causa resultados inconsistentes. |
healthcare#_msft_fhir_flattening_sample | Bloco de Notas | As extensões FHIR são elementos subordinados que representam mais informações sobre um elemento num recurso FHIR. Atualmente, estas extensões são suportadas como cadeias dentro do modelo de dados de cuidados de saúde no lakehouse de prata. Este bloco de notas fornece exemplos sobre como aceder a estes dados de extensão e utilizá-los num dataframe. |
healthcare#_msft_fhir_ndjson_bronze_ingestion | Bloco de Notas | Facilita a ingestão de dados FHIR NDSJON em tabelas delta dentro do lakehouse de bronze. Nota: não deve ter mais de uma instância deste bloco de notas em execução, pois isso causa resultados inconsistentes. |
healthcare#_msft_raw_process_movement | Bloco de Notas | Utiliza a biblioteca de soluções de dados de cuidados de saúde para extrair ficheiros ZIP e organizá-los para várias modalidades, que contêm vários espaços de nomes e extensões de ficheiro. O bloco de notas move os ficheiros com base na configuração fileOrchestrationConfig.json, que contém detalhes de mapeamento como modalidade, modality_format e extensão. Adiciona um prefixo de carimbo de data/hora aos nomes de ficheiros originais para garantir a singularidade dos ficheiros entre os vários sistemas de origem. |
healthcare#_msft_clinical_data_foundation_ingestion | Pipeline de dados | Orquestra a execução do bloco de notas/atividades necessários para a ingestão ponto a ponto de dados clínicos da estrutura unificada de pastas no lakehouse de bronze para o modelo de dados de cuidados de saúde no lakehouse de prata. |
Referências
- Como utilizar blocos de notas do Microsoft Fabric
- O que é um lakehouse no Microsoft Fabric?
- Ingerir dados para o seu Armazém com pipelines de dados
- Criar, configurar e utilizar um ambiente no Microsoft Fabric