Implantar e configurar Transformações OMOP nas soluções de dados de serviços de saúde
Observação
Esse conteúdo está sendo atualizado no momento.
As transformações OMOP permitem a preparação de dados para análises padronizadas por meio dos padrões abertos OMOP (Observational Medical Outcomes Partnership) da comunidade. Você pode usar esse recurso depois de implantar soluções de dados de serviços de saúde e o recurso Bases de dados de serviços de saúde em seu espaço de trabalho do Fabric.
Transformações OMOP são um recurso opcional em soluções de dados de serviços de saúde no Microsoft Fabric. Você tem a flexibilidade de decidir se deseja usá-lo ou não, dependendo de suas necessidades ou cenários específicos.
Pré-requisitos
- Implantar soluções de dados de serviços de saúde no Microsoft Fabric.
- Instale os notebooks e pipelines fundamentais em Implantar Bases de dados de serviços de saúde.
Implantar transformações OMOP
Você pode implantar o recurso usando o módulo de configuração explicado em Soluções de dados de serviços de saúde: implantar Bases de dados de serviços de saúde. No entanto, a etapa de seleção de dados de exemplo neste módulo não implanta dados de exemplo para esse recurso. Os dados de exemplo de Transformações OMOP são instalados exclusivamente em seu ambiente de soluções de dados de serviços de saúde depois que você conclui a implantação do recurso.
Se você não usou o módulo de configuração para implantar o recurso e deseja usar o bloco de recursos, siga estas etapas:
Acesse a home page de soluções de dados de serviços de saúde no Fabric.
Selecione o bloco Transformações OMOP.
Na página do recurso, selecione Implantar no espaço de trabalho.
A implantação pode levar alguns minutos para ser concluída. Não feche a guia ou o navegador enquanto a implantação estiver em andamento. Enquanto espera, você pode trabalhar em outra guia.
Após a conclusão da implantação, você poderá ver uma notificação na barra de mensagens.
Selecione Gerenciar recurso na barra de mensagens para acessar a página Gerenciamento do recurso.
Aqui, você pode exibir, configurar e gerenciar os artefatos implantados com o recurso.
Artefatos
O recurso instala os seguintes artefatos em seu ambiente de soluções de dados de serviços de saúde:
Artefato | Tipo |
---|---|
healthcare#_msft_gold_omop | Lakehouse |
healthcare#_msft_omop_silver_gold_transformation | Notebook |
healthcare#_msft_omop_drug_exposure_era_sample | Notebook |
healthcare#_msft_omop_drug_exposure_insights_sample | Notebook |
healthcare#_msft_omop_analytics | Pipeline de dados |
healthcare#_msft_omop_semantic_model | Modelo semântico |
Vocab-HDS | Dados de exemplo |
Revise o notebook OMOP prata
O notebook healthcare#_msft_omop_silver_gold_transformation usa as APIs OMOP fornecidas como parte da biblioteca de soluções de dados de serviços de saúde para a transformação de dados. O notebook transforma recursos no lakehouse healthcare#_msft_silver em OMOP Common Data Model. Os dados transformados são então inseridos no lakehouse OMOP.
O notebook é implantado com valores pré-configurados necessários para executar o pipeline de dados de transformações OMOP. Alguns parâmetros de configuração herdam da configuração global e podem ser substituídos no nível do notebook. Por padrão, você não precisa fazer alterações nos arquivos de configuração do notebook. Se necessário, você poderá revisar ou modificar a configuração selecionando os respectivos notebooks e arquivos de configuração em seu ambiente.
Para saber mais sobre a execução do notebook, consulte Usar transformações OMOP.
Revisar o modelo semântico OMOP
O modelo semântico OMOP, healthcare#_msft_omop_semantic_model, é um modelo semântico personalizado baseado no lakehouse ouro OMOP. Ele inclui algumas relacionamentos importantes OMOP CDM versão 5.4 entre as seguintes tabelas OMOP:
- Localização
- Pessoa
- Observação
- Procedure_Occurrence
- Condition_Occurrence
- Observação
- Drug_Exposure
- Visit_Ocurrence
- Image_Occurrence
- Medida
Esses relacionamentos formam o conjunto mínimo necessário para gerar relatórios do Power BI no recurso Descobrir e criar coortes (versão preliminar) nas soluções de dados de serviços de saúde. Você pode usar esse modelo semântico como uma base, adicionando mais tabelas OMOP e relacionamentos no lakehouse OMOP para criar relatórios personalizados do Power BI a partir de seus dados do lakehouse OMOP padrão.
Configurar o notebook de exemplo da era da exposição a medicamentos
O notebook de exemplo healthcare#_msft_omop_drug_exposure_era_sample mostra como gerar os registros da tabela drug_era em OMOP usando a linguagem PySpark (Python) em um notebook do Azure Synapse Analytics, principalmente para fins exploratórios. A geração de registros da tabela drug_era segue o script de exemplo do período de medicamentos da OHDSI, que é adaptado para trabalhar com o PySpark no Azure Synapse Analytics. O código gerador do período de medicamentos está incluído na biblioteca Python personalizada, que é empacotada como um arquivo wheel (WHL) e carregada em um pool do Apache Spark para fácil acesso.
Antes de executar o notebook, lembre-se dos seguintes pré-requisitos:
Verifique se o banco de dados OMOP tem dados válidos nas tabelas a seguir:
- drug_exposure
- conceito
- concept_ancestor
Você pode gerar esses dados usando os dados de exemplo ou seus próprios dados executando o pipeline FHIR para dados OMOP.
Verifique se o pacote wheel da biblioteca personalizada está anexado ao pool do Spark que você usa para executar esse notebook.
O principal parâmetro de configuração para esse notebook é o omop_database_name
. Esse parâmetro identifica o nome do banco de dados OMOP que contém os dados para gerar a tabela drug_era. Atualize esse valor somente se o banco de dados OMOP for diferente do valor padrão no arquivo de configuração global.
Se a tabela OMOP drug_exposure for preenchida com dados válidos, esse notebook invocará o módulo DrugEraGenerator que agrupa os períodos de tempo em que uma pessoa é exposta a um ingrediente ativo do medicamento, permitindo um intervalo de 30 dias. O módulo DrugEraGenerator exclui todos os registros existentes de drug_era e gera novos registros, com base nos dados OMOP mais recentes.
Para saber mais sobre a execução do notebook, consulte Usar notebooks de exemplo de transformações OMOP.
Configurar o notebook de exemplo da insights da exposição a medicamentos
O notebook de exemplo healthcare#_msft_omop_drug_exposure_insights_sample demonstra uma análise exploratória na tabela drug_era usando PySpark em um notebook do Azure Synapse Analytics. A análise gera um histograma mostrando as exposições secundárias dos pacientes a princípios ativos, estratificadas por sexo e idade para um ano específico. A tabela drug_era é gerada usando uma biblioteca personalizada DrugEraGenerator que o notebook anterior healthcare#_msft_omop_drug_exposure_era_sample invoca. Esta análise estende a consulta de exposição ao medicamento DEX03: distribuição de idade, estratificada por medicamento, incorporando a estratificação baseada em sexo e idade.
Antes de executar o notebook, lembre-se dos seguintes pré-requisitos:
- Se você deseja editar a configuração do notebook, certifique-se de fazer uma cópia desse notebook. Não atualize o notebook diretamente.
- Verifique se a tabela drug_era contém dados executando o notebook da era da exposição a medicamentos. A execução desse notebook substitui todos os registros de drug_era existentes por novos, com base nos dados OMOP mais recentes.
- Use esse notebook no estado em que se encontra para a análise exploratória e crie uma cópia para executar a análise personalizada.
Veja a seguir os principais parâmetros de configuração do notebook. Você pode modificar esses parâmetros para uma análise exploratória alternativa sobre exposições de pacientes a medicamentos:
primary_drug_concept_id
: a exposição ao princípio ativo primário para os pacientes.secondary_drug_concept_id
: a exposição ao princípio ativo secundário para os pacientes.year
: O ano de destino durante o qual os pacientes foram ativamente expostos aos medicamentos primários e secundários.
Para saber mais sobre a execução do notebook, consulte Usar notebooks de exemplo de transformações OMOP.