Partilhar via


Implementar e configurar a transformações de OMOP em soluções de dados de cuidados de saúde

Nota

Este conteúdo está atualmente a ser atualizado.

As transformações de OMOP permitem a preparação de dados para análises padronizadas através de padrões abertos da comunidade Observational Medical Outcomes Partnership (OMOP). Pode utilizar esta capacidade depois de implementar as soluções de dados de cuidados de saúde e a capacidade Infraestruturas de dados de cuidados de saúde na sua área de trabalho do Fabric.

As transformações OMOP são uma capacidade opcional em soluções de dados de cuidados de saúde no Microsoft Fabric. Tem a flexibilidade de decidir se deseja ou não usá-la, dependendo das suas necessidades ou cenários específicos.

Pré-requisitos

Implementar transformações de OMOP

Pode implementar a capacidade utilizando o módulo de configuração explicado em Soluções de dados de cuidados de saúde: implementar infraestruturas de dados de cuidados de saúde. No entanto, o passo de seleção de dados de exemplo neste módulo não implementa dados de exemplo para esta capacidade. Os dados de exemplo de transformações de OMOP são instalados exclusivamente no seu ambiente de soluções de dados de cuidados de saúde depois de concluir a implementação da capacidade.

Se não utilizou o módulo de configuração para implementar a capacidade e pretende utilizar o mosaico da capacidade, siga estes passos:

  1. Aceda à home page das soluções de dados de cuidados de saúde no Fabric.

  2. Selecione o mosaico de transformações de OMOP.

    Uma captura de ecrã que mostra o mosaico de transformações de OMOP.

  3. Na página da capacidade, selecione Implementar na área de trabalho.

    Uma captura de ecrã que mostra como implementar a capacidade na sua área de trabalho.

  4. A implementação pode demorar alguns minutos a concluir. Não feche a separador ou o browser enquanto a implementação estiver em curso. Enquanto espera, pode trabalhar noutro separador.

    Após a conclusão da implementação, pode ver uma notificação na barra de mensagens.

  5. Selecione Gerir capacidade na barra de mensagens para ir para a página Gestão de capacidades.

    Aqui, pode ver, configurar e gerir os artefactos implementados com a capacidade.

Artefactos

A capacidade instala os seguintes artefactos no seu ambiente de soluções de dados de cuidados de saúde:

Artefacto Type
healthcare#_msft_gold_omop Lakehouse
healthcare#_msft_omop_silver_gold_transformation Bloco de Notas
healthcare#_msft_omop_drug_exposure_era_sample Bloco de Notas
healthcare#_msft_omop_drug_exposure_insights_sample Bloco de Notas
healthcare#_msft_omop_analytics Pipeline de dados
healthcare#_msft_omop_semantic_model Modelo semântico
Vocab-HDS Dados de exemplo

Rever o bloco de notas de prata de OMOP

O bloco de notas healthcare#_msft_omop_silver_gold_transformation utiliza as APIs de OMOP fornecidas como parte da biblioteca de soluções de dados de cuidados de saúde para a transformação de dados. O bloco de notas transforma os recursos no lakehouse healthcare#_msft_silver num modelo de dados comum de OMOP. Os dados transformados são depois inseridos no lakehouse de OMOP.

O bloco de notas é implementado com valores pré-configurados necessários para executar o pipeline de dados de transformações de OMOP. Alguns parâmetros de configuração herdam da configuração global e podem ser substituídos no nível do bloco de notas. Por predefinição, não é necessário fazer alterações nos ficheiros de configuração do bloco de notas. Se necessário, pode rever ou modificar a configuração selecionando os respetivos blocos de notas e ficheiros de configuração no seu ambiente.

Para saber mais sobre a execução de blocos de notas, consulte Utilizar transformações de OMOP.

Rever o modelo semântico de OMOP

O modelo semântico de OMOP, healthcare#_msft_omop_semantic_model, é um modelo semântico personalizado baseado no lakehouse de ouro de OMOP. Inclui algumas relações chave OMOP CDM versão 5.4 entre as seguintes tabelas de OMOP:

  • Localização
  • Pessoa
  • Observação
  • Procedure_Occurrence
  • Condition_Occurrence
  • Nota
  • Drug_Exposure
  • Visit_Ocurrence
  • Image_Occurrence
  • Medida

Estas relações formam o conjunto mínimo necessário para gerar relatórios do Power BI na capacidade Descobrir e criar coortes (pré-visualização) em soluções de dados de cuidados de saúde. Pode utilizar este modelo semântico como base, adicionando mais tabelas de OMOP e relações do lakehouse de OMOP para criar relatórios personalizados do Power BI a partir dos dados de lakehouse padrão de OMOP.

Configurar o bloco de notas de exemplo da era da exposição a medicamentos

O bloco de notas de exemplo healthcare#_msft_omop_drug_exposure_era_sample mostra como gerar os registos da tabela drug_era no OMOP utilizando a linguagem PySpark (Python) num bloco de notas do Azure Synapse Analytics, principalmente para fins exploratórios. A geração de registos da tabela drug_era segue o script de exemplo da era de medicamentos OHDSI, adaptado para funcionar com o PySpark no Azure Synapse Analytics. O código do gerador da era de medicamentos está incluído na biblioteca personalizada do Python, compactada como um ficheiro wheel (WHL) e carregada num conjunto do Apache Spark para facilitar o acesso.

Antes de executar o bloco de notas, tenha em mente os seguintes pré-requisitos:

  • Certifique-se de que a base de dados de OMOP tem dados válidos nas seguintes tabelas:

    • drug_exposure
    • concept
    • concept_ancestor

    Pode gerar estes dados através da utilização dos dados de exemplo ou dos seus próprios dados executando o FHIR no pipeline de dados de OMOP.

  • Verifique se o pacote wheel da biblioteca personalizada está anexado ao conjunto do Spark que utiliza para executar este bloco de notas.

O parâmetro de configuração principal para este bloco de notas é o omop_database_name. Este parâmetro identifica o nome da base de dados de OMOP que contém os dados para gerar a tabela drug_era. Atualize este valor apenas se a base de dados de OMOP for diferente do valor predefinido no ficheiro de configuração global.

Se a tabela OMOP drug_exposure for preenchida com dados válidos, este bloco de notas invoca o módulo DrugEraGenerator que agrupa os períodos de tempo em que uma pessoa está exposta a um ingrediente ativo do medicamento, permitindo um intervalo de 30 dias. O módulo DrugEraGenerator elimina todos os registos existentes de drug_era e gera novos registos, com base nos dados de OMOP mais recentes.

Para saber mais sobre a execução de blocos de notas, consulte Utilizar os blocos de notas de exemplo das transformações de OMOP.

Configurar o bloco de notas de exemplo de informações da exposição a medicamentos

O bloco de notas de exemplo healthcare#_msft_omop_drug_exposure_insights_sample demonstra uma análise exploratória na tabela drug_era utilizando o PySpark num bloco de notas do Azure Synapse Analytics. A análise gera um histograma que mostra a exposição de medicamentos secundários dos pacientes a princípios ativos, estratificada por género e idade para um ano específico. A tabela drug_era é gerada utilizando uma biblioteca personalizada DrugEraGenerator que o bloco de notas anterior healthcare#_msft_omop_drug_exposure_era_sample invoca. Esta análise amplia a consulta Exposição a medicamentos DEX03: Distribuição da idade, estratificada por medicamento incorporando a estratificação com base no género e na idade.

Antes de executar o bloco de notas, tenha em mente os seguintes pré-requisitos:

  • Se desejar editar a configuração do bloco de notas, certifique-se de que faz uma cópia deste bloco de notas. Não atualize diretamente o bloco de notas.
  • Certifique-se de que a tabela drug_era contém dados executando o bloco de notas da era da exposição a medicamentos. A execução deste bloco de notas substitui quaisquer registos existentes de drug_era por novos registos, com base nos dados mais recentes de OMOP .
  • Utilize este bloco de notas tal como está para uma análise exploratória e crie uma cópia para executar a análise personalizada.

Seguem-se os principais parâmetros de configuração do bloco de notas. Pode modificar estes parâmetros para uma análise exploratória alternativa da exposição dos pacientes aos medicamentos:

  • primary_drug_concept_id: a exposição do ingrediente ativo principal para os pacientes.
  • secondary_drug_concept_id: a exposição do ingrediente ativo secundário para os pacientes.
  • year: O ano-alvo durante o qual os pacientes foram ativamente expostos aos medicamentos principal e secundário.

Para saber mais sobre a execução de blocos de notas, consulte Utilizar os blocos de notas de exemplo das transformações de OMOP.