Compartilhar via


Banco de dados ImmuneCODE

O banco de dados ImmuneCODE™, que inclui centenas de milhões de sequências de TCR (Receptor de Células T) de mais de 1.400 indivíduos expostos ou infectados com o vírus SARS-CoV-2, e mais de 160.000 TCRs específicos do SARS-CoV-2 de alta confiança. O banco de dados é acessível sem custo. Seus dados podem ser analisados para ajudar iniciativas globais destinadas a compreender a resposta imune ao vírus SARS-CoV-2 e criar novas intervenções. Para saber mais sobre o conjunto de dados, consulte a publicação associada.

Os conjuntos de dados mais recentes do ImmuneCODE disponíveis contêm: Versão 002.

  • Os 1.486 sujeitos expostos ou infectados pelo vírus SARSCoV-2: ImmuneCODE-Repertoires-002.2.
  • Os metadados de exemplo: ImmuneCODE-Repertoire-Tags-002.2.tsv (572 KB) Versão 002.2.
  • O SARS-CoV-2 específico de alta confiança (mais de 160.000): ImmuneCODE-MIRA-Release 002.1.
  • Os metadados de exemplo: ImmuneCODE-Repertoire-Tags-002.2.xlsx (352 KB) versão 002.2.

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Fonte de dados

Este conjunto de dados é um espelho de https://clients.adaptivebiotech.com/pub/covid-2020

Volumes de dados e frequência de atualização

Esse conjunto de dados contém aproximadamente 228 GB de dados e é atualizado diariamente.

Local de armazenamento

Esse conjunto de dados está armazenado nas regiões do Leste dos EUA 2 do Azure. É recomendável alocar recursos de computação na região Leste dos EUA 2 para fins de afinidade.

Acesso de dados

Oeste dos EUA 2: “https://dataset1000genomes.blob.core.windows.net/dataset”

Centro-Oeste dos EUA: “https://dataset1000genomes-secondary.blob.core.windows.net/dataset”

Token SAS: sv=2019-10-10&si=prod&sr=c&sig=9nzcxaQn0NprMPlSh4RhFQHcXedLQIcFgbERiooHEqM%3D

Termos de uso

Para saber mais sobre os termos de uso de dados, consulte a publicação e os Termos de Uso.

Contato

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7418738/

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.