Compartilhar via


Pacote de recursos GATK

Observação

Atualização importante de 19/09/2024: todas as URLs estão mudando. Estamos habilitando o acesso público a todos os contêineres do Genomics Data Lake. As "URLs assinadas" existentes (assinaturas de acesso compartilhado) serão desativadas em: 2024-11-04T00:00:00Z. Após esse tempo, as URLs sem uma cadeia de caracteres de consulta continuarão funcionando, no entanto, as "URLs assinadas" não funcionarão mais e retornarão um código de status HTTP 403. Planeje de acordo para acessar as URLs públicas sem uma cadeia de caracteres de consulta após essa data (remova os caracteres '?' e os caracteres à direita).

O pacote de recursos GATK é uma coleção de arquivos padrão para trabalhar com os dados de ressequenciamento humano com o GATK.

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Fonte de dados

Esse conjunto de dados é um espelho do armazenamento de dados em https://gatk.broadinstitute.org/hc/articles/360035890811-Resource-bundle

Volumes de dados e frequência de atualização

  1. datasetgatkbestpractices : 542 GB
  2. datasetgatklegacybundles : 61 GB
  3. datasetgatktestdata : 2 TB
  4. datasetpublicbroadref : 477 GB
  5. datasetbroadpublic : 3 TB

Os conjuntos de dados são atualizados mensalmente durante a primeira semana de cada mês.

Local de armazenamento

Este conjunto de dados está armazenado nas regiões do Azure Oeste dos EUA 2 e Centro-Oeste dos EUA. É recomendável alocar recursos de computação no Oeste dos EUA 2 ou no Centro-Oeste dos EUA por questão de afinidade.

Acesso aos Dados

  1. datasetgatkbestpractices

    Oeste dos EUA 2: "https://datasetgatkbestpractices.blob.core.windows.net/dataset"

    Centro-Oeste dos EUA: “https://datasetgatkbestpractices-secondary.blob.core.windows.net/dataset”

    Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=6SaDfKtXAIfdpO%2BkvNA%2FsTNmNij%2Byh%2F%2F%2Bf98WAUqs7I%3D

  2. datasetgatklegacybundles

    Oeste dos EUA 2: "https://datasetgatklegacybundles.blob.core.windows.net/dataset"

    Centro-Oeste dos EUA: “https://datasetgatklegacybundles-secondary.blob.core.windows.net/dataset”

    Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=xBfxOPBqHKUCszzwbNCBYF0k9osTQjKnZbEjXCW7gU0%3D

  3. datasetgatktestdata

    Oeste dos EUA 2: "https://datasetgatktestdata.blob.core.windows.net/dataset"

    Centro-Oeste dos EUA: “https://datasetgatktestdata-secondary.blob.core.windows.net/dataset”

    Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=fzLts1Q2vKjuvR7g50vE4HteEHBxTcJbNvf%2FZCeDMO4%3D

  4. datasetpublicbroadref

    Oeste dos EUA 2: "https://datasetpublicbroadref.blob.core.windows.net/dataset"

    Centro-Oeste dos EUA: “https://datasetpublicbroadref-secondary.blob.core.windows.net/dataset”

    Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=DQxmjB4D1lAfOW9AxIWbXwZx6ksbwjlNkixw597JnvQ%3D

    Centro-Sul dos EUA: 'https://datasetpublicbroadrefsc.blob.core.windows.net/dataset'

    Token SAS: ?sv=2023-01-03&st=2024-02-12T19%3A56%3A11Z&se=2029-02-13T19%3A56%3A00Z&sr=c&sp=rl&sig=oGiNUGZ08PaabHVNtIiVEpJ1kcyqcL6ZadQcuN2ns%2FM%3D

  5. datasetbroadpublic

    Oeste dos EUA 2: "https://datasetbroadpublic.blob.core.windows.net/dataset"

    Centro-Oeste dos EUA: “https://datasetbroadpublic-secondary.blob.core.windows.net/dataset”

    Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=u%2Bg2Ab7WKZEGiAkwlj6nKiEeZ5wdoJb10Az7uUwis%2Fg%3D

    Centro-Sul dos EUA: 'https://datasetbroadpublicsc.blob.core.windows.net/dataset'

    Token SAS: ?sv=2023-01-03&st=2024-02-12T19%3A58%3A33Z&se=2029-02-13T19%3A58%3A00Z&sr=c&sp=rl&sig=C2lDhe1uwu%2FJnC9rbQO65G6%2BdEUQ%2Fl0VheXrlnIQVAs%3D

Termos de uso

Visite o site oficial do pacote de recursos GATK.

Contact

Visite o site oficial do pacote de recursos GATK.

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.