Pacote de recursos GATK
Observação
Atualização importante de 19/09/2024: todas as URLs estão mudando. Estamos habilitando o acesso público a todos os contêineres do Genomics Data Lake. As "URLs assinadas" existentes (assinaturas de acesso compartilhado) serão desativadas em: 2024-11-04T00:00:00Z. Após esse tempo, as URLs sem uma cadeia de caracteres de consulta continuarão funcionando, no entanto, as "URLs assinadas" não funcionarão mais e retornarão um código de status HTTP 403. Planeje de acordo para acessar as URLs públicas sem uma cadeia de caracteres de consulta após essa data (remova os caracteres '?' e os caracteres à direita).
O pacote de recursos GATK é uma coleção de arquivos padrão para trabalhar com os dados de ressequenciamento humano com o GATK.
Observação
A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.
Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.
Fonte de dados
Esse conjunto de dados é um espelho do armazenamento de dados em https://gatk.broadinstitute.org/hc/articles/360035890811-Resource-bundle
Volumes de dados e frequência de atualização
- datasetgatkbestpractices : 542 GB
- datasetgatklegacybundles : 61 GB
- datasetgatktestdata : 2 TB
- datasetpublicbroadref : 477 GB
- datasetbroadpublic : 3 TB
Os conjuntos de dados são atualizados mensalmente durante a primeira semana de cada mês.
Local de armazenamento
Este conjunto de dados está armazenado nas regiões do Azure Oeste dos EUA 2 e Centro-Oeste dos EUA. É recomendável alocar recursos de computação no Oeste dos EUA 2 ou no Centro-Oeste dos EUA por questão de afinidade.
Acesso aos Dados
datasetgatkbestpractices
Oeste dos EUA 2: "https://datasetgatkbestpractices.blob.core.windows.net/dataset"
Centro-Oeste dos EUA: “https://datasetgatkbestpractices-secondary.blob.core.windows.net/dataset”
Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=6SaDfKtXAIfdpO%2BkvNA%2FsTNmNij%2Byh%2F%2F%2Bf98WAUqs7I%3D
datasetgatklegacybundles
Oeste dos EUA 2: "https://datasetgatklegacybundles.blob.core.windows.net/dataset"
Centro-Oeste dos EUA: “https://datasetgatklegacybundles-secondary.blob.core.windows.net/dataset”
Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=xBfxOPBqHKUCszzwbNCBYF0k9osTQjKnZbEjXCW7gU0%3D
datasetgatktestdata
Oeste dos EUA 2: "https://datasetgatktestdata.blob.core.windows.net/dataset"
Centro-Oeste dos EUA: “https://datasetgatktestdata-secondary.blob.core.windows.net/dataset”
Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=fzLts1Q2vKjuvR7g50vE4HteEHBxTcJbNvf%2FZCeDMO4%3D
datasetpublicbroadref
Oeste dos EUA 2: "https://datasetpublicbroadref.blob.core.windows.net/dataset"
Centro-Oeste dos EUA: “https://datasetpublicbroadref-secondary.blob.core.windows.net/dataset”
Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=DQxmjB4D1lAfOW9AxIWbXwZx6ksbwjlNkixw597JnvQ%3D
Centro-Sul dos EUA: 'https://datasetpublicbroadrefsc.blob.core.windows.net/dataset'
Token SAS: ?sv=2023-01-03&st=2024-02-12T19%3A56%3A11Z&se=2029-02-13T19%3A56%3A00Z&sr=c&sp=rl&sig=oGiNUGZ08PaabHVNtIiVEpJ1kcyqcL6ZadQcuN2ns%2FM%3D
datasetbroadpublic
Oeste dos EUA 2: "https://datasetbroadpublic.blob.core.windows.net/dataset"
Centro-Oeste dos EUA: “https://datasetbroadpublic-secondary.blob.core.windows.net/dataset”
Token SAS: ?sv=2020-04-08&si=prod&sr=c&sig=u%2Bg2Ab7WKZEGiAkwlj6nKiEeZ5wdoJb10Az7uUwis%2Fg%3D
Centro-Sul dos EUA: 'https://datasetbroadpublicsc.blob.core.windows.net/dataset'
Token SAS: ?sv=2023-01-03&st=2024-02-12T19%3A58%3A33Z&se=2029-02-13T19%3A58%3A00Z&sr=c&sp=rl&sig=C2lDhe1uwu%2FJnC9rbQO65G6%2BdEUQ%2Fl0VheXrlnIQVAs%3D
Termos de uso
Visite o site oficial do pacote de recursos GATK.
Contact
Visite o site oficial do pacote de recursos GATK.
Próximas etapas
Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.