Compartir a través de


Datos abiertos de TCGA

El Atlas del Genoma del Cáncer (TCGA), un programa de genómica del cáncer sin precedentes, caracterizó molecularmente más de 20 000 muestras de cáncer primario y muestras normales emparejadas que abarcaban 33 tipos de cáncer[1]. Los datos del TCGA sobre el cáncer disponibles públicamente tienen dos niveles: acceso abierto o controlado.

  • Acceso abierto [disponible en Azure]: este conjunto de datos contiene datos clínicos y de bioespecímenes sin identificar o datos resumidos que no contienen información identificable individualmente. Los tipos de datos incluidos son la expresión génica, los valores beta de metilación y la cuantificación de proteínas. El tipo de datos a nivel de ADN incluye el número de copias a nivel de gen y el segmento de número de copias enmascarado.
  • Acceso controlado: este conjunto de datos son los datos de secuencias a nivel individual y requiere aprobación a través de dbGap para su acceso.

Nota

Microsoft proporciona Azure Open Datasets "tal cual". Microsoft no ofrece ninguna garantía, expresa o implícita, ni condición con respecto al uso que usted haga de los conjuntos de datos. En la medida en la que lo permita su legislación local, Microsoft declina toda responsabilidad por posibles daños o pérdidas, incluidos los daños directos, consecuenciales, especiales, indirectos, incidentales o punitivos, que resulten de su uso de los conjuntos de datos.

Este conjunto de datos se proporciona bajo los términos originales con los que Microsoft recibió los datos de origen. El conjunto de datos puede incluir datos procedentes de Microsoft.

Origen de datos

Este conjunto de datos es una réplica de los Datos abiertos del TCGA

Volúmenes de datos y frecuencia de actualización

Este conjunto de datos contiene aproximadamente 387 GB.

Ubicación de almacenamiento

Este conjunto de datos se almacena en la región Este de EE. UU. 2 de Azure. Se recomienda asignar recursos de proceso de la misma región por afinidad.

Acceso a datos

Este de EE. UU. 2: 'https://datasettcga.blob.core.windows.net/dataset'

Token de SAS: ?sp=rl&st=2022-10-07T19:43:37Z&se=2030-10-02T03:43:37Z&spr=https&sv=2021-06-08&sr=c&sig=9YgXjisOpHJNgdeMb5lOOzBhA38PWGM8g2DHjo9A5Cs%3D

Términos de uso

Los datos están disponibles sin restricciones. Para más información y detalles sobre las citas, consulte la Página del programa TCGA.

Contacto

Para preguntas sobre los datos y el programa de TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact.

Pasos siguientes

Consulte el resto de los conjuntos de datos en el catálogo de Open Datasets.