banner

Noticias

Oct 01, 2023

Mejora de la colección REMBRANDT MRI con etiquetas de segmentación expertas y características radiómicas cuantitativas

Scientific Data volumen 9, Número de artículo: 338 (2022) Citar este artículo

1784 Accesos

1 Citas

5 Altmetric

Detalles de métricas

Una corrección del autor de este artículo se publicó el 07 de julio de 2022

Este artículo ha sido actualizado

Desafortunadamente, la malignidad del cerebro y el SNC es un diagnóstico común. Un gran subconjunto de estas lesiones tiende a ser tumores de alto grado que presagian malos pronósticos y bajas tasas de supervivencia, y se estima que son la décima causa principal de muerte en todo el mundo. La naturaleza compleja del entorno del tejido cerebral en el que surgen estas lesiones ofrece una gran oportunidad para la investigación traslacional. La resonancia magnética nuclear (RMN) puede proporcionar una visión completa de las regiones anormales del cerebro, por lo que sus aplicaciones en la investigación traslacional del cáncer cerebral se consideran esenciales para el diagnóstico y seguimiento de la enfermedad. En los últimos años se ha visto un rápido crecimiento en el campo de la radiogenómica, especialmente en el cáncer, y los científicos han podido integrar con éxito los datos cuantitativos extraídos de las imágenes médicas (también conocidas como radiómica) con la genómica para responder preguntas nuevas y clínicamente relevantes. En este documento, tomamos imágenes de resonancia magnética sin procesar de la recopilación de datos de REMBRANDT del dominio público y realizamos una segmentación volumétrica para identificar subregiones del cerebro. Luego se extrajeron las características radiómicas para representar las resonancias magnéticas en un formato cuantitativo pero resumido. Este conjunto de datos resultante ahora permite un mayor análisis de datos biomédicos e integradores, y se hace público a través del repositorio de NeuroImaging Tools & Resources Collaboratory (NITRC) (https://www.nitrc.org/projects/rembrandt_brain/).

Mediciones)

exploraciones de resonancia magnética

Tipos de tecnología

Etiquetas segmentadas en formato NIFTI

Muestra Característica - Organismo

Un hombre sabio

El cáncer de cerebro es una enfermedad mortal con una tasa de supervivencia a 5 años de solo alrededor del 30 % (www.seer.cancer.gov). Según el Observatorio Mundial del Cáncer https://gco.iarc.fr/, en 20201 había 308 102 casos de cáncer de cerebro y del sistema nervioso central (SNC) en el mundo (139 756 eran mujeres y más de 168 346 eran hombres1 ). Hay más de 120 tipos identificados de tumores cerebrales, según la Sociedad Nacional de Tumores Cerebrales, que son de naturaleza extremadamente heterogénea, https://braintumor.org/brain-tumor-information/understanding-brain-tumors/tumor-types/ por lo que es una enfermedad compleja de entender e interpretar. A pesar de los avances en el tratamiento de otros tipos de cáncer en los últimos 20 años, solo existen 5 fármacos aprobados para tratar tumores cerebrales y no se han observado avances en el pronóstico de los pacientes con GBM2. https://braintumor.org/brain-tumor-information/brain-tumor-facts/.

Las tecnologías de imágenes médicas, incluidas las imágenes por resonancia magnética (IRM) y las tomografías computarizadas (TC), son una de las tecnologías más nuevas que se utilizan cada vez más en la investigación de imágenes traslacionales3. Debido a su naturaleza compleja, el entorno del tejido cerebral ofrece una gran oportunidad para la investigación traslacional. La resonancia magnética puede proporcionar una visión integral de las regiones anormales del cerebro4, por lo que sus aplicaciones en la investigación traslacional del cáncer cerebral se consideran esenciales para el diagnóstico, el seguimiento y el tratamiento de la enfermedad3.

En los últimos años, los científicos han podido integrar los datos obtenidos de las imágenes médicas con la genómica, y este campo floreciente se llama radiogenómica5,6,7. Los datos de imágenes se convierten primero en un formato resumido cuantitativo, a través de mediciones extraídas (también conocidas como radiómicas) que pueden ser tanto visuales como subvisuales a simple vista8. Estas características radiómicas permiten una mayor extracción de fenotipos de imágenes, que se pueden integrar con datos genómicos utilizando algoritmos basados ​​en aprendizaje automático (ML) e inteligencia artificial (IA). Si bien muchos ensayos clínicos están en curso para nuevos tratamientos en la investigación del cáncer de cerebro, existen muchas oportunidades para el desarrollo de nuevas hipótesis de tratamiento utilizando enfoques radiogenómicos9.

Existen varias colaboraciones nacionales a gran escala que utilizan datos sobre el cáncer de cerebro o tecnologías relacionadas con imágenes médicas para la investigación traslacional, incluida la Brain Science Foundation https://www.brainsciencefoundation.org/; Endbraincancer (EBC) https://endbraincancer.org/end-brain-cancer/; The Children Brain Tumor Tissue Consortium (CBTTC) https://www.chop.edu/clinical-trial/cbttc-collection-protocol; The Children's Brain Tumor Network https://cbtn.org/about-us, The Cancer Imaging Archive (TCIA)10 y más. Sin embargo, solo un puñado de proyectos nacionales de cáncer de cerebro incluyen tanto datos multiómicos como datos de imágenes médicas. Estos incluyen The Cancer Genome Atlas (TCGA), que es una gran colección de datos multiómicos de 22 tipos de cáncer, incluidos los gliomas de bajo grado (LGG)11,12 y los glioblastomas (GBM)12,13. Los datos de imágenes de la recopilación de datos de TCGA, junto con los datos de imágenes de otros estudios, se encuentran en el repositorio de datos de imágenes de TCIA de acceso público https://www.cancerimagingarchive.net/. El National Cancer Institute (NCI) Cancer Research Data Commons (CRDC) brinda acceso a un ecosistema basado en la nube con acceso, visualización y análisis de datos de imágenes multimodales a través de su portal público. También permite a los investigadores conectar datos de imágenes con datos genómicos y proteómicos correspondientes dentro de las colecciones de CRDC https://portal.imaging.datacommons.cancer.gov/.

Otra iniciativa que incluyó tanto datos ómicos como imágenes médicas fue el proyecto REMBRANDT (REpository for Molecular BRAin Neoplasia DaTa), una iniciativa conjunta del NCI y el Instituto Nacional de Trastornos Neurológicos y Accidentes Cerebrovasculares (NINDS). Este proyecto consistió en un gran conjunto de datos derivados de pacientes con cáncer de cerebro que contenía datos clínicamente anotados generados a través de la Iniciativa de diagnóstico molecular de glioma (GDMI) a partir de 874 especímenes de glioma que comprenden 566 matrices de expresión génica, 834 matrices de número de copias y 13 472 puntos de datos de fenotipo clínico. En 2015, los datos moleculares, incluida la expresión génica de micromatrices, el número de copias y los datos clínicos, se migraron a la base de datos de cáncer de Georgetown (G-DOC)14,15. Este proyecto fue administrado por nuestro equipo en la Universidad de Georgetown, y este conjunto de datos se hizo público en 2018 a través de la publicación Gusev et al.16, y los datos se pusieron a disposición a través del repositorio de datos NCBI Gene Expression Omnibus (GEO) GSE10847617. Entre los pacientes de esta colección de REMBRANDT, se obtuvieron imágenes de secuencias múltiples de resonancia magnética (RM) prequirúrgicas de 130 pacientes y se encuentran alojadas en TCIA18 https://wiki.cancerimagingarchive.net/display/Public/REMBRANDT.

En este documento, obtuvimos las imágenes de resonancia magnética sin procesar de la colección REMBRANDT disponible públicamente y las procesamos a través de un canal de procesamiento de imágenes conocido que está especializado para las imágenes de resonancia magnética del cáncer cerebral. El flujo de trabajo incluyó la segmentación volumétrica automatizada de las resonancias magnéticas que identificaron varias subregiones del cerebro, incluido el núcleo necrótico, el edema, el tumor sin realce (NET) y el tumor con realce (ET), la materia gris (GM), la materia blanca (WM) y cerebroespinal. Líquido (LCR). Luego, un radiólogo certificado por la Junta realizó la verificación y el refinamiento de las etiquetas segmentadas que también incluían características radiómicas extraídas. Esto permitió la representación de las imágenes de resonancia magnética en un formato cuantitativo, con la intención de permitir más análisis de datos biomédicos e integradores.

Este conjunto de datos se hace público en el repositorio de NeuroImaging Tools & Resources Collaboratory (NITRC) a través de este enlace (https://www.nitrc.org/projects/rembrandt_brain/)19 para permitir que los investigadores realicen análisis basados ​​en radiogenómica, se integren con la expresión génica y copiar datos numéricos y habilitar nuevos descubrimientos e hipótesis. La Tabla 1 muestra un resumen de la colección de cáncer cerebral de REMBRANDT.

Primero descargamos las imágenes de resonancia magnética sin procesar preoperatorias del archivo de imágenes TCIA10,20 para los 130 pacientes, incluidas varias series para cada paciente en formato de archivo DICOM21. El radiólogo certificado por la junta realizó el etiquetado de las resonancias magnéticas de todas las modalidades en el conjunto de datos que incluía resonancias magnéticas de diferentes modalidades, incluidas las ponderadas en T1, ponderadas en T2, ponderadas en T1 poscontraste (T1-C) y T2 Fluid- Volúmenes de recuperación de inversión atenuada (FLAIR)22.

Algunos escaneos tenían modalidades mixtas de PD y T2, y tenían que separarse según los metadatos en el archivo DICOM. Solo los pacientes que tenían datos de resonancia magnética disponibles para las cuatro modalidades (T1, T2, T1-C y FLAIR) fueron seleccionados para el siguiente paso, lo que resultó en un conjunto de 72 pacientes. La figura 1 muestra un ejemplo de cuatro modalidades del mismo paciente con cáncer cerebral.

Un ejemplo de cuatro modalidades (ponderada en T1, ponderada en T2, ponderada en T1 posterior al contraste (T1-C) y FLAIR) del mismo paciente con cáncer cerebral (paciente n.º HF1702).

Luego aplicamos dos canalizaciones diferentes para el procesamiento de estos escaneos, que comprenden dos herramientas populares de segmentación de cáncer cerebral: (a) la primera canalización usó la herramienta BraTumIA23 (Fig. 2A), y (b) la segunda canalización usó la herramienta GLISTRboost24,25 (Figura 2B). En particular, la canalización basada en GLISTRboost obtuvo la mejor clasificación en el Desafío internacional de segmentación de tumores cerebrales multimodales 2015 (BraTS'15)26 y utiliza un marco de maximización de expectativas (EM)27 para mapear automáticamente las diversas subregiones de los escáneres cerebrales mientras toma en cuenta deformaciones cerebrales causadas por el tumor a través de modelos de crecimiento biofísico28. El subcampeón de este desafío fue la herramienta BraTumIA que utiliza un algoritmo de aprendizaje automático23.

(A) Pipeline de segmentación utilizando la herramienta de segmentación de Bratumia. (B) Pipeline de segmentación utilizando la herramienta de segmentación GLISTRboost.

Después de descargar y formatear los datos sin procesar, terminamos con resonancias magnéticas de 72 pacientes con cuatro modalidades: ponderada en T1, ponderada en T2, T1-C y FLAIR. Luego, las imágenes se usaron como entrada en la herramienta BraTumIA23, que realizó internamente todos los pasos de procesamiento. La extracción del cráneo se realizó utilizando Insight Toolkit ITK29 como primer paso para generar una máscara cerebral y, en el segundo paso, las imágenes se registraron, es decir, se transformaron espacialmente utilizando el kit de herramientas ITK, de modo que los vóxeles de las diversas imágenes se correspondan entre sí. . Las imágenes se segmentaron en imágenes tumorales e imágenes sanas utilizando un algoritmo basado en la regularización de la clasificación conjunta. Las etiquetas de salida segmentadas estaban en formato de archivo de meta imagen (.mha) (Fig. 2A).

El radiólogo certificado por la Junta realizó la verificación de las etiquetas segmentadas predichas. En la Fig. 3 se muestran etiquetas segmentadas de ejemplo para un paciente con cáncer de cerebro obtenidas mediante la canalización BraTumIA.

Etiquetas segmentadas para un paciente con cáncer de cerebro (paciente n.° HF1708) obtenidas mediante la canalización BraTumIA. Muestra cómo se ven las resonancias magnéticas en las cuatro modalidades.

Los datos sin procesar se descargaron y limpiaron en un orden similar al de la canalización anterior para obtener resonancias magnéticas de 72 pacientes con cuatro modalidades: ponderada en T1, ponderada en T2, T1-C y FLAIR. Luego, se aplicaron varios pasos de preprocesamiento. Primero se reorientaron las exploraciones de MRI para que todas las imágenes se transformaran en el mismo sistema de coordenadas Left-Post-Superior (LPS) https://www.slicer.org/wiki/Coordinate_systems, un paso necesario para ser capaz de comparar o integrar datos obtenidos de diferentes modalidades. Luego, las imágenes se registraron conjuntamente en la misma plantilla anatómica T1 utilizando "Greedy" (github.com/pyushkevich/greedy)30, una implementación en C++ basada en CPU del algoritmo de registro difeomorfo voraz31. Greedy está integrado en el software de segmentación ITK-SNAP (itksnap.org)32,33, así como en el Cancer Imaging Phenomics Toolkit (CaPTk - www.cbica.upenn.edu/captk)34,35,36,37. Después del registro conjunto, se realizó la extracción del cerebro (también conocida como extracción del cráneo) utilizando el Generador de Máscara Cerebral (BrainMaGe)38,39, que se basa en una arquitectura de segmentación de aprendizaje profundo (a saber, U-Net40) y utiliza un marco novedoso introduciendo la forma del cerebro como anterior y, por lo tanto, permitiéndole ser independiente de la secuencia de resonancia magnética de entrada. BrainMaGe38,39 se utilizó para eliminar tejidos no cerebrales como el cráneo, el cuero cabelludo y la duramadre de las imágenes cerebrales.

Luego, el radiólogo realizó un paso llamado siembra. La siembra implicó el etiquetado manual de las subregiones de la resonancia magnética del cerebro, incluidas las regiones tumorales, a saber, ET, NET y ED; y regiones sanas que incluyen materia blanca, materia gris, LCR, vasos y cerebelo. Los puntos de semilla incluyeron el centro y el radio del tumor, y los puntos de semilla de muestra en cada subregión de la imagen del cerebro. Este paso de siembra permitió que el algoritmo de segmentación modelara con precisión la distribución de intensidad (media y varianza) para cada clase de tejido. Esto permitió que la herramienta de segmentación funcionara con mayor precisión en comparación con otras herramientas de segmentación. Este paso se realizó utilizando la plataforma de software Cancer Imaging Phenomics Toolkit (CaPTk)34,35,36,37. El resultado de este paso incluyó dos archivos de texto, uno con información sobre el tumor y otro sobre los puntos de muestra en cada subregión. Estos dos archivos se usaron como entrada para el siguiente paso en la canalización.

Después de completar estos pasos, se realizó la segmentación volumétrica automatizada y el registro utilizando GLISTRboost24,25. Durante el proceso de segmentación, las resonancias magnéticas de 8 pacientes tuvieron que filtrarse por varios motivos, entre ellos, baja calidad y cobertura muy limitada, o resultados poco fiables debido a irregularidades en las resonancias magnéticas de entrada. Al final de este proceso (Fig. 2B), se obtuvieron con éxito resultados de segmentación completos para 64 pacientes. La Tabla 2 muestra un resumen de los 130 pacientes originales en la cohorte de pacientes de REMBRANDT antes del inicio del análisis y la cohorte de 64 pacientes después de completar el paso de segmentación.

Los archivos de salida de esta tubería tenían la forma de archivos NIfTI https://nifti.nimh.nih.gov. La Figura 4 muestra las etiquetas segmentadas para un paciente con cáncer de cerebro obtenidas mediante la canalización GLISTRboost.

Etiquetas segmentadas para un paciente con cáncer de cerebro (paciente n.° HF1538) obtenidas mediante la canalización GLISTRboost.

Nuestro radiólogo certificado por la Junta descubrió que el algoritmo BraTumIA solo era efectivo en la segmentación de un tipo de cáncer, es decir, pacientes con GBM; mientras que la tubería GLISTRboost produjo etiquetas segmentadas más precisas para todos los subtipos de cáncer cerebral en esta recopilación de datos. Por este motivo, elegimos las etiquetas segmentadas del pipeline GLISTRboost para el análisis radiómico.

Pyradiomics41, un paquete de código abierto de Python, se utilizó para extraer características radiómicas de las etiquetas segmentadas de las resonancias magnéticas cerebrales. Incluía un total de 120 funciones, que describen varias propiedades relacionadas con los píxeles de la imagen médica, incluida la forma bidimensional y tridimensional, la textura, la energía y la entropía, el tamaño y la concurrencia, las diferencias de tono de gris y más41. La Tabla 3 muestra un resumen de las diferentes clases de rasgos caracterizados por la piradiómica42. El archivo complementario 1 muestra las características radiómicas extraídas de las etiquetas segmentadas REMBRANDT de la canalización GLISTRboost.

Los datos de expresión génica y número de copias de este mismo conjunto de datos se hicieron públicos en 2018 a través de la publicación Gusev et al.16, y los datos se pusieron a disposición del repositorio de datos NCBI Gene Expression Omnibus (GEO) GSE10847617. Los datos de imágenes médicas en forma de etiquetas segmentadas, junto con la salida numérica de radiómica ahora se harán públicos a través de esta publicación. Esto permitiría a los investigadores integrar la expresión génica, el número de copias y los datos de imágenes médicas del mismo grupo de pacientes. Dichos análisis radiogenómicos basados ​​en múltiples ómicas permitirían la investigación y el desarrollo de nuevos biomarcadores e hipótesis de tratamiento para la medicina de precisión.

El canal de segmentación GLISTRboost utilizado en este documento se ha aplicado a las imágenes por resonancia magnética de pacientes con cáncer cerebral TCGA (TCGA-GBM y TCGA-LGG), como se demuestra en la publicación de Bakas et al.12. Dado que se aplicó el mismo canal de segmentación GLISTRboost al cáncer cerebral REMBRANDT y TCGA (TCGA-GBM y TCGA-LGG), ahora podemos usarlos para metanálisis. Por ejemplo, la herramienta PyRadiomics de radiómica de código abierto se puede utilizar en ambos conjuntos de datos para obtener resultados radiómicos cuantitativos. Esto significa que estas dos recopilaciones de datos podrían usarse juntas en un enfoque de metanálisis para proporcionar un mejor tamaño de muestra para el aprendizaje automático y las aplicaciones de IA. Creemos que esto es muy valioso y permite un mayor análisis de datos biomédicos e integradores. La salida radiómica de PyRadiomics del REMBRANDT; y las colecciones TCGA-GBM y TCGA-LGG están disponibles a través de esta publicación como Archivo Suplementario 1 y Archivo Suplementario 2 respectivamente.

Otra aplicación es la plataforma Federated Tumor Segmentation (FeTS)43 que permite entrenar modelos de aprendizaje automático específicos aprovechando la información recopilada de los conjuntos de datos de cáncer cerebral que residen en sitios colaboradores sin intercambiar los datos. Las etiquetas segmentadas de nuestros escaneos de resonancia magnética REMBRANDT son parte de esta federación mundial https://www.fets.ai/, y ha permitido modelos de aprendizaje automático muy grandes de múltiples sitios en un esfuerzo por acelerar el descubrimiento.

En esta publicación, tomamos las imágenes de resonancia magnética sin procesar de la recopilación de datos de REMBRANDT del dominio público y realizamos una segmentación volumétrica para identificar varias subregiones del cerebro. A continuación, se extrajeron las características radiómicas para representar las exploraciones de resonancia magnética en formato numérico. Los datos de expresión génica y número de copias del mismo conjunto de datos de Rembrandt se hicieron públicos en 2018 a través de la publicación Gusev et al.16, y los datos se pusieron a disposición del repositorio de datos NCBI Gene Expression Omnibus (GEO) GSE10847617. Este conjunto de datos ahora permite a los investigadores avanzar en la investigación traslacional utilizando no solo los datos de imágenes médicas, sino también junto con los datos genómicos y clínicos.

Creemos que al poner este conjunto de datos a disposición de la comunidad de investigación a través de un repositorio público, se brinda una oportunidad única de investigación en ciencia de datos para las comunidades de investigación biomédica y de ciencia de datos. Dichos conjuntos de datos combinados brindarían a los investigadores una oportunidad única para realizar un análisis integrador de datos cuantitativos de imágenes médicas, expresión génica y cambios en el número de copias, junto con resultados clínicos (supervivencia general) en este gran estudio de cáncer cerebral publicado hasta la fecha.

Nuestro radiólogo certificado por la Junta confirmó que el algoritmo BraTumIA solo era efectivo en la segmentación de un tipo de cáncer: pacientes con GBM. Esto se menciona en el manual de BraTumIA (https://www.nitrc.org/projects/bratumia), y se debe al hecho de que la morfología es muy diferente para cada subtipo de cáncer y, por lo tanto, la herramienta funcionó bien solo para pacientes con GBM.

El radiólogo descubrió que el algoritmo GLISTRboost era más efectivo en la segmentación de los diversos subtipos de cánceres cerebrales en este conjunto de datos: astrocitoma, oligodendroglioma y GBM. La verificación y corrección manual se realizaron en los archivos de salida etiquetados segmentados. Mediante el uso de un paso de siembra manual adicional que proporcionó subregiones de muestra como referencia para el algoritmo, la tubería GLISTRboost pudo superar la morfología y otras diferencias en los diversos subtipos de cánceres cerebrales en este conjunto de datos.

Esta verificación y correcciones se realizaron utilizando un software de visualización de resonancia magnética MITK44 https://www.mitk.org/. La Figura 5 muestra una imagen de ejemplo de cómo se realizó la verificación manual.

Ilustración de cómo el radiólogo realizó la verificación manual utilizando el paciente n.º HF1538 como ejemplo.

Primero descargamos las imágenes de resonancia magnética sin procesar preoperatorias del archivo de imágenes de TCIA para 130 pacientes. Después de la limpieza, se eligieron exploraciones de resonancia magnética de 72 pacientes con datos completos de cuatro modalidades para su posterior procesamiento. Se aplicaron dos canales de segmentación de cáncer cerebral bien conocidos al conjunto de datos limpio: BraTumIA23 y GLISTRboost24. El algoritmo GLISTRboost24 ocupó el primer lugar en el Desafío internacional de segmentación de imágenes de tumores cerebrales multimodales 2015 (BraTS'15), y el algoritmo BraTumIA23 fue el subcampeón. Después de ejecutar las canalizaciones BraTumIA23 y GLISTRboost24, se descubrió que la herramienta BraTumIA23 solo era eficaz en la segmentación de un tipo de cáncer: pacientes con GBM. La tubería GLISTRboost24 fue más efectiva en la segmentación de los diversos subtipos de cánceres cerebrales en este conjunto de datos: astrocitoma, oligodendroglioma y GBM.

Las etiquetas segmentadas del canal GLISTRboost24, junto con las correcciones manuales realizadas por el radiólogo, se han puesto a disposición del público a través del repositorio de NeuroImaging Tools & Resources Collaboratory (NITRC)19. Los datos de expresión génica y número de copias de este mismo conjunto de datos se hicieron públicos en 2018 a través de la publicación Gusev et al.16, y los datos se pusieron a disposición del repositorio de datos NCBI Gene Expression Omnibus (GEO) GSE10847617. La Tabla 3 muestra un resumen de alto nivel de la colección de cáncer cerebral de REMBRANDT.

El Madhavan45 et al. La publicación que originalmente describía el portal y el conjunto de datos de Rembrandt ha permitido numerosos análisis y ha sido citada 366 veces hasta el momento (hasta enero de 2022). Los datos de expresión génica y número de copias del conjunto de datos REMBRANDT se hicieron públicos en 2018 a través de la publicación Gusev et al.16, y los datos se pusieron a disposición del repositorio de datos NCBI Gene Expression Omnibus (GEO) GSE10847617, que se ha citado 69 veces hasta el momento ( a partir de enero de 2022).

En esta publicación, tomamos las imágenes de resonancia magnética sin procesar de la recopilación de datos de REMBRANDT y realizamos una segmentación volumétrica para identificar varias subregiones del cerebro. A continuación, se extrajeron las características radiómicas para representar las imágenes de resonancia magnética en un formato cuantitativo. Este conjunto de datos ahora permite a los investigadores integrar la expresión génica, el número de copias y los datos de imágenes médicas del mismo grupo de pacientes. Dichos análisis radiogenómicos basados ​​en múltiples ómicas permitirían la investigación y el desarrollo de nuevos biomarcadores e hipótesis de tratamiento para la medicina de precisión.

El canal de segmentación GLISTRboost aplicado en este manuscrito se aplicó previamente a las imágenes por resonancia magnética de pacientes con cáncer cerebral TCGA (TCGA-GBM y TCGA-LGG) en la publicación de Bakas et al.12. Dado que los datos de imágenes de la colección de cáncer cerebral de REMBRANDT y TCGA se procesaron con el mismo canal de segmentación, los dos conjuntos de datos ahora se pueden usar en conjunto en un estudio de metanálisis. Por ejemplo, el conjunto de datos de cáncer cerebral TCGA podría usarse como un conjunto de entrenamiento y el conjunto de datos REMBRADNT podría usarse como un conjunto de prueba independiente en dicho análisis. Otro ejemplo: la herramienta radiómica de código abierto PyRadiomics se puede aplicar a ambos conjuntos de datos para obtener resultados radiómicos cuantitativos. Este enfoque de metanálisis puede proporcionar un mejor tamaño de muestra para el aprendizaje automático y las aplicaciones de IA. Creemos que esto sería muy valioso y permitiría un mayor análisis de datos biomédicos e integradores. La salida radiómica de PyRadiomics del REMBRANDT; y las colecciones TCGA-GBM y TCGA-LGG están disponibles a través de esta publicación como Archivo Suplementario 1 y Archivo Suplementario 2 respectivamente.

Otra aplicación es la plataforma Federated Tumor Segmentation (FeTS)43 que permite entrenar modelos de aprendizaje automático específicos aprovechando la información recopilada de conjuntos de datos de cáncer cerebral que residen en sitios colaboradores sin intercambiar los datos43. Las etiquetas segmentadas de nuestras resonancias magnéticas REMBRANDT forman parte de esta federación mundial https://www.fets.ai/. Este modelo federado ha permitido modelos de aprendizaje automático muy grandes en varios sitios en un esfuerzo por acelerar el descubrimiento y crear nuevos modelos avanzados de aprendizaje automático.

En resumen, creemos que al poner este conjunto de datos a disposición de la comunidad de investigación a través de un repositorio público, se brinda una oportunidad única de investigación en ciencia de datos para las comunidades de investigación biomédica y de ciencia de datos. Tales conjuntos de datos combinados brindarían a los investigadores una oportunidad única para realizar un análisis integrador de datos numéricos de imágenes médicas, expresión génica y cambios en el número de copias, junto con resultados clínicos (supervivencia general) en este gran estudio de cáncer cerebral.

Las imágenes médicas segmentadas generadas en este manuscrito y publicadas a través de NITRC están despojadas del cráneo y, por lo tanto, no contienen información identificable.

Los métodos y herramientas aplicados en este documento utilizan herramientas de código abierto detalladas en las publicaciones respectivas Bakas et al.12 publicación. Aquí se proporciona el código de Python para extraer características de PyRadiomics de Rembrandt y los datos segmentados de TCGA (archivo complementario 1 y 2 respectivamente). https://github.com/ICBI/rembrandt-mri.

Se ha publicado una corrección de este artículo: https://doi.org/10.1038/s41597-022-01518-9

Khazaei, Z. et al. La asociación entre la incidencia y la mortalidad del cáncer de cerebro y el índice de desarrollo humano (IDH): un estudio ecológico. BMC Public Health 20, 1696, https://doi.org/10.1186/s12889-020-09838-4 (2020).

Artículo PubMed PubMed Central Google Académico

Tracy Batchelor, RN, Tarbell, N. & Weller, M. Oxford Textbook of Neuro-Oncology, https://doi.org/10.1093/med/9780199651870.001.0001 (Oxford University Press, 2017).

Vadmal, V. et al. Métodos y aplicaciones de análisis de imágenes de resonancia magnética: una perspectiva algorítmica utilizando tumores cerebrales como ejemplo. Neurooncol Adv 2, vdaa049, https://doi.org/10.1093/noajnl/vdaa049 (2020).

Artículo PubMed PubMed Central Google Académico

Shukla, G. et al. Resonancia magnética avanzada en glioblastoma: una revisión. Chin Clin Oncol 6, 40, https://doi.org/10.21037/cco.2017.06.28 (2017).

Artículo PubMed Google Académico

Fathi Kazerooni, A., Bakas, S., Saligheh Rad, H. y Davatzikos, C. Firmas de imágenes de las características moleculares del glioblastoma: una revisión de la radiogenómica. Imágenes de resonancia magnética J 52, 54–69.

Artículo PubMed Google Académico

Binder, ZA et al. Las mutaciones del dominio extracelular del receptor del factor de crecimiento epidérmico en el glioblastoma presentan oportunidades para la obtención de imágenes clínicas y el desarrollo terapéutico. Cancer Cell 34, 163–177 e7, https://doi.org/10.1016/j.ccell.2018.06.006 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Bakas, S. et al. Detección in vivo de EGFRvIII en glioblastoma a través de la firma de imágenes de resonancia magnética de perfusión consistente con infiltración peritumoral profunda: el índice phi. Clin Cancer Res 23, 4724–4734, https://doi.org/10.1158/1078-0432.CCR-16-1871 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Zwanenburg, A. et al. La iniciativa de estandarización de biomarcadores de imágenes: radiómica cuantitativa estandarizada para fenotipado basado en imágenes de alto rendimiento. Radiología 295, 328–338, https://doi.org/10.1148/radiol.2020191145 (2020).

Artículo PubMed Google Académico

Rathore, S. et al. Caracterización in vivo no invasiva multiinstitucional de IDH, 1p/19q y EGFRvIII en glioma utilizando el kit de herramientas de fenómica de imágenes de neurocáncer (neuro-CaPTk). Neurooncol Adv 2, iv22-iv34, https://doi.org/10.1093/noajnl/vdaa128 (2020).

Artículo PubMed Google Académico

Clark, K. et al. El Archivo de Imágenes del Cáncer (TCIA): mantener y operar un depósito de información pública. J Digit Imaging 26, 1045–57, https://doi.org/10.1007/s10278-013-9622-7 (2013).

Artículo PubMed PubMed Central Google Académico

Pedano, N. et al. Datos radiológicos de la colección The Cancer Genome Atlas Low Grade Glioma [TCGA-LGG]. El archivo de imágenes del cáncer https://doi.org/10.7937/K9/TCIA.2016.L4LTD3TK (2016).

Bakas, S. et al. Avances en las colecciones de resonancia magnética del glioma Atlas del Genoma del Cáncer con etiquetas de segmentación expertas y características radiómicas. Sci Data 4, 170117, https://doi.org/10.1038/sdata.2017.117 (2017).

Artículo PubMed PubMed Central Google Académico

Scarspace, L. et al. Datos radiológicos de la colección The Cancer Genome Atlas Glioblastoma Multiforme [TCGA-GBM] [Conjunto de datos]. El archivo de imágenes del cáncer https://doi.org/10.7937/K9/TCIA.2016.RNYFUYE9 (2016).

Madhavan, S. et al. G-DOC: una plataforma de medicina de sistemas para oncología personalizada. Neoplasia 13, 771–83, https://doi.org/10.1593/neo.11806 (2011).

Artículo PubMed PubMed Central Google Académico

Bhuvaneshwar, K. et al. G-DOC Plus: una plataforma bioinformática integradora para la medicina de precisión. BMC Bioinformatics 17, 193, https://doi.org/10.1186/s12859-016-1010-0 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Gusev, Y. et al. El estudio REMBRANDT, una gran colección de datos genómicos de pacientes con cáncer cerebral. Sci Data 5, 180158, https://doi.org/10.1038/sdata.2018.158 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Gusev, Y. et al. El estudio REMBRANDT: una gran colección de datos genómicos de pacientes con cáncer cerebral (GSE108476). https://identifiers.org/geo:GSE108476 (2018)

Scarpace, L., Flanders, AE, Jain, R., Mikkelsen, T. & Andrews, DW Datos de REMBRANDT [Conjunto de datos]. El archivo de imágenes del cáncer https://doi.org/10.7937/K9/TCIA.2015.588OZUZB (2019).

Sayah, A. et al. Etiquetas de segmentación para la colección de imágenes de resonancia magnética de cáncer cerebral REMBRANDT. NITRC https://doi.org/10.25790/bml0cm.87 (2021).

Edgar, R., Domrachev, M. & Lash, AE Gene Expression Omnibus: Repositorio de datos de matriz de hibridación y expresión génica NCBI. Ácidos nucleicos Res 30, 207–10, https://doi.org/10.1093/nar/30.1.207 (2002).

Artículo CAS PubMed PubMed Central Google Scholar

Kahn, CE Jr., Carrino, JA, Flynn, MJ, Peck, DJ & Horii, SC DICOM y radiología: pasado, presente y futuro. J Am Coll Radiol 4, 652–7, https://doi.org/10.1016/j.jacr.2007.06.004 (2007).

Artículo PubMed Google Académico

Currie, S., Hoggard, N., Craven, IJ, Hadjivassiliou, M. & Wilkinson, ID Comprender la resonancia magnética: física básica de resonancia magnética para médicos. Postgrad Med J 89, 209–23, https://doi.org/10.1136/postgradmedj-2012-131342 (2013).

Artículo PubMed Google Académico

Abu Khalaf, N., Desjardins, A., Vredenburgh, JJ & Barboriak, DP Repetibilidad de la segmentación de imágenes automatizada con BraTumIA en pacientes con glioblastoma recurrente. AJNR Am J Neuroradiol 42, 1080–1086, https://doi.org/10.3174/ajnr.A7071 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Bakas, S. et al. GLISTRboost: combinación de segmentación, registro y modelado de crecimiento tumoral biofísico por resonancia magnética multimodal con máquinas de aumento de gradiente para la segmentación de gliomas. Brainlesion 9556, 144–155, https://doi.org/10.1007/978-3-319-30858-6_1 (2016).

Artículo PubMed PubMed Central Google Académico

Zeng, K. et al. Segmentación de gliomas en volúmenes de resonancia magnética multimodal preoperatoria y posoperatoria basada en un marco híbrido generativo-discriminativo. Brainlesion 10154, 184–194, https://doi.org/10.1007/978-3-319-55524-9_18 (2016).

Artículo PubMed Google Académico

Menze, BH et al. El punto de referencia de segmentación de imágenes de tumores cerebrales multimodales (BRATS). IEEE Trans Med Imaging 34, 1993–2024, https://doi.org/10.1109/TMI.2014.2377694 (2015).

Artículo PubMed Google Académico

Moon, TK El algoritmo de maximización de expectativas. 13 (1996).

Mang, A., Bakas, S., Subramanian, S., Davatzikos, C. y Biros, G. Modelado biofísico integrado y análisis de imágenes: aplicación a la neurooncología. Annu Rev Biomed Eng 22, 309–341, https://doi.org/10.1146/annurev-bioeng-062117-121105 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Bauer, S., Fejes, T., Reyes, M. Un filtro de extracción de cráneo para ITK. El diario Insight (2012).

Yushkevich, PA et al. Segmentación automática rápida de subcampos del hipocampo y subregiones del lóbulo temporal medial en resonancia magnética ponderada en T2 de 3 Tesla y 7 Tesla. Alzheimer y demencia: The Journal of the Alzheimer's Association 12, P126–P127 (2016).

Artículo Google Académico

Joshi, S., Davis, B., Jomier, M. & Gerig, G. Construcción de atlas difeomórfico imparcial para anatomía computacional. Neuroimage 23 (suplemento 1), S151–60, https://doi.org/10.1016/j.neuroimage.2004.07.068 (2004).

Artículo PubMed Google Académico

Yushkevich, PA et al. Segmentación de contorno activo 3D guiada por el usuario de estructuras anatómicas: Eficiencia y confiabilidad significativamente mejoradas. NeuroImagen 31, 1116–1128 (2006).

Artículo Google Académico

Yushkevich, PA et al. Segmentación guiada por el usuario de conjuntos de datos de imágenes médicas multimodales con ITK-SNAP. Neuroinformática 17, 83–102 (2019).

Artículo Google Académico

Davatzikos, C. et al. Kit de herramientas de fenómica de imágenes del cáncer: análisis de imágenes cuantitativas para diagnósticos de precisión y modelos predictivos de resultados clínicos. J Med Imaging (Bellingham) 5, 011018, https://doi.org/10.1117/1.JMI.5.1.011018 (2018).

Artículo Google Académico

Fathi Kazerooni, A. et al. Fenómica de imágenes del cáncer a través de CaPTk: predicción multiinstitucional de supervivencia libre de progresión y patrón de recurrencia en glioblastoma. JCO Clin Cancer Inform 4, 234–244, https://doi.org/10.1200/CCI.19.00121 (2020).

Artículo PubMed Google Académico

Pati, S. et al. El kit de herramientas de fenómica de imágenes del cáncer (CaPTk): descripción técnica. Brainlesion 11993, 380–394, https://doi.org/10.1007/978-3-030-46643-5_38 (2020).

Artículo PubMed PubMed Central Google Académico

Saima Rathore, SB et al. Brain Cancer Imaging Phenomics Toolkit (brain-CaPTk): una plataforma interactiva para el análisis cuantitativo del glioblastoma. En International MICCAI Brainlesion Workshop (2018).

Thakur, S. et al. Extracción de cerebro en resonancias magnéticas en presencia de glioma difuso: evaluación de desempeño multiinstitucional de métodos de aprendizaje profundo y capacitación robusta agnóstica de modalidad. Neuroimagen 220, 117081, https://doi.org/10.1016/j.neuroimage.2020.117081 (2020).

Artículo PubMed Google Académico

Thakur, SP et al. Extracción de cráneo de resonancias magnéticas de glioblastoma mediante aprendizaje profundo en 3D. Brainlesion 11992, 57–68, https://doi.org/10.1007/978-3-030-46640-4_6 (2019).

Artículo PubMed Google Académico

Ronneberger, O., Fischer, P. y Brox, T. U-net: Redes convolucionales para la segmentación de imágenes biomédicas. En Conferencia internacional sobre computación de imágenes médicas e intervención asistida por computadora 234–241 (Springer, 2015).

van Griethuysen, JJM et al. Sistema de Radiómica Computacional para Decodificar el Fenotipo Radiográfico. Cancer Res 77, e104–e107, https://doi.org/10.1158/0008-5472.CAN-17-0339 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Piradiómica. Características radiómicas. https://pyrradiomics.readthedocs.io/en/latest/features.html. (2016)

Sheller, MJ et al. Aprendizaje federado en medicina: facilitar colaboraciones multiinstitucionales sin compartir datos de pacientes. Informe científico 10, 12598, https://doi.org/10.1038/s41598-020-69250-1 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Nolden, M. et al. El kit de herramientas de interacción de imágenes médicas: desafíos y avances: 10 años de desarrollo de código abierto. Int J Comput Assist Radiol Surg 8, 607–20, https://doi.org/10.1007/s11548-013-0840-8 (2013).

Artículo PubMed Google Académico

Madhavan, S. et al. Rembrandt: ayudar a que la medicina personalizada se haga realidad a través de la investigación traslacional integradora. Mol Cancer Res 7, 157–67, https://doi.org/10.1158/1541-7786.MCR-08-0435 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Descargar referencias

Este trabajo fue financiado en parte por la subvención de apoyo del Lombardi Cancer Center (NCI P30 CA51008) y en parte por el Instituto Nacional del Cáncer (NCI) y el Instituto Nacional de Trastornos Neurológicos y Accidentes Cerebrovasculares (NINDS) de los Institutos Nacionales de Salud (NIH) , con los números de adjudicación NCI: U01CA242871, NCI: U24CA189523 y NINDS: R01NS042645. El contenido de esta publicación es responsabilidad exclusiva de los autores y no representa la opinión oficial de los NIH.

Estos autores contribuyeron por igual: Anousheh Sayah, Camelia Bencheqroun.

Hospital Universitario Medstar Georgetown, Washington, DC, EE. UU.

Anousheh Sayah

Centro de Innovación para Informática Biomédica (ICBI), Universidad de Georgetown, Washington, DC, EE. UU.

Camelia Bencheqroun, Krithika Bhuvaneshwar, Anas Belouali, Adil Alaoui, Subha Madhavan y Yuriy Gusev

Centro de Computación y Análisis de Imágenes Biomédicas (CBICA), Universidad de Pensilvania, Filadelfia, Pensilvania, EE. UU.

Spyridon Bakas, Chiharu Sako y Christos Davatzikos

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

AS: experiencia de radiólogo certificado por la junta, etiquetado realizado de exploraciones de resonancia magnética, siembra, verificación manual de todos los resultados de segmentación. CB: realizó la limpieza de datos, el análisis de segmentación de Bratumia y el análisis de datos de aprendizaje automático. KB: administrador de proyectos, administrador de datos, redacción y edición. AB: diseño de proyectos, líder del equipo de aprendizaje automático, análisis de datos de aprendizaje automático; SB, CS y CD: inicialización/preprocesamiento de datos, realizando análisis de segmentación GLISTRboost. AA: administración y finanzas de proyectos. SM: propietario de los datos del microarreglo y del número de copias. YG: experto senior en bioinformática, conceptualización y diseño de proyectos, IP, redacción y edición. Todos los autores participaron en la revisión del manuscrito.

Correspondencia a Krithika Bhuvaneshwar o Yuriy Gusev.

Subha Madhavan trabaja actualmente y es accionista menor en AstraZeneca, Gaithersburg, MD, EE. UU.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Sayah, A., Bencheqroun, C., Bhuvaneshwar, K. et al. Mejora de la colección de resonancias magnéticas de REMBRANDT con etiquetas de segmentación expertas y características radiómicas cuantitativas. Datos científicos 9, 338 (2022). https://doi.org/10.1038/s41597-022-01415-1

Descargar cita

Recibido: 12 Octubre 2021

Aceptado: 24 de mayo de 2022

Publicado: 14 junio 2022

DOI: https://doi.org/10.1038/s41597-022-01415-1

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

COMPARTIR