banner
Maison / Nouvelles / Modèle bayésien de prédiction du risque de mortalité par cancer colorectal grâce à l'intégration de données clinicopathologiques et génomiques
Nouvelles

Modèle bayésien de prédiction du risque de mortalité par cancer colorectal grâce à l'intégration de données clinicopathologiques et génomiques

Jun 05, 2024Jun 05, 2024

npj Precision Oncology volume 7, Numéro d'article : 57 (2023) Citer cet article

1373 Accès

3 Altmétrique

Détails des métriques

La stadification systématique des métastases ganglionnaires (TNM) du cancer colorectal est imparfaite pour prédire la survie en raison de l'hétérogénéité pathobiologique de la tumeur et de l'évaluation imprécise de la propagation de la tumeur. Nous avons exploité les arbres de régression additifs bayésiens (BART), une technique d'apprentissage statistique, pour analyser de manière exhaustive les caractéristiques tumorales spécifiques au patient afin d'améliorer la prédiction pronostique. Sur 75 variables clinicopathologiques, immunitaires, microbiennes et génomiques chez 815 patients de stade II à III au sein de deux études de cohorte prospectives à l'échelle des États-Unis, le modèle de risque BART a identifié sept prédicteurs de survie stables. Les stratifications du risque (risque faible, risque intermédiaire et risque élevé) basées sur la survie prévue par le modèle étaient statistiquement significatives (rapports de risque 0,19 à 0,45, contre risque plus élevé ; P < 0,0001) et ont pu être validées en externe à l'aide de l'Atlas du génome du cancer (TCGA). ) données (P = 0,0004). BART a démontré la flexibilité du modèle, l'interprétabilité et des performances comparables ou supérieures à d'autres modèles d'apprentissage automatique. Les analyses bioinformatiques intégrées utilisant BART avec des facteurs spécifiques à la tumeur peuvent stratifier de manière robuste les patients atteints d'un cancer colorectal en groupes pronostiques et être facilement appliquées à la pratique clinique de l'oncologie.

Le cancer colorectal se développe dans le contexte d’une interaction complexe entre l’hôte, les microbes et les cellules néoplasiques du microenvironnement intestinal local1. La prédiction de la survie basée uniquement sur la stadification des métastases ganglionnaires tumorales (TNM) est imparfaite en raison de l'hétérogénéité de la tumeur ainsi que d'une évaluation inexacte de la propagation de la tumeur. Chez les patients de stade II/III, l'évaluation des risques a des implications cruciales sur l'utilisation de la chimiothérapie adjuvante, ainsi que sur l'intensité et la durée du traitement2,3. Par conséquent, des analyses multivariées à grande échelle des facteurs contribuant à la progression tumorale sont nécessaires pour mieux prédire les résultats de chaque patient. De plus en plus de preuves indiquent que des facteurs tels que le statut d'instabilité des microsatellites tumoraux (MSI), la mutation BRAF, la quantité de Fusobacterium nucleatum et les infiltrats de lymphocytes T sont des biomarqueurs pronostiques pertinents dans le cancer colorectal4,5,6. Compte tenu de ces résultats, nous avons émis l’hypothèse que l’intégration des caractéristiques tumorales et immunitaires avec la classification TNM pourrait améliorer un modèle de prédiction pronostique du cancer colorectal.

Pour utiliser les variables clinicopathologiques disponibles dans la prévision de la survie, nous avons mis en œuvre un modèle de classification d'ensemble par somme d'arbres, les arbres de régression additive bayésienne (BART). Les méthodes d'ensemble permettent une modélisation flexible des relations non linéaires et interactives entre les prédicteurs et les variables de résultat tout en maintenant l'interprétabilité du modèle grâce à des mesures d'importance variable7, et ont donné des résultats prometteurs en matière de classification des sous-types moléculaires de tumeurs, de réponse thérapeutique et de prédiction de la survie pour plusieurs types de cancer8,9,10. BART étend le paradigme classique de l'arbre d'ensemble en introduisant une distribution probabiliste sous-jacente à un modèle de somme d'arbres, permettant une régularisation inhérente. BART a démontré des performances favorables et des capacités de sélection de variables supérieures par rapport à d'autres méthodes d'apprentissage automatique, notamment la forêt aléatoire (RF), l'augmentation de gradient (GB), l'opérateur de retrait et de sélection le moins absolu (LASSO), la spline de régression adaptative multivariée et les réseaux de neurones artificiels. (ANN)11, et a fourni des résultats prometteurs dans des études antérieures sur le profilage protéomique, l'analyse du réseau de régulation génique et l'analyse de survie non paramétrique12,13,14.

Dans cette étude, nous avons construit un modèle BART intégrant des composants de stade TNM avec d'autres facteurs pour améliorer la stratification du risque de mortalité chez les patients de stade II/III, en utilisant une base de données de patients atteints d'un cancer colorectal dans deux grandes études de cohortes prospectives, à savoir la Nurses' Health Study (NHS ) et l'étude de suivi des professionnels de la santé (HPFS). Nous avons confirmé les bonnes performances du modèle BART, indiquées par la courbe des caractéristiques de fonctionnement du récepteur (ROC) par rapport aux méthodes RF, GB et d'autres méthodes d'apprentissage statistique, et validées en externe à l'aide de l'ensemble de données The Tumor Genome Atlas (TCGA). Nous avons examiné les variables qui contribuent aux modèles BART en termes de stabilité de signification par test de permutation sur une validation croisée quintuple, ainsi que de dépendance partielle des résultats sur des variables importantes. Notre étude a démontré que les modèles d'ensemble bayésiens peuvent intégrer une variété de facteurs spécifiques à la tumeur et au patient pour améliorer la prévision de la survie et peuvent servir d'outils cliniques pour évaluer le risque individuel de mortalité par cancer, ajoutant ainsi de la précision à la gestion optimale des patients.