Information
Thesis supervisor :
Start year :
End 2016
University :
Université Constantine 2
Viva defense
Viva defense date :
20 February 2024
Jury members :
Prof. Benmerzoug Djamel
Prof. Bouramoul Abdelkrim
Prof. Talbi Hichem
Prof. Melkemi Kamal Eddine
Prof. Moussaoui Abdelouahab
Prof. Meshoul Souham
Prof. Amrane Mounira
Details
Titre :
Modèles d'apprentissage automatique pour la génétique et la génomique dans le diagnostic du cancer et la découverte de marqueurs moléculaires

Résumé :

La génomique, la génétique et la biologie moléculaire ont connu une avancée considérable au cours des dernières décennies. L’entreprise de comprendre le code génétique caché au sein de la partie la plus complexe des génomes humains a été considérée comme le point de revolution dans le diagnostic moléculaire. Les dévelopment exceptionnelles dans les technologies de séquençage du génome et les plateformes biologiques associées ont façonné la compréhension d’un large éventail de maladies critiques, notamment le cancer. La recherche visant à comprendre et à traiter le cancer a franchi des étapes majeures qui ont amélioré sa compréhension, son diagnostic et son traitement. L’utilisation des technologies de séquençage du génome et la génération de données omiques dans le cancer ont notamment été caractérisées par plusieurs facteurs, tels que l’évolutivité des données en termes de gènes expérimentés et d’instances moléculaires, le manque de patients dans les essais cliniques et la relation complexe et intriquée entre les données à différents niveaux omiques. Avec l’avancée des technologies de séquençage, l’intelligence artificielle connaît actuellement son âge d’or, où l’apprentissage automatique, en particulier l’apprentissage profond, devient de plus en plus puissant pour gérer les formes les plus complexes de données dans divers domaines de connaissances, y compris le cancer. Cette combinaison entre les données de séquençage du cancer et les outils d’apprentissage automatique pour le diagnostic moléculaire, la surveillance et le traitement est désignée sous le nom de médecine de précision. Ce domaine se caractérise par la combinaison de domaines interdisciplinaires afin d’établir des diagnostics personnalisés, des protocoles de traitement et des outils, tout en introduisant et en révélant des signatures moléculaires parmi les caractéristiques génomiques.

Pour cela, cette thèse présente différentes solutions pour les problèmes complexes liés à la recherche sur le cancer et à l’apprentissage automatique pour le diagnostic et la découverte de biomarqueurs. On propose également un modèle intégratif qui combine des données génomiques, génétiques, protéomiques et cliniques avec des modèles d’apprentissage automatique et des plateformes biologiques pour le diagnostic du cancer et l’identification de signatures moléculaires. Cette thèse peut être utile aux jeunes chercheurs souhaitant débuter leurs recherches en cancérologie et en médecine de précision avec peu de connaissances en biologie.


Mots clés :
Classification du cancer Technologies de nouvelle génération Apprentissage automatique Apprentissage profond Découverte de biomarqueurs Bioinformatique Médecine personnalisée Découverte de biomarqueurs in silico
Title:
Machine learning models for genetics and genomics in cancer diagnosis and molecular marker discovery

Abstract:

Genomics, genetics, and molecular biology have notice a tremendous advance in the last decades, the undertaking challenge of understanding the genetic code hidden within the most intricate part of human genomes was deemed as the breaking points in molecular diagnosis.

The exceptional advances in genome sequencing technologies and related biological platforms have shaped the perception of a wide range of critical diseases, including cancer. The inquiries of understanding and handling cancer have noticed great stopping points that improved its understanding, diagnosis, and treatment. The use of genome sequencing technologies, and omic data generation in cancer have particularly been characterized by several factors, data scalability in terms of experimented genes, and molecular instances, lack of patients within clinical experiments, and the complex intricate relation between data within different levels of omics. Along with the advancement of sequencing technologies, artificial intelligence is currently lives in its golden era, where machine learning, specifically deep learning are becoming more and more powerful in handling the most complicated forms of data within several knowledge domain, including cancer. This combination between cancer sequencing data, and machine learning tools for molecular diagnosis, monitoring, and treatment is addressed as precision medicine. This domain, is characterized by the combination between intedisplinary fields in order to establish personalized diagnosis, treatment protocols, and tools, as well as introducing and revealing molecular signatures amongst the genomic features.

To this end this thesis introduces different solutions for the intricate problems regarding cancer research and machine learning for diagnosis, and biomarker discovery. As well as, it provides an integrative framework that combine genomic, genetic, proteomic, and clinical data with machine learning models, and biological platforms, for cancer diagnosis, and molecular signatures identification. This thesis can be useful for young researchers, who want to start their research in cancer, and precision medicine with a little background in biology.


Keywords:
Cancer classification Next generation technologies Machine learning Deep; learning Biomarker discovery Bioinformatis Personalised medicine In-silico biomarker discovery.