Soutenance de thèse de doctorat de Timothy Bell

Timothy Bell soutiendra sa thèse de doctorat le lundi 23 juin 2025 à 14h00 au laboratoire i3S dans la salle 007 du bâtiment Euclide B.
La thèse intitulée « Réussite initiale dans les études supérieures : prédiction et représentation graphique des résultats » a été réalisée dans le pôle SPARKS sous la direction de Johan MONTAGNAT et sous la co-direction de Christel DARTIGUES-PALLEZ.
Résumé :
Cette thèse aborde le défi de la prédiction de la réussite étudiante durant la première année de l'enseignement supérieur. Les méthodes traditionnelles d'évaluation des performances étudiantes échouent souvent à dresser un tableau complet, car elles se concentrent sur les notes, alors que leur évaluation académique est plus complexe. Nous allons au-delà de la simple utilisation de données telles que les notes, et explorons le potentiel de l'intégration de données qualitatives telles que les commentaires des enseignants. Notre travail apporte plusieurs contributions. Nous établissons un point de référence à l'aide de modèles de Forêts Aléatoires entraînés sur des données numériques et explorons diverses techniques d'augmentation basées sur la nature des données. Nous mettons ensuite en œuvre différentes méthodes pour extraire des informations significatives des commentaires des enseignants et les inclure dans le processus de prédiction. Le cœur de cette thèse réside dans le développement de nouvelles méthodes qui intègrent ces deux sources de données liées dans un modèle unifié. Nous proposons trois méthodes différentes : une approche de modèle post-entraîné qui modifie la prédiction d'arbres d'un modèle pré-entraîné ; une approche pré-entraînée qui utilise une structure d'arbres parallèles entraînés sur le sentiment textuel pour valider les prédictions faites par un arbre primaire ; et une dernière méthode qui incorpore de multiples aspects de sentiment extraits du commentaire pour une prise de décision plus nuancée. Afin d'améliorer l'interprétabilité, nous développons un outil de visualisation pour les modèles de Forêts Aléatoires. Les résultats expérimentaux démontrent que les données qualitatives, en particulier lorsqu'elles sont adaptées grâce à nos modèles hybrides, améliorent la prédiction de la réussite étudiantine par rapport aux modèles s'appuyant uniquement sur des données numériques.