Soutenance de thèse de
de M. Noël Mzungu
Caractérisation et modélisation de la vulnérabilité du bâti face à l’aléa retrait-gonflement des argiles (RGA) à partir des sinistres assurantiels
Le retrait-gonflement des argiles (RGA) constitue un aléa géotechnique discret et difficilement perceptible, mais dont les impacts économiques sur le bâti sont majeurs. Depuis son intégration en 1989 dans le cadre du régime d’indemnisation des catastrophes naturelles (CatNat), il est devenu la première cause d’indemnisation en France. La sécheresse exceptionnelle de 2022 a causé près de 3,5 milliards d’euros de dommages, et les projections indiquent une hausse significative de ces coûts à l’horizon 2040 sous l’effet du changement climatique. Près de la moitié du territoire hexagonal est exposée à un aléa moyen à élevé, affectant plus de dix millions de logements. Malgré les progrès de la cartographie des sols par le BRGM, les dommages continuent d’augmenter, révélant une forte variabilité de la réponse du bâti à l’aléa. Des bâtiments soumis à des conditions géotechniques similaires peuvent présenter des niveaux de dommage très contrastés, en raison de facteurs structurels et environnementaux tels que la profondeur des fondations, la rigidité de la structure, la présence de végétation, le drainage, la pente ou les extensions. La compréhension de ces interactions sol–bâti constitue un enjeu central pour améliorer la prévention des désordres. Cette thèse s’inscrit dans cette logique en proposant une analyse empirique de la vulnérabilité du bâti face à l’aléa RGA, à partir de données réelles issues de 10 325 rapports d’expertise d’assurance produits entre 2000 et 2021. Ces documents, confidentiels, non structurés et hétérogènes, constituent une base empirique unique sur le comportement du bâti. Leur exploitation a reposé sur la conception d’un cadre méthodologique original fondé sur des modèles de langage (LLM) et une approche de RAG (Retrieval-Augmented Generation), permettant d’extraire, de normaliser et de structurer l’information contenue dans les textes. À partir de ces données, une échelle harmonisée de sévérité des dommages en cinq niveaux (D1 à D5, du dommage mineur au dommage sévère) a été élaborée et mise en relation avec les classes d’aléa et de vulnérabilité. Deux modèles complémentaires ont ensuite été développés : un modèle paramétrique, basé sur la fonction tangente hyperbolique (tanh), qui modélise la relation continue entre l’intensité de l’aléa et la sévérité des dommages ; et un modèle linéaire généralisé (GLM), qui mesure la contribution statistique des différents facteurs explicatifs. Combinés, ces modèles offrent une lecture à la fois physique et statistique de la vulnérabilité. Le score obtenu repose sur les dommages observés et est ensuite ajusté à l’aide de facteurs de modification du comportement (Behaviour Modifier Factors, BMF), tels que la pente, la présence d’un vide sanitaire ou la végétation, susceptibles d’amplifier ou d’atténuer les effets de l’aléa. Cette approche permet de traduire des situations complexes en un indicateur synthétique, robuste et interprétable. Bien que l’objectif principal de la thèse soit scientifique, le cadre CIFRE a ouvert la voie à des applications opérationnelles. Un prototype d’outil a ainsi été développé pour intégrer le score de vulnérabilité aux pratiques assurantielles et à la gestion territoriale. Connecté à la plateforme VIGIRISKS, il permet de cartographier la vulnérabilité, d’identifier les zones les plus sensibles et de soutenir la planification urbaine. En définitive, ce travail propose une nouvelle lecture de l’aléa RGA, envisagé non plus comme un simple problème de sol, mais comme le produit d’interactions complexes entre l’aléa, le bâti et son environnement. En s’appuyant sur des données empiriques et une approche combinant l’intelligence artificielle et l’expertise humaine, cette recherche contribue au passage d’une gestion réactive à une logique préventive, en faveur d’une plus grande résilience du parc bâti face aux sécheresses futures.
Mots-clés :
Retrait-gonflement des argiles • Vulnérabilité du bâti • Modélisation des dommages • Sinistres assurantiels • Sécheresse • Prévention des risques
Clay shrink–swell hazard constitutes a geotechnical process that is discrete and difficult to perceive, yet it generates major economic impacts on the built environment. Since its inclusion in the French natural disaster compensation scheme (Catastrophes Naturelles, CatNat) in 1989, this hazard has become the leading cause of insurance compensation in France. The exceptional 2022 drought alone resulted in approximately €3.5 billion in losses, and projections indicate a substantial increase in costs by 2040 under the effects of climate change. Nearly half of mainland France is exposed to moderate to high hazard levels, affecting more than ten million dwellings. Despite advances in soil mapping by the BRGM, damage continues to increase, revealing strong variability in building response to the hazard. Buildings subjected to similar geotechnical conditions may experience markedly different damage levels due to structural and environmental factors such as foundation depth, structural stiffness, vegetation, drainage conditions, slope, or poorly integrated extensions. Understanding these soil–structure interactions is therefore essential to improve damage prevention. This PhD thesis addresses this challenge by proposing an empirical assessment of building vulnerability to this hazard, based on real-world data derived from 10,325 insurance loss assessment reports produced between 2000 and 2021. These confidential, unstructured, and heterogeneous documents constitute a unique empirical record of building behaviour. Their analysis relied on an original methodological framework combining large language models (LLMs) with a Retrieval-Augmented Generation (RAG) approach to extract, normalise, and structure textual information. From these data, a harmonised five-level damage severity scale (D1–D5, ranging from minor to severe damage) was developed and linked to hazard and vulnerability classes. Two complementary models were subsequently implemented: a parametric model, based on the hyperbolic tangent function (tanh), which represents the continuous relationship between hazard intensity and damage severity; and a generalised linear model (GLM), which quantifies the statistical contribution of the explanatory factors. Combined, these models provide both a physical and statistical interpretation of vulnerability. The resulting vulnerability score is derived from observed damage and subsequently adjusted using Behaviour Modifier Factors (BMF), such as slope, crawl space presence, or vegetation, which may amplify or mitigate hazard effects. This framework translates complex situations into a clear, robust, and interpretable indicator. Although the primary objective of the thesis is scientific, the CIFRE framework enabled the development of operational applications. A prototype tool was designed to integrate the vulnerability score into insurance practices and territorial risk management. Connected to the VIGIRISKS platform, it allows vulnerability mapping, identification of the most sensitive areas, and support for urban planning. Overall, this research offers a renewed interpretation of clay shrink–swell hazard — not merely as a soil-related issue but as the outcome of complex interactions among the hazard, buildings, and their environment. By combining empirical data, artificial intelligence, and expert knowledge, this work contributes to a shift from reactive damage management towards preventive strategies, enhancing the resilience of the building stock to future droughts.
Keywords:
Clay shrink–swell hazard • Building vulnerability • Damage modelling • Insurance losses • Drought • Risk prevention
Quand : Vendredi 29 mai 2026 à 14 heures
Où: Salle des Actes – Site Saint Charles (Université de Montpellier Paul-Valéry)