Dossier de proposition · École des Ponts ParisTech

Contrôler le taux de fausses alarmes
en surveillance d'ouvrages

Un framework statistique de décision séquentielle à faux-positif contrôlé pour l'OMA en environnement non-stationnaire (EOV) — avec incertitude par prédiction conforme.

Adressé aux équipes mécanique & durabilité des structures (Laboratoire Navier) · 13 juin 2026, mis à jour le 15 juin 2026 (premiers résultats réels, IC)
Pont de pierre en clair-obscur, lumière dorée — à la Rembrandt
Comment lire ce dossier. Il est en étages. L'essentiel pour un premier contact (ci-dessous, ≈ 2 pages) suffit à juger s'il y a matière à échanger. La Partie 0 reprend l'idée en langage simple. À partir de la Partie 2, on entre dans le fond scientifique, sans rien édulcorer. Le dossier complet (méthode, ~17 jeux mesurés, limites) est en annexe ; vous pouvez sauter à la Partie 3 (le cœur méthode) ou à la Partie 5 (ce qu'on propose).
L'essentiel pour un premier contact

Si vous ne lisez qu'une chose

(Le reste — méthode détaillée, ~17 jeux mesurés avec IC, limites — est en annexe.)

1. Ce que nous proposons. Une couche logicielle SHM frugale qui se branche par-dessus une instrumentation existante : OMA (analyse modale opérationnelle) en front-end → décision séquentielle sur le résidu → taux de fausses alarmes (FP) contrôlé et mesuré, avec une marge d'incertitude calibrée par prédiction conforme. Ce n'est pas une percée algorithmique : c'est un apport méthodologique — un framework de contrôle du FP pour l'OMA en environnement non-stationnaire (EOV), assemblé proprement à partir d'outils que votre communauté connaît déjà (EVT, CUSUM, change-point, Mahalanobis), plus la prédiction conforme.

2. Premiers résultats — réels, datés, mais NON consolidés. Front-end OMA (SSI-cov durci par MAC) + couche de décision, testés sur ~17 jeux publics réels avec protocole anti-fuite (splits fit/cal/held disjoints) et IC partout. La détection de changements globaux fonctionne sur plusieurs structures ; plusieurs cas échouent et nous les rapportons. Statut sans fard : solide mais pas prêt pour un envoi formel (manque un pipeline unique reproductible, un durcissement EOV, un re-audit).

3. Le verrou scientifique. Tenir le FP hors de la plage saisonnière apprise. Notre correction EOV n'extrapole pas : sur un 2ᵉ ouvrage (8 mois, 9→34 °C), en chronologique strict, le FP explose (56 %) car l'hiver n'a jamais été vu. C'est le problème ouvert de la correction EOV / généralisation hors-saison / faux positifs de toute la communauté SHM. Nous ne prétendons pas l'avoir résolu.

4. Ce que nous demandons — pas un achat, un audit. (a) un audit méthodologique de notre code et protocole ; (b) un jeu de données réel sur lequel nous confronter ; (c) si l'essai est concluant, une suite à définir ensemble, sans rien préjuger de sa forme. Aucun prix, aucune PI bloquante : on donne d'abord, le reste vient après.

Notre demande tient en une phrase : « Nous ne demandons pas qu'on croie à la méthode ; nous demandons qu'on nous aide à la réfuter proprement sur des ouvrages réels. »

5. Pour aller plus loin. Les Parties 1 à 6 (annexe) détaillent la vision, la boîte à outils, les mesures jeu par jeu avec IC et échecs, l'intégration métier et les modalités. Tout est reproductible et disponible en audit fermé sur demande.

Partie 0 · L'idée en une page

Pour aller vite

Un pont ne s'effondre presque jamais d'un coup. Il prévient. Quand un appui se bloque, qu'une pile tasse, qu'une fondation s'affouille ou qu'un ancrage glisse, la raideur globale de l'ouvrage change — et ses fréquences propres, sa réponse au trafic et à la température, dérivent lentement. C'est un signal faible, noyé dans le bruit de la météo et du trafic, mais c'est un signal — et il peut apparaître avant qu'un seuil réglementaire ne soit franchi.

Note d'origine, une phrase : nous venons d'un tout autre domaine — la détection de signaux faibles dans des relations humaines, où le même problème statistique se pose. Pour vous, cette origine n'a aucune importance ; seul compte ce qui suit.

Depuis (mise à jour du 15/06/2026), nous avons fait le pas qui compte pour vous : nous avons construit un front-end d'analyse modale opérationnelle (OMA) et une couche de décision à faux-positif contrôlé, et nous les avons testés sur ~17 jeux de données réels d'ouvrages. Honnêtement : le contrôle du faux-positif sous variabilité saisonnière n'est démontré, sur le cas difficile (modes fortement thermosensibles), que sur un seul ouvrage (un pont ferroviaire suivi 15 mois — et sur un renforcement daté, pas un dommage) ; notre tentative de réplication sur un 2ᵉ ouvrage (suivi 8 mois sous 9→34 °C) échoue dès qu'on évalue en chronologique strict (la correction environnementale linéaire n'extrapole pas à la saison froide jamais vue) — nous ne prétendons pas avoir levé le « n=1 » ; en revanche la détection de changements globaux fonctionne sur plusieurs structures indépendantes, et plusieurs cas échouent — nous les rapportons aussi. Statut, sans fard : la matière est solide mais pas encore consolidée pour un envoi formel (pipeline unique reproductible, durcissement de la correction environnementale, re-audit). Nous ne venons pas « vendre un résultat » : nous partageons un travail réel, daté, avec ses intervalles de confiance et ses échecs, pour le confronter à vos ouvrages.

L'angle qui nous amène à vous : transformer un résidu (ce que vos méthodes de normalisation exposent déjà) en décision séquentielle datée, à FP mesuré et borné, outillée par la statistique des transitions critiques (Scheffer et al., Nature, 2009). Côté ouvrages, cette mathématique est établie (valeurs extrêmes sur le Z24, b-value de Gutenberg-Richter sur la fissuration, CUSUM sur les barrages).

Ce que nous apportons n'est pas un capteur (vous en avez), ni une IA générique : une couche logicielle d'alerte précoce, explicable et frugale qui se branche par-dessus vos mesures existantes, vise à détecter la dérive lente avant le seuil, et donne une marge d'incertitude honnête (prédiction conforme) — avec une exigence que peu s'imposent : mesurer et afficher le taux de fausses alertes sur des ouvrages sains.

Ce que nous demandons n'est pas un achat. C'est une conversation, un audit méthodologique et, si l'idée vous parle, un jeu de données réel pour faire la seule chose qui compte : prouver, ou réfuter, sur vos ouvrages.

Qui nous sommes : une petite association, portée par un économiste (pas un ingénieur génie civil — nous l'assumons), qui utilise l'IA de façon transparente, et qui a construit et mesuré honnêtement un détecteur de signaux faibles. En humilité et en force de proposition.

Partie 1Qui parle, et pourquoi la transparence d'abord

Avant la science, l'honnêteté sur nous-mêmes — un dossier de transfert ne vaut que si l'on sait d'où il vient et ce qu'il ne sait pas faire.

La chose la plus précieuse que nous puissions offrir à un chercheur n'est pas une promesse, c'est un travail que vous pouvez auditer — y compris ses échecs.

Partie 2Comment nous voyons les choses (la vision)

Un système qui se dirige vers une bascule — un pont, un matériau, un écosystème, une relation — perd d'abord sa capacité à revenir en arrière. Cette perte de réversibilité est mesurable, et elle précède la rupture.

Ce n'est pas une métaphore. La théorie des transitions critiques (Scheffer et al., Nature 2009, « Early-warning signals for critical transitions ») établit des signatures génériques à l'approche d'un point de bascule, indépendantes de la matière :

  1. L'autocorrélation (AR1) monte vers 1 — le système met de plus en plus longtemps à revenir à l'équilibre (critical slowing down). ⚠️ Honnêteté de cadrage : nous ne prétendons PAS observer l'AR1→1 sur des ouvrages civils — c'est établi en écologie et sur certains matériaux en labo, pas démontré (à notre connaissance) sur une structure de génie civil en service, et nous n'en faisons pas un argument. En pratique sur un ouvrage, nous mesurons plus modestement un décalage des fréquences propres / de la réponse modale trahissant un changement de raideur globale ou de conditions aux limites (appui bloqué, tassement, affouillement, glissement d'ancrage, renforcement).
  2. La variance augmente — les fluctuations s'amplifient.
  3. La distribution des événements se déforme — la b-value de Gutenberg-Richter baisse : la part des événements de forte magnitude croît. Établi pour les séismes et la fissuration des matériaux (émission acoustique).
  4. La réversibilité disparaît — au-delà d'un seuil γ*, le système ne revient plus.

Notre objet n'est donc pas « cet événement est-il grave ? » mais « à quelle distance de γ* sommes-nous, et dans quel sens dérivons-nous ? » — un déplacement du seuil (déjà le danger) vers la dérive vers le seuil (qui donne du temps).

Un mot sur la posture, parce qu'elle change tout côté gestionnaire. Nous ne parlons pas « le pont va s'effondrer » : ce registre déclenche un réflexe défensif (« je préfère ne pas savoir, je n'ai pas le budget de réparer » — blame avoidance, Weaver 1986). Nous parlons carnet de santé longitudinal de l'ouvrage : « il suit sa ligne de comportement normale sous l'effet du trafic et de la température ; voici la preuve datée que vos choix de maintenance tiennent. » Pas une liste de pathologies — un sceau de vigilance présentable en audit budgétaire.
Le coût opérationnel du faux positif, dit honnêtement. Un FP de 6 % sur 15 mois représente environ une fausse alarme tous les 2-3 mois par ouvrage. À l'échelle d'un parc, ce volume a un coût réel — la désensibilisation des équipes (« encore une alerte qui ne mène à rien »). C'est exactement pour cela que la sortie est un drapeau pour inspection ciblée et priorisation, jamais une alarme automatique : l'outil aide à hiérarchiser les inspections, il ne déclenche pas de procédure tout seul. Baisser ce FP sans perdre le signal est un objectif de recherche en soi.

Partie 3Le fond scientifique (sans édulcorer)

3.1 La boîte à outils — et le fait qu'elle est déjà la vôtre

Nous ne réinventons aucune mathématique. Nous industrialisons en produit explicable une boîte à outils que la littérature SHM utilise déjà :

OutilRôleAncrage SHM établi
EVT / GPD, peak-over-thresholdProbabilité d'extrême, seuils d'alerte de dommage précoceÉtabli sur le pont de référence Z24
CUSUMPetites dérives persistantesDétection précoce sur barrages
Change-point / PELTRupture de régime structurelSéries d'auscultation
AR1 / variancePerte de réversibilité avant basculeTransitions critiques ; émission acoustique
b-value Gutenberg-RichterDéformation de la distribution des magnitudesSismologie et rupture de matériaux
Survie / HawkesTemps jusqu'à défaillance ; auto-excitationFatigue, micro-événements
Prédiction conformeMarge d'incertitude calibréeApport différenciant (rare en SHM opérationnel)
Détection séquentielle (NP / SPRT)Intégrer puis décider une fois, FP contrôléCœur de notre méthode

Notre valeur n'est pas la maths — c'est l'assemblage explicable, frugal, et la discipline de validation. Là où les solutions existantes proposent du capteur + un tableau de bord à seuils fixes, nous transformons un résidu (que vos méthodes de normalisation exposent déjà) en décision datée, quantifiée et honnêtement incertaine.

3.2 Détection séquentielle — pourquoi « drapeau, pas verdict » est mathématique

Quatre champs indépendants (radar, contrôle qualité, sismologie, statistiques) convergent : il ne faut pas classer chaque mesure puis voter ; il faut intégrer la série entière puis décider une seule fois (Neyman-Pearson ; CUSUM ; SPRT de Wald). Optimal au sens du rapport de vraisemblance, avec un contrôle natif du taux de fausses alarmes.

Le SPRT montre qu'au niveau d'un cas individuel, la certitude exige un nombre d'observations prohibitif ou un coût en FP/délai. On ne peut donc honnêtement livrer qu'une alerte calibrée, jamais un jugement définitif. « Drapeau, pas verdict » n'est pas une prudence ajoutée : c'est imposé par la structure du problème. L'outil éclaire, l'ingénieur décide.

Conséquence sur le vocabulaire (doctrine de responsabilité). Pour ne jamais endosser le rôle d'un bureau d'études — et la responsabilité en cascade qui va avec — nous ne produisons jamais « structure validée » ni « aucun risque détecté », mais un indice de déviation (« écart statistique au comportement normal ») assorti d'un geste d'observation recommandé (« cet indice justifie une inspection visuelle par un ingénieur qualifié »). Contractuellement : outil d'aide à la décision ; l'ingénieur reste seul qualifié pour statuer sur l'état mécanique réel (cohérent Eurocodes / Cerema). Et la validation par un tiers reconnu (Cerema, ou un laboratoire comme le vôtre) est précisément ce qui manque à ce type d'outil : nous y voyons une raison de travailler ensemble, pas un obstacle.

3.3 Ce que nous avons réellement construit et mesuré (transparence totale)

Deux choses à ne jamais confondre. (A) ce que nous avons mesuré : un classifieur de texte explicable (ado-FR), statique. (B) ce que nous proposons d'instrumenter sur vos ouvrages : la dérive dans le temps (early-warning signals). (A) ne prouve pas (B)vérifié dans notre propre code (13/06) : le moteur (A) est aveugle à l'ordre (mélanger les messages ne change que ~4 % des décisions) et lit le contenu (features par lexiques). Il ne mesure donc pas la dynamique temporelle, et nous ne vous le présentons pas comme une preuve de détection temporelle.

Ce que (A) prouve, en revanche — et c'est ce qui devrait vous intéresser : nous savons construire un détecteur explicable, le mesurer honnêtement, et publier ce qui ne marche pas. Les chiffres de ce détecteur appartiennent à notre branche jumelle humaine (du texte) ; nous ne les transposons pas à un ouvrage — ce serait une erreur de catégorie. Ce qui compte ici, c'est la discipline : corpus de contrôle, taux de fausses alertes mesuré, statut de chaque chiffre affiché.

Côté (B) — la dimension qui compte pour un ouvrage — nous avons désormais des résultats mesurés sur données réelles de structures (mise à jour 15/06/2026), avec intervalles de confiance et un protocole anti-fuite (fit/cal/held disjoints, FP sur sain held-out, aucun canal choisi avec le label). Nous avons bâti un front-end OMA (SSI-cov, stabilisation durcie MAC+amortissement, sans injection des modes publiés) + une couche de décision (Mahalanobis + prédiction conforme), testés sur ~17 jeux publics consolidés :

Recall de détection par structure — on voit le global, on rate la fissure locale
0%100% Portique 4 ét. (raideur) 100% Affouillement (3 struct.) 89% Gradin 10 états 85% Z24 tassements de pile ~75% Fissure locale (Vänersborg) 33%
En rouge : la vraie fissure locale — cas-cible majeur que nous ratons à FP contrôlé. Limite assumée.
Faux positif : tenu sur 1 ouvrage, échoue sur le 2ᵉ → c'est un n=1
cible 5% échelle 0–60% KW51 (cas facile) 6,0% openlab (2ᵉ ouvrage) 56%
La correction environnementale linéaire n'extrapole pas hors-saison. Le « 7,2 % » initial était un artefact, rétracté.
Z24, selon le type de dommage — changement global vu, effet local raté
0%100% Tassement de pile (global) ~75% Rupture de torons (local) ~5%
Cohérent avec notre cible réelle : des changements de conditions aux limites / de raideur globale — pas la rupture locale.
Comment lever le n=1 proprement (le protocole que nous proposons). La seule preuve recevable du contrôle du FP serait de le mesurer sur ≥ 5 ouvrages sains indépendants, chacun disjoint des données de calage, et de reporter le FP sur chacun (pas un agrégat), idéalement sur des ouvrages thermosensibles couvrant un cycle annuel complet. Tant qu'on n'a pas cela, la doctrine honnête reste : FP démontré sur un cas facile à n=1, à répliquer. C'est l'objet de la collaboration que nous cherchons.

La mathématique temporelle (CSD / AR1 / CUSUM / EVT) est établie dans votre littérature ; notre apport = l'assemblage discipliné + la mesure honnête du FP + l'incertitude calibrée + ces premières mesures réelles. Mais ces résultats ne sont pas encore consolidés pour une publication (pipeline unique reproductible, durcissement de l'EOV, re-audit) : c'est ce que nous proposons de finaliser avec vous (Proposition 1), idéalement sur vos ouvrages.

Le vrai différenciateur, et l'angle d'un papier co-signé : la prédiction conforme. Au lieu d'un seuil binaire, chaque sortie est assortie d'une région de confiance à couverture garantie (au sens distribution-free de la conformal prediction) — « l'état réel est dans cet intervalle avec une probabilité ≥ 1−α, sans hypothèse sur la loi des résidus ». C'est rare en SHM opérationnel, ça se marie naturellement avec la décision séquentielle, et c'est la contribution la plus publiable de l'ensemble : une couverture d'incertitude calibrée et auditable sur des indicateurs modaux d'ouvrages réels.

3.4 La leçon que nous avons payée — notre vrai apport méthodologique

Sans corpus de contrôle, une « détection » ne vaut rien. Montrer « notre algorithme aurait alerté N jours avant » sur un seul cas connu est un piège : c'est le sophisme du procureur (Boettiger & Hastings, Proc. R. Soc. B, 2012) — du surapprentissage. La seule preuve qui tienne est le contre-exemple : un faible taux de fausses alertes mesuré sur des ouvrages SAINS, sur la même période.

Nous avons appris cela à nos dépens, au point d'en faire une règle absolue — et de l'appliquer à nos propres mesures d'ouvrages : chaque chiffre ci-dessus a son taux de fausses alertes mesuré sur du sain held-out, avec intervalle de confiance. Nous publions aussi nos résultats négatifs : le dommage brutal et global (perte de raideur, tassement, affouillement) se détecte bien, mais le dommage local et voilé — la fissuration naissante — reste hors de portée (la vraie fissure de Vänersborg ratée à 33 %, l'état le plus subtil du gradin) ; et le FP@5 % n'est calibrable de façon fiable qu'au-delà d'environ 60 enregistrements sains.

Et nous poussons l'honnêteté méthodologique d'un cran de plus, parce qu'un relecteur le verra : l'IC binomial que nous affichons sur le FP d'un ouvrage n'a pas de validité fréquentiste stricte, car les fenêtres d'un même ouvrage sont temporellement corrélées — l'IC est donc optimiste. Conséquence assumée : un FP mesuré sur un seul ouvrage, même avec un joli IC, ne démontre rien de général. Le protocole correct, que nous proposons de mener avec vous : ≥ 5 ouvrages sains indépendants, disjoints du calage, FP reporté ouvrage par ouvrage — la seule façon de transformer un n=1 en preuve. Une équipe qui affiche ses échecs, ses faux positifs ET les limites de ses propres intervalles de confiance est celle avec qui un laboratoire de structures peut travailler en confiance.

Partie 4Comment cela s'intègre dans votre métier

Nous avons regardé ce que fait l'ENPC, honnêtement et de l'extérieur. Deux ancrages concrets :

  1. Le Laboratoire Navier (UMR 8205, unité commune ENPC / Université Gustave Eiffel / CNRS) affiche parmi ses axes la « sécurité et durabilité des structures » et les « infrastructures de transport ». Notre couche s'y inscrit comme brique d'analyse temporelle, pas comme objet concurrent.
  2. L'ENPC a déjà publié, avec OSMOS Group, une méthode probabiliste d'analyse de fatigue à partir de mesures de déformation sur ponts (règle de Miner probabiliste, modèle Weibull-Basquin ; enpc.hal.science/hal-04632581). La donnée et la culture probabiliste sont déjà là. ⚠️ Pour éviter un contre-sens : notre outil n'est PAS un « complément à la règle de Miner ». Miner décrit l'accumulation linéaire de fatigue, sans ralentissement critique ; nous détectons un autre objet, un changement de raideur globale / de conditions aux limites (changement de régime). Deux versants distincts et non concurrents de la surveillance.

Et nous ne marchons sur les plates-bandes de personne. Nous ne concurrençons ni Sixense / OSMOS / Cementys (capteurs + plateforme), ni Fugro (prestation lourde) : nous sommes la couche d'analyse explicable, complémentaire de leur matériel et de vos méthodes. Frontal = absurde ; complément = utile.

Votre travail (déjà fait)Notre complémentCe que ça ajoute
Mesures de déformation / auscultationIngestion des mêmes séries, on-premiseAucune nouvelle instrumentation
Fatigue probabiliste (Miner / Weibull-Basquin) — versant cumul de fatigueDétection de changement de régime (CUSUM, change-point sur la réponse modale) — versant raideur globale / conditions aux limitesDeux objets distincts et complémentaires : la fatigue cumule, notre couche repère un changement de raideur/d'appui. Pas un complément à Miner.
Seuils / résidus après normalisationDétection séquentielle sur le résiduTransforme un résidu en décision datée
Estimation d'un étatPrédiction conformeMarge d'incertitude calibrée, audit-able
(souvent) FP non quantifiéMesure du FP sur ouvrages sainsLa preuve qui tient devant un comité

Modalités adaptées à un laboratoire (pas à un client commercial) — évoquées sans rien préjuger ; la forme se déciderait ensemble, plus tard : une collaboration de recherche à l'interface « early-warning signals × ouvrages d'art » (forme ouverte) · une co-publication d'une note méthodologique (y compris si le résultat est partiellement négatif) · brique frugale on-premise (rien ne sort de votre système) · langage commun (IQOA, résidus de normalisation, seuils réglementaires — pas de jargon ML).

Partie 4 bisComment ça s'installe (le volet concret)

Aucun capteur à poser. Rien ne sort de votre système. Empreinte minimale. Une couche logicielle qui se pose sur ce que vous avez déjà.
Étape 1 · branchement

Nous ingérons un export de vos séries existantes (CSV, base time-series, ou API d'un fabricant type OSMOS). Pas de nouvelle instrumentation, aucune modification de votre dispositif.

Étape 2 · calage du « normal »

Retrait des effets saisonnier / thermique / trafic (logique de normalisation type HST), pour travailler sur le résidu.

Étape 3 · détection

CUSUM + change-point + EVT + AR1 tournent sur le résidu, en rétrospectif (sur historique) ou en continu.

Étape 4 · sortie

Un indice de déviation gradué + explication trait par trait + marge d'incertitude (prédiction conforme), avec comparaison historique, recommandation d'inspection et journal de preuve traçable (pour prioriser les interventions), exportable dans votre tableau de bord / vos rapports.

Empreinte et souveraineté : on-premise (le calcul reste chez vous, aucune donnée ne part dans un cloud) · frugal (tourne sur CPU, pas de ferme GPU, pas besoin d'un gros dataset labellisé de dommages) · deux modes : d'abord rétrospectif (le POC — un résultat sur l'historique d'un ouvrage en quelques jours à quelques semaines), puis continu si vous le souhaitez.

Concrètement : donnez-nous l'export d'un seul ouvrage et voyez l'outil tourner, expliqué, en quelques jours — sans toucher à votre instrumentation ni laisser sortir la moindre donnée.
Techniquement · pour vos profils techniques

Ce n'est pas un boîtier à mettre dans le capteur : le capteur ne change pas. C'est un logiciel qui lit les données déjà produites, sur une machine ordinaire (CPU, pas de GPU). Trois niveaux :

« On-premise / on-device » = le calcul tourne sur votre matériel, jamais sur notre cloud.

Transparence : aujourd'hui le moteur est un programme Python, mesuré et fonctionnel ; l'empaquetage « clé en main » (installeur / conteneur durci) fait partie du travail du POC, pas un produit fini. On préfère le dire.

Vos idées nous intéressent : meilleur format d'export, conteneur, brique edge, contraintes SI/sécurité — c'est l'échange qu'on cherche. On construit avec votre existant, pas contre.

Partie 5Ce que nous proposons (force de proposition)

Notre philosophie tient en une ligne : d'abord nous donnons de l'information ; ensuite, on verra ensemble. Nous ne posons ni prix, ni plan de financement, ni promesse que nous ne sommes pas sûrs de tenir.

Ce que nous mettons sur la table · sans engagement

De l'information, d'abord

Un audit ouvert de notre code, de notre protocole anti-fuite et de nos chiffres — pour que vous jugiez par vous-mêmes que la méthode est honnête. Gratuit, sans risque, sans contrepartie.

Un essai, en une phrase : « Donnez-nous un jeu de ~2 ans sur un ouvrage SAIN que nous n'avons jamais vu ; nous testons notre correction EOV + détection séquentielle + prédiction conforme contre le taux de fausses alarmes hivernal ; si on échoue, on documente précisément pourquoi. » — un résultat utile dans les deux cas. Re-mesuré sur vos données : nos chiffres d'autres bancs (≈ 17 jeux publics, IC partout, échecs publiés — Partie 3.3) ne sont pas transférés.

Et après ?

On décide ensemble, plus tard

Si — et seulement si — cet essai vous paraît concluant, nous en définirons la suite ensemble. Sa forme (collaboration, co-publication, encadrement…) reste entièrement ouverte ; nous ne la préjugeons pas, et nous ne dépendons d'aucun financement pour faire le premier pas. On donne d'abord, on décide ensuite.

Sur la propriété intellectuelle — pour lever tout malentendu d'emblée. Nous sommes ouverts à une co-publication et à un co-encadrement ; la PI se discute, elle n'est pas un préalable bloquant. Une mention d'antériorité existe (annexe, en pied de page), mais elle ne conditionne pas l'échange : dans un cadre académique, l'usage (co-signature, attribution) prime, et nous nous calerons sur vos pratiques.

La première action, si l'idée vous parle, est minuscule : une conversation de 30 minutes, puis l'identification d'un jeu de données sur lequel se confronter au réel.

Partie 6Transparence : niveaux de preuve et limites

Nous appliquons à ce dossier la règle que nous nous imposons : aucun chiffre sans son statut.

Reproductibilité — disponible en audit fermé sur demande. Tout est reproductible : le front-end OMA (SSI-cov durci par MAC + amortissement, sans injection des modes publiés), la couche de décision (Mahalanobis + prédiction conforme), le protocole anti-fuite documenté (splits fit / cal / held disjoints, FP sur sain held-out), les ~17 jeux avec leur table de résultats et leurs IC, les scripts permanents (un par jeu) et un fichier MASTER-RESULTS qui régénère la table de vérité. Nous le mettons à disposition pour un audit fermé (pas de publication ouverte à ce stade), précisément pour que vous puissiez le réfuter avant d'y croire.
AffirmationNiveau
Transitions critiques (AR1/variance), Scheffer et al., Nature 2009Établi
EVT/GPD & CUSUM en SHM (Z24, barrages) ; b-value sur fissurationÉtabli
Sophisme du procureur / corpus de contrôle (Boettiger & Hastings 2012)Établi
Laboratoire Navier (UMR 8205), axe sécurité-durabilité des structuresVérifié
ENPC × OSMOS : fatigue probabiliste sur déformation (Miner/Weibull-Basquin)Vérifié (hal-04632581)
FP-moat démontré sur UN seul ouvrage : KW51 FP 6,0 % [4,6-7,9], recall 99,2 %, lead +3 j (renfort, pas dommage) ; réplication openlab-tud ÉCHOUE en chronologique (FP 56 %, 7,2 % rétracté) → n=1 non levéRéel — données réelles, IC (15/06, anti-fuite)
Détection multi-structures : portique ETH 100 % [96-100] (condition appariée), gradin 85 % [IC bootstrap 70-96] (joint le plus dur ≈ 28 %), affouillement 100 %/89 %, Z24 ~75 %Réel — données réelles, IC
Échecs publiés : réplication FP-moat openlab-tud ÉCHOUE en chronologique (FP 56 %) ; vraie fissure Vänersborg non concluante (33 % [11-67]) ; pale d'éolienne = 1ʳᵉ alarme sur changement de gain (artefact), pas une fissure → pas de lead-time ; FP@5 % calibrable seulement à n≥~60 sainsRésultats négatifs assumés
Lois confirmées : fréquences>amplitudes · correction T obligatoire · le murmure le plus durRéel — reproduites
Statut des résultats ouvragesSolide mais NON consolidé pour publication — pipeline unique + EOV durci + re-audit requis avant envoi formel
Détecteur mesuré sur notre branche jumelle humaine (texte) : FP 2 % / rappel 62 % / harc 74 %Réel — sur banc texte, jamais transposé à un ouvrage
Moteur texte (A) = classifieur statique, aveugle à l'ordre (~4 %), lit le contenuVérifié dans notre code — ne prouve PAS (B), distinct des mesures OMA
Chiffre 62/2/74 mesuré en partie sur un test écrit par des LLM (ado-FR)Borne haute de labo, pas une perf terrain
Performance sur votre ouvrage spécifiqueNon démontré (objet de la Proposition 1)
Anciennes métriques internes synthétiques (« CUSUM 96,7 % »)Retirées — remplacées par les mesures réelles ci-dessus
Notre engagement : jamais un chiffre synthétique présenté comme un résultat terrain, jamais un cas extrême comme une règle. Si la méthode échoue sur vos données, nous le dirons — c'est la condition pour que sa réussite, le cas échéant, ait une valeur.

Si l'idée vous parle, parlons-en — 30 minutes, puis l'identification d'un jeu de données pour se confronter au réel.

Emmanuel Klein

association SOS Écrans / Shieldy · shieldy.org

Annexe — mention de propriété (non bloquante pour une collaboration académique). Une antériorité a été horodatée le 2026-06-13 (enveloppe e-Soleau INPI · dépôt git + empreintes SHA-256, cf. MANIFESTE-DEPOT.md). Elle protège un travail en cours ; elle ne conditionne pas l'échange : co-publication et co-encadrement sont les modalités recherchées, la PI se discute. © 2026 shieldy.org (Emmanuel Klein) — document de travail.