Formation Visual Testing & OCR — De zéro à expert

Contexte	Pourquoi c'est bloquant	Exemples
Desktop natif	Pas de DOM, pas de sélecteur CSS	WPF, Swing, Qt, Delphi
ERP / logiciel métier propriétaire	Aucun hook d'automatisation exposé	SAP GUI, Oracle Forms, CEGID
Citrix / VNC / RDP	Flux de pixels uniquement	Sessions desktop distantes, mainframes
Legacy Linux	Interface graphique via X11 ou VNC uniquement	Outils internes déployés depuis 15+ ans
Applications embarquées	Pas d'OS standard, interface sur écran dédié	Bornes, équipements industriels
Canvas HTML5	Pas d'élément interactif interrogeable	Graphiques, éditeurs visuels

Outil	Points forts	Limites	Prix
OculiX	Fork actif de SikuliX, VNC complet, SSH natif, Android ADB, multi-runners	Pas encore sur Maven Central	Gratuit / MIT
SikuliX	Mature, VNC intégré, OCR Tesseract, Java natif	Archivé mars 2026 → OculiX prend le relais	Gratuit / MIT
Applitools	IA pour comparer les captures, très précis	Coûteux, dépendance cloud	500€+/mois
PyAutoGUI	Simple, Python natif	Matching basique, pas de VNC, fragile	Gratuit

1. Arborescence du projet

Avant d'écrire une seule ligne de test, la structure du projet doit être en place. C'est ce qui fait la différence entre un framework maintenable et un chaos de fichiers éparpillés.

Voici la structure recommandée, indépendante du framework utilisé (Maven, Gradle, Katalon) :

MonProjet/
├── Pattern/ # Toutes les images de référence
│ ├── Navigation/ # Menus, onglets, boutons de navigation
│ │ ├── menu_principal.png
│ │ ├── btn_retour.png
│ │ └── icone_accueil.png
│ ├── Actions/ # Boutons d'action génériques
│ │ ├── btn_valider.png
│ │ ├── btn_annuler.png
│ │ └── btn_supprimer.png
│ ├── Statuts/ # Indicateurs visuels
│ │ ├── icone_succes.png
│ │ ├── icone_erreur.png
│ │ └── spinner_chargement.png
│ ├── ModuleStock/ # Images spécifiques au module Stock
│ │ ├── formulaire_mouvement.png
│ │ └── tableau_stock.png
│ └── ScenarioElements/ # Images de validation finale de scénarios
│ └── connexion_reussie_validation.png
├── Keywords/ # Les managers techniques
│ ├── ScreenOperationsManager.java
│ ├── ClickManager.java
│ ├── WaitManager.java
│ ├── OCRManager.java
│ ├── TypeManager.java
│ ├── RegionManager.java
│ └── CaptureManager.java
├── Constants/ # Centralise les chemins d'images
│ ├── ImageConstants.java # Navigation, Actions, Statuts
│ └── StockImageConstants.java # Images du module Stock
├── Tests/ # Les cas de test
│ └── TestConnexion.java
└── FailureScreenshots/ # Screenshots d'échec générés automatiquement

💡 Le dossier Pattern/ est le cœur du framework. Toutes les images de référence y vivent. Jamais un chemin d'image en dur dans un test — toujours via une constante.

Pourquoi cette séparation ?

Pattern/ — les images de référence versionées dans Git. Si l'interface change, on ne touche qu'aux images, pas au code.
Keywords/ — les managers techniques qui encapsulent SikuliX. Un test n'importe jamais SikuliX directement.
Constants/ — la colle entre les deux. Centralise les chemins pour qu'un renommage de fichier ne casse qu'un seul endroit.

2. Capturer les images de référence avec SikuliX IDE

C'est l'étape que tous les débutants ratent. Avant d'écrire du code, il faut créer les images de référence. La qualité de ces images détermine 80% de la fiabilité du framework.

Étape 1 — Ouvrir SikuliX IDE

SikuliX IDE est livré avec l'archive SikuliX. Lance runsikulix.cmd (Windows) ou runsikulix.sh (Linux/Mac). L'IDE s'ouvre avec un éditeur de script intégré.

Utiliser l'outil de capture intégré

Dans SikuliX IDE, clique sur le bouton 📷 "Take screenshot" dans la barre d'outils
L'écran se fige et un réticule apparaît
Dessine un rectangle autour de l'élément à capturer — uniquement l'élément, pas le fond
Relâche — l'image est automatiquement insérée dans le script
Clique-droit sur l'image dans le script → "Save as" → sauvegarde dans Pattern/

Les règles d'une bonne image de référence

📐 Taille minimale

Capture uniquement l'élément, pas son entourage. Un bouton : juste le bouton. Plus l'image est petite et précise, plus le matching est fiable.

🖥️ Résolution fixe

Capture toujours à la même résolution que l'environnement d'exécution. Une image capturée en 4K ne matchera pas sur un écran FullHD.

🎯 Élément stable

Évite les zones dynamiques : compteurs, horodatages, données variables. Préfère les labels, icônes, contours de boutons.

📝 Nommage explicite

btn_valider_panier.png pas img1.png. Le nom doit permettre de savoir ce que c'est sans ouvrir le fichier.

🔴 Piège classique — L'image trop grande : si tu captures toute la fenêtre au lieu de juste le bouton, SikuliX cherchera cette grande image à l'écran. Au moindre déplacement de fenêtre ou changement de fond, le matching échoue. Règle absolue : l'image doit être la plus petite possible tout en restant unique à l'écran.

Étape 2 — Valider l'image capturée

Avant de committer l'image dans le projet, valide-la dans SikuliX IDE :

// Dans l'IDE SikuliX, tape ce mini-script et lance-le
Screen s = new Screen();
if (s.exists("Pattern/Actions/btn_valider.png", 3) != null) {
    s.highlight(2); // Surligne ce qui a été trouvé
    System.out.println("Image valide — score : " + s.find("Pattern/Actions/btn_valider.png").getScore());
} else {
    System.out.println("Image non trouvée — recapturer");
}

Le score retourné doit être supérieur à 0.92. En dessous, recapture l'image.

3. La classe de constantes d'images

C'est LE fichier le plus important du framework. Il centralise tous les chemins d'images. Jamais un chemin en dur dans un test. Jamais.

Pourquoi c'est indispensable

Sans cette classe, si tu renommes btn_valider.png en btn_confirmer.png, tu dois chercher et remplacer dans tous tes tests. Avec cette classe, tu modifies un seul endroit.

/**
 * Centralise tous les chemins d'images de référence du framework.
 * RÈGLE : aucun chemin d'image ne doit apparaître directement dans un test.
 */
public class ImageConstants {

    // ── Répertoire racine des images ──
    private static final String BASE = "Pattern/";

    // ── Navigation ──
    public static final String MENU_PRINCIPAL     = BASE + "Navigation/menu_principal.png";
    public static final String BTN_RETOUR         = BASE + "Navigation/btn_retour.png";
    public static final String ICONE_ACCUEIL      = BASE + "Navigation/icone_accueil.png";
    public static final String ONGLET_STOCK       = BASE + "Navigation/onglet_stock.png";

    // ── Actions génériques ──
    public static final String BTN_VALIDER        = BASE + "Actions/btn_valider.png";
    public static final String BTN_ANNULER        = BASE + "Actions/btn_annuler.png";
    public static final String BTN_SUPPRIMER      = BASE + "Actions/btn_supprimer.png";
    public static final String BTN_NOUVEAU        = BASE + "Actions/btn_nouveau.png";
    public static final String BTN_RECHERCHER     = BASE + "Actions/btn_rechercher.png";

    // ── Statuts et indicateurs ──
    public static final String ICONE_SUCCES       = BASE + "Statuts/icone_succes.png";
    public static final String ICONE_ERREUR       = BASE + "Statuts/icone_erreur.png";
    public static final String SPINNER            = BASE + "Statuts/spinner_chargement.png";
    public static final String DIALOGUE_CONFIRM   = BASE + "Statuts/dialogue_confirmation.png";
    public static final String BANDEAU_ALERTE     = BASE + "Statuts/bandeau_alerte.png";

    // ── Champs de saisie (labels permettant de localiser les champs) ──
    public static final String LABEL_IDENTIFIANT  = BASE + "Champs/label_identifiant.png";
    public static final String LABEL_MOT_DE_PASSE = BASE + "Champs/label_mot_de_passe.png";
    public static final String LABEL_MONTANT      = BASE + "Champs/label_montant.png";

    // Constructeur privé — classe utilitaire, pas d'instanciation
    private ImageConstants() {}
}

Une constante par module

Pour les modules applicatifs complexes, crée une constante dédiée :

/**
 * Constantes d'images spécifiques au module de gestion des stocks.
 */
public class StockImageConstants {

    private static final String BASE = "Pattern/ModuleStock/";

    public static final String TITRE_MODULE          = BASE + "titre_module_stock.png";
    public static final String BTN_NOUVEAU_MOUVEMENT = BASE + "btn_nouveau_mouvement.png";
    public static final String FORMULAIRE_MOUVEMENT  = BASE + "formulaire_mouvement.png";
    public static final String TABLEAU_RESULTATS     = BASE + "tableau_resultats.png";
    public static final String LIGNE_STOCK           = BASE + "ligne_stock_template.png";

    private StockImageConstants() {}
}

✅ Résultat : dans un test, tu écris ImageConstants.BTN_VALIDER — jamais "Pattern/Actions/btn_valider.png". Si l'image change de nom ou de dossier, une seule ligne à modifier dans toute la codebase.

4. Organisation par module — Scaler le framework

Sur un projet de 100+ tests, une seule classe ImageConstants devient ingérable. On découpe par domaine fonctionnel.

Constants/
├── ImageConstants.java # Navigation, Actions, Statuts communs
├── StockImageConstants.java # Module gestion des stocks
├── CommandeImageConstants.java # Module commandes
├── LoginImageConstants.java # Écrans d'authentification
└── RapportImageConstants.java # Module rapports et exports

Pattern/
├── Navigation/ # → ImageConstants
├── Actions/ # → ImageConstants
├── Statuts/ # → ImageConstants
├── ModuleStock/ # → StockImageConstants
├── ModuleCommande/ # → CommandeImageConstants
└── Login/ # → LoginImageConstants

Règle de découpage

Une classe de constantes = un domaine fonctionnel cohérent. Si tu dois chercher dans deux classes pour écrire un test, c'est que le découpage est mal fait.

5. Les classes métier

Au-dessus des managers techniques, on peut créer des classes métier qui expriment des actions fonctionnelles. Ce n'est pas obligatoire mais cela améliore la lisibilité des tests.

⚠️ Important : les classes métier sont optionnelles. Les managers techniques suffisent pour écrire des tests complets. Les classes métier sont un bonus de lisibilité, pas une obligation architecturale.

/**
 * Exemple de classe métier — Login.
 * Regroupe les actions liées à la connexion en un vocabulaire fonctionnel.
 * Elle utilise les managers techniques — jamais SikuliX directement.
 */
public class LoginActions {

    private final ScreenOperationsManager som;

    public LoginActions(ScreenOperationsManager som) {
        this.som = som;
    }

    public boolean seConnecter(String identifiant, String motDePasse) {
        // Attendre l'écran de login
        if (!som.waitForElement(LoginImageConstants.ECRAN_LOGIN, 20)) return false;

        // Saisir les identifiants
        som.insertText(LoginImageConstants.CHAMP_IDENTIFIANT, identifiant);
        som.typeTextWithEnter(motDePasse);

        // Cliquer sur "Se connecter"
        som.clickOn(LoginImageConstants.BTN_SE_CONNECTER);

        // Vérifier le succès
        return som.waitForElement(ImageConstants.ICONE_ACCUEIL, 10);
    }

    public void seDeconnecter() {
        som.clickOn(ImageConstants.MENU_PRINCIPAL);
        som.waitForElement(LoginImageConstants.BTN_DECONNEXION, 5);
        som.clickOn(LoginImageConstants.BTN_DECONNEXION);
    }
}

Le test devient alors :

// Avec classes métier — lisible par un non-développeur
LoginActions login = new LoginActions(som);
login.seConnecter("admin", "motdepasse");

// Sans classes métier — directement avec les managers
som.waitForElement(LoginImageConstants.ECRAN_LOGIN, 20);
som.insertText(LoginImageConstants.CHAMP_IDENTIFIANT, "admin");
som.typeTextWithEnter("motdepasse");
som.clickOn(LoginImageConstants.BTN_SE_CONNECTER);

💡 Les deux approches sont valides. En pratique, commence par les managers directs. Extrais en classes métier uniquement quand une séquence est répétée dans plus de 3 tests.

Architecture d'ensemble

Le framework est structuré en managers techniques spécialisés. Chaque manager a une responsabilité unique. Un test ou une classe métier n'importe jamais SikuliX directement — il passe toujours par un manager.

┌─────────────────────────────────┐
│ Test / Classe Métier │
└────────────────┬────────────────┘
│
┌────────────────▼────────────────┐
│ ScreenOperationsManager │ ← Point d'entrée unique
└──┬──────┬──────┬──────┬────┬───┘
│ │ │ │ │
Click Wait Type OCR Region Capture
Mgr Mgr Mgr Mgr Mgr Mgr
│ │ │ │ │
┌──▼──────▼──────▼──────▼────▼───┐
│ SikuliX Engine │
└─────────────────────────────────┘

Principe de délégation

ScreenOperationsManager est le seul point d'entrée exposé aux tests. Il délègue chaque type d'action au manager spécialisé correspondant. Les tests ne savent pas que ClickManager ou WaitManager existent.

// Dans ScreenOperationsManager — délégation aux managers spécialisés
public class ScreenOperationsManager {

    private final ClickManager   clickManager;
    private final WaitManager    waitManager;
    private final TypeManager    typeManager;
    private final OCRManager     ocrManager;
    private final RegionManager  regionManager;
    private final CaptureManager captureManager;

    // ThreadLocal pour la thread-safety en exécution parallèle
    private static final ThreadLocal<Region> screenHolder = ThreadLocal.withInitial(Screen::new);

    public ScreenOperationsManager() {
        this.typeManager    = new TypeManager(screenHolder);
        this.clickManager   = new ClickManager(screenHolder, HIGHLIGHT_DELAY, typeManager);
        this.waitManager    = new WaitManager(screenHolder, HIGHLIGHT_DELAY, clickManager);
        this.ocrManager     = new OCRManager(screenHolder);
        this.regionManager  = new RegionManager(screenHolder, HIGHLIGHT_DELAY, waitManager, ocrManager);
        this.captureManager = new CaptureManager(screenHolder);
    }

    // Délégation — le test appelle clickOn, pas clickManager.clickOn
    public void clickOn(String imagePath) {
        clickManager.clickOn(imagePath);
    }

    public boolean waitForElement(String imagePath, int timeout) {
        return waitManager.waitForElement(imagePath, timeout);
    }

    public void typeText(String text) {
        typeManager.typeText(text);
    }

    // ... toutes les autres délégations
}

ThreadLocal — pourquoi c'est important

Le ThreadLocal<Region> garantit que chaque thread d'exécution a son propre écran. En exécution parallèle (plusieurs tests en même temps sur des VNC différents), les screens ne se mélangent pas.

ScreenOperationsManager — Point d'entrée unique

Classe façade qui expose l'API publique complète du framework. Les tests n'interagissent qu'avec cette classe. Elle instancie et délègue à chaque manager spécialisé.

🎯 Responsabilité

Façade unique, instanciation des managers, initialisation de l'écran (local ou VNC), configuration globale SikuliX.

clickOn() waitForElement() typeText() waitForText() findRegionBelow() captureScreen() initVNC()

ClickManager — Toutes les interactions souris

Gère l'intégralité des clics et interactions pointer. Un clic n'est jamais appelé directement sur screenHolder.get() depuis un test — toujours via ce manager.

🖱️ Méthodes principales

clickOn(imagePath) clickOn(imagePath, similarity) doubleClickOn(imagePath) hoverOn(imagePath) clickNearImage(imagePath, offset, direction) clickAndTypeNearImage() clickOnWindowCenter()

Focus sur clickNearImage — une méthode clé

Certaines interfaces n'ont pas de bouton cliquable identifiable par image. Mais elles ont un label stable à côté d'une zone de saisie. clickNearImage clique à une distance et dans une direction données par rapport à une image de référence.

// Cliquer dans le champ de saisie qui est 150px à droite du label "Montant :"
som.clickNearImage(ImageConstants.LABEL_MONTANT, 0.92, 150, "right");

// Puis saisir la valeur
som.typeText("1500");

WaitManager — Attentes et assertions visuelles

Gère toutes les attentes sur des éléments visuels. C'est le manager le plus utilisé dans les tests — chaque interaction commence par une attente.

⏳ Méthodes principales

waitForElement(imagePath, timeout) waitForElement(imagePath, timeout, silentMode) waitForElement(imagePath, timeout, similarity) waitForElementWithSimilarity() waitForAllImages() waitUntilElementVisibleAndClick() waitForImageToDisappear() waitForScreenStable() verifyImagePresence() verifyImageNotPresent() assertElementPresent() validateFinalVisualState()

Le mode silencieux — waitForElement avec silentMode

Parfois tu veux vérifier si un élément est présent sans que son absence soit une erreur. Le mode silencieux ne loggue pas d'erreur si l'élément n'est pas trouvé.

// Mode normal — si non trouvé, log d'erreur et retourne false
boolean present = som.waitForElement(ImageConstants.DIALOGUE_CONFIRM, 3);

// Mode silencieux — vérifie sans bruit si un dialogue optionnel est apparu
boolean dialoguePresent = som.waitForElement(ImageConstants.DIALOGUE_CONFIRM, 3, true);
if (dialoguePresent) {
    som.clickOn(ImageConstants.BTN_VALIDER);
}

validateFinalVisualState — la méthode de validation premium

Valide l'état visuel final d'un scénario par rapport à une image de référence capturée lors des premiers runs validés. Si l'écran ne correspond pas, le test échoue avec une capture d'échec.

// A la fin d'un scénario, valider que l'écran correspond à la référence
som.validateFinalVisualState("Connexion_Standard", "Apres_Connexion_Reussie");
// → Cherche Pattern/ScenarioElements/Connexion_Standard_Apres_Connexion_Reussie.png
// → Si non trouvé avec sim 0.99 → markFailedAndStop + capture d'échec

TypeManager — Saisie clavier

Gère toute la saisie clavier — texte simple, touches spéciales, caractères accentués, combinaisons de touches. La saisie de caractères spéciaux (@, #, €, [, ]) est une source de bugs classique selon le layout clavier.

⌨️ Méthodes principales

typeText(text) typeTextWithEnter(text) pasteText(text) insertText(imagePath, text) pressShiftAlt()

insertText vs typeText — quelle différence ?

// typeText — frappe directe dans la zone active (focus courant)
som.typeText("MonTexte");

// insertText — clique sur l'image puis frappe dans ce champ
// Utile quand le focus n'est pas garanti
som.insertText(ImageConstants.CHAMP_RECHERCHE, "MonTexte");

// typeTextWithEnter — frappe + touche Entrée (valider un formulaire)
som.typeTextWithEnter("MonTexte");

⚠️ Caractères spéciaux et layout clavier : sur un clavier AZERTY français, le @ s'obtient avec AltGr+0. SikuliX type caractère par caractère et peut mal interpréter les caractères spéciaux. Le TypeManager gère ces cas avec une table de correspondance.

OCRManager — Lecture de texte

Gère toutes les opérations de lecture de texte à l'écran via PaddleOCR (moteur principal) et Tesseract (fallback). Permet de lire, attendre et cliquer sur du texte sans image de référence.

🔤 Méthodes principales

waitForText(text) waitForText(text, timeout) waitForText(text, timeout, leftHalf) waitForTextVanish(text, timeout) waitForTextAndClick(text, timeout, fullRegion) clickOnText(text) detectTextPairInActiveApp() waitForTextInRegion(region, text) detectTextAndClick(region, text)

Quand utiliser OCR plutôt que l'image

// Si le texte est dynamique (montant variable), utilise OCR
som.waitForText("Paiement validé");     // Peu importe comment c'est rendu visuellement
som.waitForText("1 250,00 €", 10);      // Attend ce montant précis à l'écran
som.clickOnText("Confirmer");           // Clique sur ce mot où qu'il soit

// Si l'élément est toujours identique visuellement, utilise l'image
som.waitForElement(ImageConstants.BTN_VALIDER, 5);  // Plus rapide, plus précis

detectTextPairInActiveApp — valider deux valeurs ensemble

Cas d'usage réel : valider qu'un libellé et son montant associé apparaissent ensemble sur la même ligne d'un écran de récapitulatif.

// Vérifier que "Remise fidélité" et "-5,00 €" sont sur la même ligne
boolean ok = som.detectTextPairInActiveApp("Remise fidélité", "-5,00 €", 15.0);
// toleranceY=15 = les deux textes doivent être à moins de 15px de hauteur l'un de l'autre

RegionManager — Zones et navigation

Gère les opérations sur des régions de l'écran : recherche de zones relatives à une image, scroll, extraction de texte dans une zone précise, clic par coordonnées OCR.

🗺️ Méthodes principales

findRegionBelow(imagePath, height) validateRegion(imagePath, errorMessage, height) performScrollAndFind(refImage, targetImage, distance, attempts) performScrollAndFindText(refImage, text, distance, attempts) scrollVerticallyFromLeft(xRatio, scrollRatio, up) extractTextNearImage(imagePath, similarity, marginX) clickOnInputByRowAndColumn()

findRegionBelow — localiser un champ par son label

Le pattern le plus utilisé : un label est stable (image de référence), mais le champ de saisie à côté ne l'est pas (valeur variable). findRegionBelow crée une région juste en dessous du label.

// Le champ "Quantité" est sous le label "Quantité :"
Region champQte = som.findRegionBelow(ImageConstants.LABEL_QUANTITE, 35);
champQte.click();
som.typeText("150");

clickOnInputByRowAndColumn — grille OCR

Pour les tableaux sans sélecteur, localise une cellule par l'intersection de sa ligne (texte OCR) et sa colonne (en-tête OCR), puis clique dessus.

// Cliquer sur la cellule "Montant" de la ligne "Carte bancaire"
som.clickOnInputByRowAndColumn("Moyen de paiement", "Carte bancaire", "Montant");

CaptureManager — Captures et rapport

Gère les captures d'écran pour le rapport d'exécution. Chaque échec génère automatiquement une capture horodatée dans FailureScreenshots/.

📸 Méthodes principales

captureScreen(savePath) logInfo(message) logError(message) showAutoClosingPopup(message, duration)

// Capture manuelle à un point clé du test
som.captureScreen(RunConfiguration.getReportFolder());
// → Sauvegarde : FailureScreenshots/NomDuScenario_20240315_143022_Error.png

// Popup de debug pendant le développement (se ferme automatiquement)
som.showAutoClosingPopup("Connexion établie — attente de l'écran principal", 2000);

Seuil	Comportement	Risque
0.5 – 0.7	Matche n'importe quoi qui ressemble vaguement	🔴 Faux positifs garantis en prod
0.7 (défaut)	Acceptable en démo, inacceptable en prod	🟡 Faux positifs occasionnels
0.90 – 0.95	Match fiable sur éléments stables	✅ Recommandé en production
0.98 – 1.0	Identique pixel par pixel	🔴 Faux négatifs dès que l'interface change d'un pixel

Méthode	Bloquant	Si non trouvé	Usage
`wait(img, timeout)`	Oui	FindFailed	Prérequis — si absent, le test ne peut pas continuer
`find(img)`	Oui	FindFailed	L'élément doit être là maintenant, pas de raison d'attendre
`exists(img, timeout)`	Oui mais silencieux	null	Vérification optionnelle — l'élément peut ne pas être là
`waitVanish(img, timeout)`	Oui	FindFailed	Attendre qu'un spinner, un dialogue disparaisse

Cas	Tesseract	PaddleOCR
Texte noir sur fond blanc	✅ 99%	✅ 99%
Texte blanc sur fond rouge	❌ 20%	✅ 95%
Police LCD (afficheurs numériques)	⚠️ 60%	✅ 92%
Image basse résolution	⚠️ 45%	✅ 80%
Temps de traitement	✅ 50ms	⚠️ 300ms

Fichier	Ce que c'est	Dossier
`ecran_login.png`	Logo ou titre de l'écran de login — identifie que l'écran est là	Login/
`label_identifiant.png`	Le label "Identifiant :" — permet de localiser le champ	Login/
`label_mot_de_passe.png`	Le label "Mot de passe :"	Login/
`btn_se_connecter.png`	Le bouton de connexion	Login/
`icone_accueil.png`	Un élément stable du tableau de bord — prouve que la connexion a réussi	Navigation/
`message_erreur_login.png`	Le message d'erreur si les identifiants sont mauvais	Login/

Erreur	Cause probable	Solution
FindFailed sur la première image	L'application n'est pas démarrée ou l'écran n'est pas celui attendu	Vérifier manuellement l'état de l'application avant le test
FindFailed sur un bouton	Image de mauvaise résolution ou seuil trop élevé	Logger le score, recapturer l'image, réajuster le seuil
Clic au mauvais endroit	Image trop générique, présente à plusieurs endroits	Ajouter une région ou utiliser un Pattern plus spécifique
OCR lit mal	Fond coloré ou police non standard	Activer le double moteur, prétraiter l'image
Test instable (passe parfois)	Timing — l'interface n'est pas prête quand SikuliX cherche	Augmenter les timeouts de `wait()`, ajouter `waitVanish` sur les spinners

#	Problème	Solution
1	Passe en local, échoue en CI	Même résolution obligatoire. Configurer Xvfb à 1920x1080 et capturer les images de référence à cette résolution.
2	FindFailed aléatoire	Augmenter les timeouts de `wait()` en CI. Ajouter `waitVanish` sur les spinners avant chaque assertion.
3	OCR lit mal en CI	La résolution du rendu change la taille des polices. Recapturer les images OCR depuis l'environnement CI.
4	Test bloqué indéfiniment	Ajouter un timeout global Maven : `<forkedProcessTimeoutInSeconds>300</forkedProcessTimeoutInSeconds>`
5	Tests parallèles qui s'interfèrent	Le visual testing ne supporte pas le parallèle sur le même écran. Utiliser des VNC différents ou séquencer.
6	Application sale entre les tests	Ajouter un `@AfterEach` qui remet l'application en état connu (déconnexion, fermeture des fenêtres).
7	Fuite mémoire après 50+ tests	SikuliX garde les captures en mémoire. Appeler `ImageCache.clear()` régulièrement.
8	VNC qui se déconnecte	Configurer `x11vnc -nevershared -forever -noxdamage`. Ajouter un keepalive dans le ScreenProvider.
9	Images obsolètes après mise à jour UI	Stratégie de nommage avec version : `btn_valider_v2.png`. Script de validation périodique des images.
10	Rapport sans contexte visuel	Capturer l'écran après chaque test (succès et échec) dans `@AfterEach`. La capture montre l'état exact.

Chargement...

1. Le problème réel

Ce que tu vas rencontrer sur le terrain

2. Quand les outils classiques échouent

3. Le principe du visual testing

🖼️ Reconnaissance d'images

🔤 Reconnaissance de texte (OCR)

Le template matching

4. Les outils du marché

5. Pourquoi SikuliX + double moteur OCR

🔤 Moteur 1 — Tesseract

🔤 Moteur 2 — PaddleOCR

6. Ce que tu vas savoir faire

✅ Structurer le projet

✅ Concevoir les managers

✅ Capturer les images

✅ Écrire un test de A à Z

✅ OCR double moteur

✅ VNC et CI/CD

1. Arborescence du projet

Pourquoi cette séparation ?

2. Capturer les images de référence avec SikuliX IDE

Étape 1 — Ouvrir SikuliX IDE

Utiliser l'outil de capture intégré

Les règles d'une bonne image de référence

📐 Taille minimale

🖥️ Résolution fixe

🎯 Élément stable

📝 Nommage explicite

Étape 2 — Valider l'image capturée

3. La classe de constantes d'images

Pourquoi c'est indispensable

Une constante par module

4. Organisation par module — Scaler le framework

Règle de découpage

5. Les classes métier

Architecture d'ensemble

Principe de délégation

ThreadLocal — pourquoi c'est important

🎯 Responsabilité

🖱️ Méthodes principales

Focus sur clickNearImage — une méthode clé

⏳ Méthodes principales

Le mode silencieux — waitForElement avec silentMode

validateFinalVisualState — la méthode de validation premium

⌨️ Méthodes principales

insertText vs typeText — quelle différence ?

🔤 Méthodes principales

Quand utiliser OCR plutôt que l'image

detectTextPairInActiveApp — valider deux valeurs ensemble

🗺️ Méthodes principales

findRegionBelow — localiser un champ par son label

clickOnInputByRowAndColumn — grille OCR

📸 Méthodes principales

Prérequis

pom.xml

Vérification du setup

Test attendu

La table de décision des seuils

Méthode de calibration

Retry avec backoff exponentiel

Gérer les dialogues parasites

Prérequis

1. Préparer les images de référence

Protocole de capture — à suivre pour chaque image

Liste des images pour un test de connexion

2. Créer les constantes

3. Instancier le framework

4. Écrire le test

5. Lancer et déboguer

Premier lancement

Que faire si ça échoue

Le screenshot d'échec est ton meilleur allié

6. Test complet annoté — le template

7. Checklist avant de committer un test

🖼️ Images

📝 Constantes

🧪 Test

⚙️ Seuils

10 problèmes classiques en CI