Qu'est-ce qu'un soft hyphen ?
C’est une marque de césure conditionnelle. Invisible la plupart du temps, elle peut s’afficher comme un tiret si une coupure de ligne survient.
Points essentiels à connaître sur le soft hyphen :
1 Définition et encodage
Caractère Unicode de césure conditionnelle utilisé pour l’hyphénation.
2 D'où vient-il ?
Insertion automatique par des éditeurs (Word, CMS), copier-coller depuis des pages justifiées, traitements typographiques.
3 Comportement d'affichage
Invisible en continu, il devient un tiret au point de rupture. Il peut rester dans les données exportées.
4 Confusions fréquentes
Ne pas confondre avec d’autres tirets ou espaces spéciaux.
Problèmes classiques
Copier-coller depuis le web ou Word
Introduit des soft hyphens dans des emails, des URLs ou des identifiants, invisibles dans l’éditeur.
Tests unitaires qui échouent
Une chaîne contient un U+00AD masqué, les égalités simples et les hash changent.
Trim() ou strip() inefficace
Le soft hyphen n’est pas un espace : les trims ne l’enlèvent pas, il reste au milieu des tokens.
Regex \s ou \w incomplètes
U+00AD n’est ni lettre ni espace : il peut décomposer un mot sans être capturé par vos classes.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII identifie instantanément le soft hyphen (U+00AD) et les positions exactes où il se cache. Vous visualisez le caractère, son code et l’impact potentiel, avec des options de remplacement sûres.
✅ Détection automatique
Soft hyphen, tiret insécable, variantes Unicode proches
📊 Analyse complète
Codes Unicode, positions précises, préconisations de nettoyage
🧹 Nettoyage automatique
Suppression ou conversion vers un tiret ASCII simple selon le contexte
💾 Export propre
Téléchargement du texte nettoyé sans soft hyphen résiduel
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant d’écrire des scripts maison, passez votre texte dans Clean ASCII pour supprimer en un clic les soft hyphens indésirables :
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
remove_soft_hyphen() qui suppriment U+00AD
⚙️ Automatiser
Checklist rapide
Conclusion
Le soft hyphen est utile en mise en page, mais dangereux lorsqu’il fuit vers vos données.
Détectez-le systématiquement, filtrez-le dans les champs techniques et automatisez les contrôles pour éviter les bugs invisibles.
Repérez les soft hyphens maintenant
Utilisez notre outil pour identifier et supprimer le soft hyphen dans vos textes et vos exports.
Analyser mon texte