Qu'est-ce que le tiret long (—) ?
C’est le caractère Unicode em dash U+2014, visuellement plus long que le trait d’union. Il sert aux incises, aux ruptures de phrase et à certaines conventions éditoriales.
Autour du tiret long, voici les notions à connaître :
1 Tirets et signes voisins
Ils se ressemblent mais n’ont pas la même sémantique ni le même code.
2 Confusions fréquentes
Substitutions invisibles qui provoquent des bugs subtils.
3 Espaces typographiques autour du tiret
En français, on emploie souvent des espaces fines insécables.
4 Variantes Unicode du tiret
Plusieurs tirets existent et ne doivent pas être confondus.
Problèmes classiques
Copier-coller depuis le web ou Word
Remplace le trait d’union par un tiret long — et casse des URL, slugs, commandes CLI ou CSV.
Tests unitaires qui échouent
Une chaîne attend un trait d’union "-" mais reçoit "—" (U+2014), la comparaison échoue.
split() ou replace() inadapté
Découper sur "-" n’attrape pas "—", d’où des champs non séparés ou des slugs mal formés.
Regex fragile sur les tirets
[-] ne couvre pas —/–/‒/−. Il faut lister les variantes ou utiliser les propriétés Unicode.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII identifie immédiatement les tirets Unicode et vous indique où se trouvent les em dashes (—), les en dashes (–) et autres variantes proches, avec des propositions de normalisation adaptées au contexte.
✅ Détection automatique
— (U+2014), – (U+2013), ‒ (U+2012), − (U+2212) et plus
📊 Analyse complète
Codes Unicode, positions exactes, recommandations d’usage
🧹 Nettoyage automatique
Conversion vers "-" pour slugs/URL ou normalisation typographique FR
💾 Export propre
Texte corrigé prêt à intégrer dans vos contenus ou pipelines
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant de coder des remplacements complexes, utilisez Clean ASCII pour repérer et convertir instantanément les tirets longs et signes proches :
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
normalize_dashes() qui unifient tous les tirets
⚙️ Automatiser
Checklist rapide
Conclusion
Le tiret long est un atout typographique, mais sa confusion avec d’autres signes provoque des erreurs difficiles à repérer.
Adoptez une normalisation cohérente, détectez les tirets Unicode indésirables et vous éviterez la plupart des bugs liés aux chaînes et aux contenus.
Détectez les tirets longs mal utilisés maintenant
Utilisez notre outil pour identifier et corriger les tirets longs et signes proches dans vos textes.
Analyser mon texte