Qu'est-ce qu'une numeric entity ?
C’est une séquence de caractères ASCII qui représente un code Unicode sous la forme &#nombre; (décimal) ou &#xhex; (hexadécimal), principalement utilisée en HTML.
Voici les principales familles d’entités numériques utilisées en HTML :
1 Références décimales HTML
Forme num; en décimal, courante dans les exports et CMS.
2 Références hexadécimales HTML
Forme hex; pratique pour lier directement le code Unicode.
3 Entités pour espaces et séparateurs
Souvent source d’alignements et de trims qui échouent :
4 Cas techniques encodés
Séquences qui apparaissent dans des contenus HTML sérialisés :
Problèmes classiques
Copier-coller HTML ou export CMS
Introduit des   ou ​ dans CSV/JSON qui se retrouvent visibles ou mal parsés.
Double encodage
Un & devient &, puis &… On observe   au lieu d’un espace insécable réel.
Décodage manquant ou tardif
Absence de unescape avant comparaison/trim, rendant incohérents les traitements.
Regex inadaptées
Les motifs ne capturent pas les séquences &#...; et &#x...; ou les comptent comme du texte normal.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII repère automatiquement les numeric entities dans vos textes et exports. Il identifie les séquences &#...; et &#x...;, met en évidence les cas de double encodage et propose des conversions sûres.
✅ Détection automatique
Références décimales/hexadécimales, motifs anormaux, &#
📊 Analyse complète
Positions exactes, aperçu décodé, catégories (espaces, ponctuation…)
🧹 Nettoyage automatique
Décodage contrôlé, remplacement des NBSP par espaces si souhaité
💾 Export propre
Texte normalisé, prêt pour CSV/JSON, e-mails et UI
Autres méthodes de détection
Affichage dans l'éditeur
&# et &#x
&#x?[0-9A-Fa-f]+; dans vos fichiers
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant d’écrire des scripts, utilisez Clean ASCII pour repérer et décoder en un clic les numeric entities :
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
trim_all() après décodage pour nettoyer les espaces spéciaux
⚙️ Automatiser
Checklist rapide
Conclusion
Les numeric entities apportent de la précision au rendu, mais mal placées, elles perturbent la comparaison, le trim et le parsing.
Décoder au bon moment, surveiller le double encodage et normaliser les espaces vous évitent la majorité des bugs d’affichage et de données.
Repérez les numeric entities maintenant
Utilisez notre outil pour identifier, décoder et nettoyer les entités numériques dans vos textes.
Analyser mon texte