Qu'est-ce qu'un bullet character ?
C’est un symbole typographique utilisé pour les listes. Le plus courant est U+2022 (•), mais plusieurs variantes existent et se confondent facilement.
Voici les principales variantes et caractères proches :
1 Variantes ASCII et équivalents simples
Marqueurs de liste usuels en texte brut : tiret, astérisque, plus.
2 Caractères proches souvent confondus
Visuellement similaires mais sémantiquement différents.
3 Bullets Unicode et variantes typographiques
Les plus pertinents à connaître :
4 Bullets selon les formats
HTML, Markdown, Word/RTF n’utilisent pas toujours la même représentation :
Problèmes classiques
Copier-coller depuis le web ou Word
Introduit des • dans des CSV, des champs texte ou du code à la place de - ou * attendus.
Tests unitaires qui échouent
Une chaîne contient un bullet character (•) là où un tiret est attendu : les égalités exactes échouent.
Trim() ou strip() inefficace
Les nettoyages ciblent l’espace et la ponctuation ASCII, mais laissent passer •, ⁃, ◦ ou ●.
Regex \s ou \w incomplètes
Les classes génériques ignorent les puces Unicode ; il faut cibler explicitement U+2022, U+2043, U+25E6…
Exemple de piège avec bullet character :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII identifie le bullet character (•) et ses variantes proches dans vos textes. Il met en évidence les occurrences, leur code Unicode et propose des conversions cohérentes pour vos conventions de liste.
✅ Détection automatique
Puces Unicode (•, ⁃, ◦), symboles proches (·, ●, ∙)
📊 Analyse complète
Codes U+, positions exactes, prévisualisation du remplacement
🧹 Nettoyage automatique
Conversion vers - ou * selon vos standards Markdown
💾 Export propre
Téléchargement du texte normalisé, prêt pour la CI
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant d’écrire des scripts, utilisez Clean ASCII pour remplacer les bullet characters par les marqueurs de liste que vous autorisez.
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
normalize_bullets() pour supprimer ou convertir toutes les puces
⚙️ Automatiser
Checklist rapide
Conclusion
Le bullet character est anodin en apparence, mais peut interrompre une pipeline, casser un parseur ou fausser un rendu.
Adoptez une convention claire, détectez systématiquement les puces Unicode et normalisez vos contenus pour éviter les écarts entre environnements.
Détectez les bullet characters maintenant
Utilisez notre outil pour identifier et convertir les bullet characters (•) dans vos textes.
Analyser mon texte pour bullet character