Qu'est-ce que le BOM UTF-8 ?
Le Byte Order Mark (BOM) est une séquence d’octets placée au tout début d’un fichier texte. En UTF‑8, il vaut EF BB BF et n’est pas nécessaire, mais certains éditeurs l’ajoutent.
Repères essentiels à propos du BOM et de l’encodage :
1 Encodages et marqueur de début
Le BOM annonce l’ordre des octets pour UTF‑16/UTF‑32. En UTF‑8, il n’indique rien d’utile.
2 U+FEFF et confusions fréquentes
Historiquement U+FEFF servait aussi d’espace insécable zéro largeur. Aujourd’hui, U+FEFF est réservé au BOM.
3 Quand et pourquoi il apparaît
Ajouté par certains IDE/éditeurs ou exporteurs (Excel, CMS), surtout lors d’enregistrements par défaut.
4 Variantes et impacts techniques
Les BOM d’UTF‑16/UTF‑32 sont utiles, mais celui d’UTF‑8 cause surtout des effets de bord.
Problèmes classiques
En-têtes PHP déjà envoyés
Le BOM précède <?php et provoque "Cannot modify header information".
JSON/JS parse error
Un BOM au début d’un JSON entraîne "Unexpected token" côté navigateur ou backend.
CSV et premières colonnes décalées
EF BB BF se retrouve dans la première cellule et perturbe l’import ou les comparaisons.
Scripts et shebang invalides
Le BOM avant la ligne #!/usr/bin/env bash rend le script non exécutable correctement.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment le détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII identifie instantanément la présence d’un BOM UTF‑8 en tête de texte et signale précisément sa position et son impact potentiel sur vos traitements.
✅ Détection automatique
Reconnaissance des octets EF BB BF en tout début de contenu
📊 Analyse complète
Affichage des octets, du code U+FEFF et du contexte d’apparition
🧹 Nettoyage automatique
Suppression sûre du BOM UTF‑8 sans altérer le reste du fichier
💾 Export propre
Téléchargement immédiat en UTF‑8 sans BOM
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
const clean = s => hasBOM(s) ? s.slice(1) : s;
Python
open("fichier.txt", "r", encoding="utf-8-sig").read()
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant de parcourir vos fichiers à la main, utilisez Clean ASCII pour enlever EF BB BF en une étape et repartir sur un encodage UTF‑8 sans BOM.
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
⚙️ Automatiser
Checklist rapide
Conclusion
Le BOM UTF‑8 est minuscule mais peut bloquer des chaînes complètes de traitement. En l’ayant à l’œil, vous évitez des erreurs coûteuses et des heures de recherche.
Détectez-le systématiquement, supprimez-le quand il n’est pas requis et standardisez vos outils sur l’UTF‑8 sans BOM.
Vérifiez la présence d’un BOM UTF‑8 maintenant
Utilisez notre outil pour détecter et supprimer le BOM au début de vos fichiers.
Analyser mon fichier