Qu'est-ce que UTF-8 sans BOM ?
C'est un fichier encodé en UTF-8 qui ne commence pas par l'octet de signature BOM (EF BB BF). Cette absence évite l'injection d'un caractère invisible au tout début des contenus.
Points essentiels à connaître pour travailler en UTF-8 sans BOM :
1 UTF‑8 avec BOM vs sans BOM
Le BOM ajoute 3 octets au début du fichier. Sans BOM, aucun octet de signature.
2 Signatures d'encodage courantes
Certains encodages utilisent une marque en tête de fichier.
3 Fins de ligne et interopérabilité
Les EOL influent autant que le BOM sur la compatibilité entre systèmes.
4 Cas techniques liés au BOM
Quand le BOM perturbe votre outillage ou votre code :
Problèmes classiques
Sauvegarde "UTF-8 with BOM" par défaut
Certains éditeurs ajoutent le BOM et polluent l'ouverture de CSV/JSON.
PHP: "Cannot modify header information"
Le BOM ajoute des octets avant tout output et casse l'envoi d'en-têtes.
CSV: entête "id" ou colonne décalée
Le BOM en tête de fichier devient des glyphes erronés dans certains outils.
JSON/API: caractère avant { ou erreurs de parsing
Un U+FEFF en préfixe rend la réponse non conforme chez certains clients.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII identifie immédiatement la présence d'un BOM et vérifie que vos fichiers sont en UTF‑8 sans BOM. Il met en évidence les octets EF BB BF, les fins de ligne et autres caractères problématiques.
✅ Détection automatique
BOM (EF BB BF), fins de ligne, caractères de contrôle
📊 Analyse complète
Positions exactes, encodage, suggestions de correction
🧹 Nettoyage automatique
Suppression du BOM, normalisation en UTF‑8 sans BOM
💾 Export propre
Téléchargement des fichiers convertis et normalisés
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Passez vos fichiers en UTF‑8 sans BOM en un clic
Avant d'écrire des scripts de conversion, utilisez Clean ASCII pour supprimer le BOM et normaliser vos fins de ligne :
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
strip_bom() qui retire EF BB BF en tête
⚙️ Automatiser
grep -rPl "^\xEF\xBB\xBF")
Checklist rapide
Conclusion
En adoptant UTF‑8 sans BOM partout, vous éliminez une grande partie des erreurs sournoises liées à l'encodage.
Standardisez l'encodage, supprimez le BOM et normalisez vos fins de ligne : vos pipelines texte, APIs et fichiers de config seront plus prévisibles et robustes.
Vérifiez vos fichiers en UTF‑8 sans BOM
Utilisez notre outil pour détecter et supprimer le BOM, puis exporter des fichiers propres.
Contrôler et convertir