Qu'est-ce que UTF-16 BE ?
UTF‑16 BE encode chaque caractère sur 16 bits, en stockant l’octet de poids fort en premier (Big Endian).
Il peut commencer par un marqueur (BOM) FE FF indiquant l’ordre des octets.
Voici les éléments clés à connaître sur UTF‑16 BE :
1 Ordre des octets et représentation binaire
Chaque code point basique est stocké sur 2 octets (MSB → LSB).
2 BOM (Byte Order Mark)
Le BOM en UTF‑16 BE est FE FF. Son absence rend la détection de l’ordre des octets plus difficile.
3 Paires de substituts (surrogates)
Les caractères au-delà de U+FFFF utilisent deux unités de code (haute et basse).
4 Points d’attention techniques
Confusions fréquentes entre UTF‑8, UTF‑16 LE et UTF‑16 BE, présence de BOM, et outils non compatibles.
Problèmes classiques
Fichier UTF‑16 BE traité comme UTF‑8
Apparition de caractères Â, � ou ^@ dans les sorties et CSV illisibles.
Tests qui échouent sans raison
Comparaisons binaires fausses à cause d’un BOM ou de null bytes intercalés (00 xx).
Longueurs et trims incohérents
Fonctions de chaîne qui comptent des octets au lieu de caractères, strlen() inattendu.
Regex et parsers perturbés
Expressions régulières écrites pour des octets ASCII qui cassent sur UTF‑16 BE.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII identifie rapidement l’encodage d’un texte, repère UTF‑16 BE et son BOM, et propose une conversion sûre vers UTF‑8, prête pour vos pipelines et applications web.
✅ Détection automatique
BOM FE FF, ordre des octets, validation des unités de code
📊 Analyse complète
Encodage détecté, taille réelle, anomalies et suggestions
🧹 Conversion fiable
UTF‑16 BE → UTF‑8 en préservant tous les caractères
💾 Export propre
Téléchargement en UTF‑8 sans BOM, prêt à l’emploi
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Conversion rapide avec Clean ASCII
Avant d’écrire des scripts personnalisés, essayez Clean ASCII pour convertir un fichier UTF‑16 BE en UTF‑8 proprement :
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
to_utf8() (iconv/mb_convert_encoding)
⚙️ Automatiser
Checklist rapide
Conclusion
UTF‑16 BE n’est pas un ennemi, mais il devient source d’erreurs quand il est traité comme UTF‑8. Savoir repérer le BOM, l’ordre des octets et les surrogates vous fait gagner un temps précieux.
Détectez l’encodage, convertissez vers UTF‑8 quand c’est pertinent et intégrez ces contrôles à votre pipeline.
Vérifiez et convertissez vos fichiers UTF‑16 BE
Utilisez notre outil pour identifier UTF‑16 BE, retirer le BOM et convertir en UTF‑8 proprement.
Analyser et convertir