Qu'est-ce que latin1 (ISO-8859-1) ?
C'est un encodage sur un octet couvrant l'Europe occidentale. Simple et ancien, il coexiste encore avec UTF‑8 dans des systèmes, exports et fichiers hérités.
Principaux éléments à connaître sur latin1 :
1 Sous-ensemble ASCII commun
latin1 reprend l'ASCII pour les codes 0–127 : lettres non accentuées, chiffres, ponctuation.
2 Contrôles non imprimables
Codes 0–31 et 127 restent des contrôles hérités, à éviter dans des contenus texte usuels.
3 Plage étendue 160–255
Accents, symboles et NBSP sont codés dans la moitié supérieure :
4 Confusions fréquentes
Les erreurs viennent souvent de mélanges d'encodages :
Problèmes classiques
Copier-coller Word/web en cp1252
Introduit des guillemets typographiques et € (cp1252) qui n'existent pas en ISO-8859-1 pur.
Tests unitaires qui échouent
Chaînes identiques visuellement mais encodées différemment (UTF‑8 vs latin1).
Trim() ou strip() inefficace
NBSP (0xA0) en latin1 ne correspond pas à l'espace ASCII et peut rester collé.
Regex \s ou \w piégeuses
Selon le moteur et l'option Unicode, les classes n'incluent pas toute la plage 0xA0–0xFF.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII identifie rapidement les textes en latin1 ou mélangés cp1252/UTF‑8. L’analyse indique les octets problématiques, les positions et les remplacements conseillés vers UTF‑8 propre.
✅ Détection automatique
latin1 vs UTF‑8, cp1252, NBSP (0xA0), caractères hors plage
📊 Analyse complète
Codes hex, positions exactes, différences visibles/bytes
🧹 Nettoyage automatique
Conversion sûre vers UTF‑8, mappage guillemets cp1252
💾 Export propre
Téléchargement du texte normalisé prêt à intégrer
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant d'écrire des scripts, passez vos textes dans Clean ASCII : détection de latin1/cp1252, conversion sûre en UTF‑8, remplacement des NBSP et guillemets typographiques.
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
⚙️ Automatiser
Checklist rapide
Conclusion
latin1 est encore présent dans de nombreux flux. Les erreurs surviennent surtout lors des mélanges avec UTF‑8 ou cp1252.
Déclarez clairement les encodages, contrôlez vos imports et convertissez tôt vers UTF‑8 pour éviter la majorité des problèmes d'affichage et de parsing.
Vérifiez latin1 et corrigez vos textes
Utilisez notre outil pour identifier un encodage latin1, corriger les caractères cp1252 et convertir en UTF‑8.
Vérifier mon encodage