Qu'est-ce que ISO 8859-1 ?
ISO 8859-1, aussi appelé Latin-1, est un encodage sur 1 octet couvrant l'anglais et la plupart des langues d'Europe occidentale.
Voici les aspects essentiels à connaître :
1 Jeu de caractères et plage de codes
ASCII (0x00–0x7F) + lettres accentuées et symboles (0xA0–0xFF).
2 Différences avec UTF-8
UTF‑8 est multioctet et couvre tout Unicode. ISO 8859‑1 ne gère pas l’€ ni les guillemets typographiques.
'é' en UTF‑8: C3 A9
3 Variantes proches à ne pas confondre
Windows‑1252 ressemble à ISO‑8859‑1 mais ajoute des caractères 0x80–0x9F (€, guillemets typographiques, tiret long).
4 Transport et métadonnées
Déclarez toujours le charset côté HTTP/HTML, base de données et email. ISO‑8859‑1 n'a pas de BOM.
Problèmes classiques
Copier-coller entre UTF-8 et ISO-8859-1
Produit du mojibake (ex: "é" → "é") quand les octets UTF‑8 sont lus en Latin‑1.
Tests unitaires ou comparaisons qui échouent
Même rendu visuel mais octets différents (Latin‑1 vs UTF‑8) → égalités fausses, hachages différents.
En-têtes charset contradictoires
HTTP annonce ISO‑8859‑1, le fichier est UTF‑8 (ou l’inverse) → affichage cassé et import foireux.
Base MySQL en latin1, application en UTF-8
latin1_swedish_ci par défaut + SET NAMES incohérent = données corrompues lors des lectures/écritures.
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII facilite le diagnostic autour d’ISO 8859-1 : il met en évidence les caractères hors Latin‑1, repère les séquences UTF‑8 glissées par erreur et propose des conversions sûres.
✅ Détection automatique
Caractères hors ISO‑8859‑1, séquences UTF‑8, entités CP1252 invisibles
📊 Analyse complète
Octets, points de code, positions exactes, équivalents possibles
🧹 Nettoyage automatique
Conversion UTF‑8 ou mappage intelligent vers ASCII/Latin‑1
💾 Export propre
Téléchargement du texte converti et prêt à intégrer
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
const texte = decoder.decode(bytes);
Python
s.encode('latin-1', 'replace') # str → ISO-8859-1
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant de bricoler des scripts, passez votre texte dans Clean ASCII pour identifier les caractères hors ISO 8859‑1, convertir vers UTF‑8 proprement ou mapper vers des équivalents sûrs.
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
⚙️ Automatiser
Checklist rapide
Conclusion
ISO 8859‑1 a longtemps été la norme en Europe de l’Ouest. Aujourd’hui, l’unification sur UTF‑8 simplifie les échanges, mais comprendre Latin‑1 reste indispensable pour maintenir des systèmes existants et fiabiliser les imports/exports.
Déclarez clairement le charset, détectez les mélanges ISO‑8859‑1/UTF‑8 et convertissez proprement : vous évitez l’essentiel des problèmes d’affichage et de parsing.
Vérifiez vos fichiers ISO 8859-1 maintenant
Utilisez notre outil pour repérer les caractères hors Latin‑1, détecter les séquences UTF‑8 et convertir sans perte.
Analyser mon texte