Qu'est-ce que koi8 r (KOI8‑R) ?
KOI8‑R est un encodage 8 bits historique pour le russe (cyrillique), largement utilisé sur Unix, emails et BBS avant l’adoption massive d’UTF‑8.
Points essentiels à connaître sur koi8 r :
1 Plage ASCII et séparateurs conservés
KOI8‑R conserve l’ASCII imprimable et les séparateurs classiques.
2 Octets de contrôle ASCII
Codes 0 à 31 et 127 : toujours présents, comme en ASCII.
3 Cartographie cyrillique KOI8‑R
Spécificités importantes pour koi8 r :
4 Variantes et pièges techniques
À connaître avant toute manipulation :
Problèmes classiques
Copier-coller depuis emails/terminaux anciens
Injecte des octets KOI8‑R dans une application qui attend de l’UTF‑8 (mojibake assuré).
Tests unitaires qui échouent
Comparaison de chaînes faussée après une double conversion KOI8‑R ⇄ UTF‑8.
Trim() ou strip() inefficace
Ne corrige pas des octets KOI8‑R mal interprétés; il faut recoder, pas seulement tronquer.
Regex \s ou \w incomplètes
En mode UTF‑8, des octets 0x80–0xFF KOI8‑R peuvent provoquer « malformed UTF‑8 ».
Exemple de problème courant :
Symptômes qui doivent vous alerter
🚨 Signaux d'alarme
Comment les détecter
✨ Solution recommandée : Clean ASCII
Clean ASCII met en évidence les octets non‑ASCII et vous aide à repérer rapidement un texte en koi8 r. Il indique les positions suspectes et facilite la conversion vers UTF‑8 de manière fiable.
✅ Détection automatique
Repérage d’octets 0x80–0xFF, heuristiques d’encodage KOI8‑R
📊 Analyse complète
Positions exactes, pourcentage suspect, prévisualisation UTF‑8
🧹 Nettoyage automatique
Conversion KOI8‑R → UTF‑8 et normalisation cohérente
💾 Export propre
Fichier UTF‑8 prêt à l’emploi après correction
Autres méthodes de détection
Affichage dans l'éditeur
En ligne de commande (Unix)
En code
JavaScript
Python
Excel / Google Sheets
Nettoyer et prévenir
🚀 Solution rapide avec Clean ASCII
Avant d’écrire des scripts, utilisez Clean ASCII pour analyser et convertir un texte koi8 r vers UTF‑8 en quelques secondes :
Méthodes techniques avancées
🔧 Normaliser
🧹 Filtrer
recode_koi8r() pour vos flux entrants
⚙️ Automatiser
Checklist rapide
Conclusion
koi8 r reste présent dans des systèmes, emails et archives. Savoir l’identifier et le convertir évite des heures perdues face à du texte illisible.
Standardisez sur UTF‑8, contrôlez les encodages aux frontières de vos applications et automatisez la détection: vous éliminerez la plupart des soucis de compatibilité.
Détectez koi8 r et corrigez vos fichiers
Utilisez notre outil pour repérer un encodage KOI8‑R et convertir proprement vos textes en UTF‑8.
Analyser mon texte KOI8‑R