Codes ASCII : table, caractères de contrôle et usages concrets

Qu'est-ce que les codes ASCII ?

ASCII décrit 128 codes (0–127) pour représenter des caractères : lettres, chiffres, ponctuation et commandes de contrôle.

Principales catégories à connaître lorsque l'on parle de codes ASCII :

1 Caractères imprimables et séparateurs ASCII

Espace, tabulation horizontale, retour chariot, saut de ligne.

Espace (32), Tab (9), CR (13), LF (10)

2 Caractères de contrôle ASCII

Codes 0 à 31 et 127 : NUL, BEL, ESC, commandes de flux et d'affichage.

NUL (0), BEL (7), ESC (27), DEL (127)

3 Extensions et confusions autour d'ASCII

Souvent confondus avec ASCII mais situés hors 0–127 :

NBSP (U+00A0) - Non-ASCII mais fréquent dans le web

ZWSP (U+200B) - Non-ASCII, espace zéro largeur

U+00E9 (é) - Lettre accentuée, hors ASCII

ASCII étendu (0–255) dépendant des pages de codes (ISO-8859-1, CP1252)

4 Marques techniques et conventions

Éléments liés aux fichiers texte et aux flux :

BOM (U+FEFF) - Non utilisé en ASCII, peut perturber certains parseurs

Séquences EOL - CR (13), LF (10), CRLF (13 10)

^M visible - Marque CR dans des contextes Unix

ESC [ ... - Séquences ANSI pour le terminal

Problèmes classiques avec les codes ASCII

Copier-coller depuis le web

Introduit des caractères non-ASCII (NBSP, typographiques) dans des fichiers censés rester en ASCII 7 bits.

Tests unitaires qui échouent

Une chaîne attendue en ASCII contient un caractère hors 0–127, les comparaisons ou normalisations échouent.

Trim() ou strip() trompeur

Les fonctions basées sur l'espace ASCII (0x20) n'enlèvent pas les blancs non-ASCII comme NBSP.

Regex \s ou \w limitées

Selon le moteur, elles couvrent l'ASCII mais pas les caractères non-ASCII, ce qui fausse la validation.

Exemple de problème courant :

# Deux adresses semblent identiques mais l'une n'est pas ASCII

string1 = "email@domain.com"

string2 = "email@domain.com " # Contient NBSP (U+00A0) hors ASCII

assert string1 == string2 # ❌ Échec

Symptômes qui doivent vous alerter

🚨 Signaux d'alarme

!

Un diff git indique des changements invisibles (apparition de ^M, caractères non-ASCII)

!

Un parse CSV sur base ASCII n'a plus le bon nombre de colonnes

!

Un .env échoue car une clé contient un caractère hors ASCII

!

L'éditeur affiche des blocs ou ^@ lors des déplacements du curseur

!

Un copier-coller dans un terminal provoque une commande invalide à cause de 0xA0 ou CRLF

Comment travailler avec les codes ASCII

✨ Solution recommandée : Clean ASCII

Clean ASCII met en évidence les codes ASCII et les caractères hors plage. Analysez votre texte en temps réel, visualisez les octets, repérez CR/LF et les caractères non-ASCII, et appliquez des remplacements sûrs.

✅ Détection automatique

Caractères hors ASCII, contrôles 0–31/127, espaces et fins de ligne

📊 Analyse complète

Codes hex/dec, positions, aperçu des octets et suggestions

🧹 Nettoyage automatique

Conversion vers ASCII 7 bits, substitution intelligente

💾 Export propre

Téléchargement du texte nettoyé, prêt pour scripts et CSV

🔍 Vérifier mes codes ASCII

Autres méthodes de vérification

Affichage dans l'éditeur

✓ Activez "render whitespace", "show end of line" pour voir CR/LF et TAB

✓ Utilisez une extension qui met en évidence les caractères hors ASCII

En ligne de commande (Unix)

# Repérer les octets hors ASCII 7 bits imprimables + TAB/CR/LF

grep -P "[^\x09\x0A\x0D\x20-\x7E]" fichier.txt

# Visualiser les fins de ligne et tabulations

sed -n l fichier.txt

# Afficher les caractères de contrôle

cat -A fichier.txt

# Inspecter les codes hexadécimaux

hexdump -C fichier.txt

En code

JavaScript

Array.from(str).map(c => c.charCodeAt(0).toString(16))

Python

[f"{ord(c):04x}" for c in s if ord(c) > 126 or ord(c) < 32]

Excel / Google Sheets

CODE(MID(cellule;position;1))

Nettoyer et prévenir avec l'ASCII

🚀 Solution rapide avec Clean ASCII

Avant d'écrire des scripts, passez votre texte dans Clean ASCII pour un contrôle et une conversion immédiats :

✓ Détection des hors ASCII

✓ Nettoyage vers ASCII 7 bits

✓ Export immédiat

Nettoyer maintenant

Méthodes techniques avancées

🔧 Normaliser

✓ Utilisez une normalisation Unicode (NFKD) suivie d'un filtrage vers ASCII si nécessaire

✓ Évitez le BOM en UTF-8 pour des flux ASCII/UTF-8 compatibles

✓ Uniformisez les fins de ligne (dos2unix, gitattributes)

🧹 Filtrer

✓ Écrivez des fonctions to_ascii() pour conserver 0x09, 0x0A, 0x0D et 0x20–0x7E

✓ Remplacez les accents et typographies par des équivalents ASCII

✓ Bloquez les caractères de contrôle hors LF/CR/TAB dans les entrées

⚙️ Automatiser

✓ Hooks pre-commit pour refuser les octets hors 0x00–0x7F si ASCII requis

✓ Tests de sanitation et d'encodage sur les inputs utilisateurs

✓ Linting et vérification ASCII/UTF-8 dans le pipeline CI

Checklist rapide

Fichiers en UTF-8 sans BOM compatibles ASCII 7 bits

Fins de ligne uniformes via gitattributes

Affichage des espaces, contrôles et ^M dans l'éditeur

Fonction de conversion vers ASCII dans vos libs

Tests empêchant l'introduction de caractères non-ASCII

Documentation développeurs sur ASCII, Unicode et retours à la ligne

Conclusion

Les codes ASCII sont le socle de nombreux formats et protocoles. Les maîtriser permet d'éviter une grande partie des erreurs de parsing et d'encodage.

Adoptez une détection systématique, contrôlez les fins de ligne, et filtrez toute donnée hors ASCII quand le contexte l'exige.

Codes ASCII : comprendre et bien utiliser la table ASCII