Traitement informatique des jeux de caractères

MASTER PLURITAL

Gestion informatique du Multilinguisme (GIM)

Jean-François Perrot & Marie-Anne Moreaux




L'examen a eu lieu le mardi 24 janvier 2012, à Nogent, de 14h à 17h (examen sur table, tous documents autorisés)
Les examens des années précédentes, avec leurs corrigés, sont accessibles via les archives annuelles
- mais notez bien que le cours évolue, et l'examen aussi !

Voici un corrigé.

  1. Présentation
  2. Plan d'ensemble
  3. Plan de marche 2011-2012 (modifié le 6/11/2011)

  1. Présentation

  2. Plan d'ensemble

    1. Introduction et soubassement technique,
      • Nature de l'information : Bits, Octets, Caractères, le code ASCII à 7 bits
      • Problèmes matériels (processus de lecture, d'écriture, de transmission).

    2. Les tables sur 8 bits
      • Extensions du code ASCII
      • Variations suivant les plates-formes
      • Diversité géographique

    3. Unicode
      1. Principe, format UTF-8
      2. Problèmes d'écriture bidirectionnelle, de tri alphabétique, de caractères combinés

    4. Exemples de mise en œuvre en divers langages de programmation

  3. Plan de marche 2011-2012

    Les pages web qui sont données ici sont celles du cours 2010-2011.
    Elles seront mises à jour progressivement.
    Pour vous tenir au courant, abonnez-vous au fil RSS !

    1. 04/10 - Cours 1 : Des octets au code ASCII
    2. 11/10 TPs 1

    3. 18/10 - Cours 2 : Caractères, Glyphes et Polices
      Problèmes généraux du texte sur machine :
      saisie, sauvegarde, affichage, transmission
    4. 25/10 - TPs 2

      -------- 01/11 Toussaint : férié --------

    5. 08/11 - Cours 3 : Codes sur 8 bits
      Histoire de la normalisation ASCII (89)
      Idée des ASCII étendus (extensions européennes : lettres diacritisées
      et extensions différentes : arabe, hébreu, etc.)
      et des variations selon les plateformes.


      -------- 15/11 Ni cours ni TP : absence simultanée des deux enseignants --------

    6. 22/11 - TPs 3

    7.  29/11 - Cours 4 : Unicode (1) 
      Principe - format UTF-8
       
    8. 06/12 - TPs 4

    9. 13/12 - Cours 5 : Unicode (2) 
      Algorithme droite-gauche, ordre alpha, caractères combinés

      -------- Vacances de Noël --------

    10. 03/01/2012 : TPs 5
    11. 10/01/2012 : TPs 6

      le Cours 6 : Exemples de mise en œuvre
      Programmation en C et en JavaScript
      est supprimé

    12. Examen entre le 16 et le 28 janvier.