Traitement informatique des jeux de caractères

MASTER PLURITAL

Gestion informatique du Multilinguisme (GIM)

Jean-François Perrot & Marie-Anne Moreaux

L'examen a eu lieu le mardi 15 janvier 2013, de 12h à 15h, au PLC, salle 4.10
Consultez le corrigé.

Tous documents autorisés

Une première version du cours du 18/12/2012 : Perl, expressions régulières & Unicode est en ligne.


  1. Présentation
  2. Plan d'ensemble
  3. Plan de marche 2012-2013

  1. Présentation

  2. Plan d'ensemble

    1. Introduction et soubassement technique,
      • Nature de l'information : Bits, Octets, Caractères, le code ASCII à 7 bits
      • Problèmes matériels (processus de lecture, d'écriture, de transmission).

    2. Les tables sur 8 bits
      • Extensions du code ASCII
      • Variations suivant les plates-formes
      • Diversité géographique

    3. Unicode
      1. Principe, format UTF-8
      2. Problèmes d'écriture bidirectionnelle, de tri alphabétique, de caractères combinés

    4. Exemples de mise en œuvre en divers langages de programmation

  3. Plan de marche 2012-2013

    Les cours ont lieu au PLC, salle 509, de 12h à 15h.
    Les TDs ont lieu au PLC, salle 703 en deux groupes
    • de 12h à 13h30 pour le groupe 1
    • de 13h30 à 15h pour le groupe 2.
    La répartition en 2 groupes sera effectuée lors du premier cours, le 2 octobre.

    Les pages web qui sont données ici sont celles du cours 2011-2012.
    Elles seront mises à jour progressivement.
    Pour vous tenir au courant, abonnez-vous au fil RSS du cours GIM !

    1. 02/10 Cours 1 : Des octets au code ASCII
    2. 09/10 TDs 1

    3. 16/10 - Cours 2 : Caractères, Glyphes et Polices
      Problèmes généraux du texte sur machine :
      saisie, sauvegarde, affichage, transmission
    4. 23/10 - TDs 2

      -------- 29/10 - 3/11 congés d'automne --------

    5. 06/11 - Cours 3 : Codes sur 8 bits
      Histoire de la normalisation ASCII (89)
      Idée des ASCII étendus (extensions européennes : lettres diacritisées
      et extensions différentes : arabe, hébreu, etc.)
      et des variations selon les plateformes.

    6. 13/11 - TDs 3

    7.  20/11 - Cours 4 : Unicode (1) 
      Principe - format UTF-8
       
    8. 27/12 - TDs 4

    9. 04/12 - Cours 5 : Unicode (2) 
      Algorithme droite-gauche, ordre alpha, caractères combinés
    10. 11/12 : TDs 5

    11.  18/12 - Cours 6 : Exemples de mise en œuvre
      Programmation en C et en JavaScript

      -------- Vacances d'hiver --------

    12. 08/01/2013 - TDs 6

L'examen aura lieu le mardi 15 janvier 2013, de 12h à 15h, au PLC, salle 4.10

Tous documents autorisés