Accueil du site > Recommandations > Codage de texte > recommandations de codage des textes du CCFM

recommandations de codage des textes du CCFM

jeudi 26 octobre 2006, par Serge Heiden

Toutes les versions de cet article :

  • [français]

Rubriques de codage

La terminologie adoptée pour cette fiche est celle de la Text Encoding Initiative.

Niveau 1

Structure du texte

- group : groupe de textes [1] ;

- text : unité textuelle [2] ;

- div : différents niveaux de sections (partie, chapitre, section…) ;

- p : paragraphe ;

- ab : structure de la taille d’un paragraphe sans en avoir le rôle ;

- lg : groupe de vers.

Segmentation de référence

- lb : passage à la ligne ;

- pb : changement de page ;

- s : délimitation de phrase.

Niveau 2

Analyses

- corr, sic, reg, orig, choice : interventions éditoriales ;

- g , charDesc : analyses graphiques ;

- w, lem : analyses linguistiques.

Images

- figure : délimitation d’une portion graphique d’un texte ;

- ptr, link : liens entre différents éléments d’un texte.

Usage de ces rubriques

Le codage de chaque type d’information est optionnel. Mais dans la mesure du possible, il est demandé de coder le maximum d’informations possible. En tout état de cause, il est demandé d’expliciter dans les textes les codes correspondant aux rubriques décrites ici et préexistants à l’échange. Pour les informations préexitantes non décrites ici, il est recommandé de les transmettre en l’état.

L’encodage Unicode et le format XML ne sont pas obligatoires, mais recommandés. Les textes utilisant d’autres représentation du codage doivent être accompagnés d’une notice explicitant le codage utilisé en lien avec les rubriques de codage décrites dans cette fiche.