jeudi 26 octobre 2006, par Serge Heiden
Toutes les versions de cet article :
La terminologie adoptée pour cette fiche est celle de la Text Encoding Initiative.
Structure du texte
group : groupe de textes [1] ;
text : unité textuelle [2] ;
div : différents niveaux de sections (partie, chapitre, section…) ;
p : paragraphe ;
ab : structure de la taille d’un paragraphe sans en avoir le rôle ;
lg : groupe de vers.
Segmentation de référence
lb : passage à la ligne ;
pb : changement de page ;
s : délimitation de phrase.
Analyses
corr, sic, reg, orig, choice : interventions éditoriales ;
g , charDesc : analyses graphiques ;
w, lem : analyses linguistiques.
Images
figure : délimitation d’une portion graphique d’un texte ;
ptr, link : liens entre différents éléments d’un texte.
Le codage de chaque type d’information est optionnel. Mais dans la mesure du possible, il est demandé de coder le maximum d’informations possible. En tout état de cause, il est demandé d’expliciter dans les textes les codes correspondant aux rubriques décrites ici et préexistants à l’échange. Pour les informations préexitantes non décrites ici, il est recommandé de les transmettre en l’état.
L’encodage Unicode et le format XML ne sont pas obligatoires, mais recommandés. Les textes utilisant d’autres représentation du codage doivent être accompagnés d’une notice explicitant le codage utilisé en lien avec les rubriques de codage décrites dans cette fiche.