SlideShare a Scribd company logo
1 of 59
Download to read offline
Atelierpratiqued’éditionXML/TEI
EmmanuelleMorlock
IGE CNRS, UMR 5189
Proposé dans le cadre du Staged’ecdotique2015
de l’Institut Sources Chrétiennes, Lyon, 18/02/2015
cf. http://ecdotique.hypotheses.org/stages-et-formation/la-semaine-decdotique
Objectifs de l’atelier
★ Présenter la TEI et quelques notions technique indispensables
★ Montrer que le balisage est une activité intellectuelle et analytique
★ Pratiquer l’encodage en deux étapes :
○ Encodage d’un court texte
○ Encodage d’un apparat critique à partir de votre “cahier de collation”
★ Utiliser des outils de visualisation du résultat de l’encodage et de relecture
○ Simple feuille de style CSS personnalisable selon des objectifs de relecture
○ Critical edition toolbox : pour faciliter le contrôle des encodages complexes
○ Modèle d’édition critique DIPLE (Ec. Nat. des Chartes)
○ Versioning Machine pour la visualisation parallèle de plusieurs témoins
Introduction
Qu’est-ce que la TEI ?
Pourquoi utiliser XML pour une édition numérique ?
Quelques exemples commentés
La TEI c’est tout à la fois...
★ Un cadre d’encodage gratuit et libre
○ un cadre conceptuel pour la représentation des textes
○ une architecture informatique modulaire et évolutive
○ des “Guidelines” = documentation utilisateur des recommandations d’encodage
○ un modèle de document
★ Un écosystème
○ des outils très nombreux et variés
○ un consortium international
○ une communauté d’utilisateurs actifs
★ Plus qu’un “format standard”
○ un mécanisme pour produire des schémas de contrôle et de validation personnalisés
○ un mécanisme permettant de rendre explicite des lectures/interprétations d’un texte
○ un format permettant à l’archivage à long terme des données numériques
Mais ce n’est pas...
★ Le seul standard dans le domaine de la représentation des textes
★ Un cadre contraingnant ( = “explique-moi ce que tu fais” et pas “fais ainsi”)
★ Non-interprétatif ou “objectif”
★ Utilisé de manière uniforme (même au sein d’un même projet)
★ Un standard stable et non-évolutif
★ Une finalité en soi
★ Un format de publication automatique
★ L’assurance de la préservation à long très terme...
cf. James Cummings, “What is the TEI? And why should I care? “ (27/01/2015) <https://prezi.com/jcvxvvzecc1y/what-is-
the-tei-and-why-should-i-care-a-brief-introduction-for-classicists/>
www.tei-c.org
http://books.openedition.org/oep/679 http://www.sources-chretiennes.mom.fr/upload/doc/20110505-StageEcdotique-Hisoma-TEI-FClavaud.pdf
http://dh.obdurodon.org/what-is-xml.xhtml
Pourquoi utiliser XML
pour une édition numérique de sources ?
XML en (très) bref
1. XML ne sert pas à afficher les données mais à les décrire. Il ne fait rien.
Appliqué à la représentation des textes, il permet de décrire notamment leur structure (livre,
section, chapitre, paragraphe, phrase, mot…)
2. Les balises ne sont pas prédéfinies
On peut librement créer ses propres balises (en fonction de la structure logique qu’on choisit de
représenter par exemple)
3. On peut l’utiliser avec une “grammaire” de balises (DTD ou Schéma)
Pour donner de la rigueur et encoder avec un langage commun entre projets
4. XML est auto-descriptif et assez facilement lisible
On peut prendre connaissance de la structure d’un corpus assez rapidement en ouvrant
simplement le fichier avec n’importe quel éditeur de texte
Principe du balisage descriptif 1
★ Délimitation de segments de texte de toutes tailles
+
★ Explicitation de leur nature ou fonction
<baliseX>Contenu textuel</baliseX>
Balise
ouvrante
Balise
fermante
Segment
balisé
Principe du balisage descriptif 2
★ Les attributs précisent le sens des balises
<handNote xml:id="EP" medium="red-ink">
Ezra Pound's annotations.
</handNote>
Valeur de
l’attribut
Attribut
Principe du balisage descriptif 3
★ Le balisage descriptif = décrit les données sans indication de traitement
★ Le principe est celui de la séparation du contenu et de la présentation.
★ Comparez :
○ <author>Louise Labé</author>
○ <span class=”small-caps”>Louise Labé</span>
★ Le but est de décrire la fonction plus que l’apparence du rendu final :
○ c’est cela qui offre la flexibilité maximale permettant des chaînes
éditoriales “multi-support” : le rendu est traité à une étape ultérieure, et
peut être adapté à chaque support, au contexte de réception ou
dispositif de lecture...
Concrètement
Fichier XML :
<author><forename>Louise</forename>
<surname>Labé</surname></author>
Fichier CSS :
surname { font-variant: small-caps; font-family:
Times; }
Résultat :
Louise LABÉ
Une source unique, des usages multiples
★ Un texte explicité et enrichi au moyen d’un métalangage simple, clair,
universel, permettant de baliser n’importe quel type de texte
★ Une source “matrice”, à partir de laquelle on peut produire des versions
différentes (vue normalisée vs vue diplomatique ; version pour le web, pour
les liseuses, version “grand public, version savante)
★ Un fichier lisible par les humains (contrairement aux fichiers binaires)
★ Un fichier utilisable pour des recherches fines, des extractions ciblées, des
analyses automatiques...
★ Un format libre, facilitant l’intéropérabilité
En quoi consiste
l’encodage TEI ?
Comparez
● <titre>Phèdre</titre>
● <persName>Phèdre</persName>
● <hi rend=”italics”>Phèdre</Phèdre>
Quelques principes à retenir
★ Texte vs Document
○ Le texte est une abstraction que l’on construit et que l’on peut encoder
○ Un document est un objet que l’on peut numériser
★ XML considère le texte comme un système de
hiérarchies ordonnées d’objets de contenus
(les balises doivent être strictement imbriquées)
★ L’encodage consiste à représenter l’information dans des structures
arborescentes, en codant ces structures de manière compréhensible à un
ordinateur.
Structure d’un fichier TEI
Processus global
pour une édition numérique de sources ?
Quoi encoder ? 4 dimensions principales
★ L’apparence physique et visuelle
○ représentation mimétique +/- transférable d’un support à un autre
★ La dimension linguistique et structurelle
○ qu’un lecteur humain peut décoder puis la transcrire ou la traduire
★ La dimension sémantique
○ que l’on peut comprendre (ou pas !) et annoter
★ Le contexte de production ou de réception
○ que l’on peut décrire par le biais de métadonnées
Analyse préalable
★ Il s’agit d’identifier :
○ les éléments structurants et les caractéristiques principales du doc.
○ identifier les caractéristique liées aux centres d’intérêt de l’éditeur
★ Les deux peuvent venir de :
○ “pseudo-balisage” : déjà présents dans le document
○ explicitations issues du savoir externe de l’analyste
★ Au final, il s’agira toujours d’expliciter ce qui paraît important et les raisons
de ses choix d’une manière la plus formalisée possible
Processus
★ Analyse du document = quoi encoder ? = analyse et qualifiation des fonctions
des objets d’intérêt
★ Choix des balises / création d’un schéma personnalisé (à l’aide ou non du
fichier de spécification ODD (One Document Does it all)
★ Balisage par approfondissements successifs
★ Présenter le document : via des “feuilles de style” CSS ou XSLT
○ CSS : simple, attribution de caractéristiques visuelles aux balises
○ XSL : plus complexe, permet de transformer le document XML
★ Exploiter le document : langages de requête XPath et XQuery...
Exemples de balisages
Substitution
.
<subst> <subst>
<del/>
<add/>
</subst>
.. are all included. <del hand="#RG">It is</del>
<subst>
<add>T</add>
<del>t</del>
</subst>he expressed
Abréviation avec expansion
.
<abbr> <choice>
<abbr/>
<expan/>
</subst>
<choice>
<abbr>&amp;</abbr>
<expan>et</expan>
</choice>
Développement éditorial
.
<ex>
<expan xml:lang=”la”>
<abbr>Imp</abbr>
<ex>erator</ex>
</expan>
Changements de main
.
<handshift> milestone (balise sans contenu)
Lorem ipsum dolor
<handshift medium=”encre-verte” new=”#h1”/>
sit amet
(...)
ailleurs dans le doc :
<handNote xml:id=”h1”>Ecriture très régulière </handshift>
Incertain
.
<unclear>
Vade retro
<unclear reason=”tache-d-encre” cert=”medium” resp=”#EM”>
Satanas
</unclear>
texte restitué
.
<supplied>
Il se retrouvait parmi le <supplied>reason=”erreur-du-scribe ”
>s</supplied> siens.
Exemples
http://www.berardier.org/
http://vangoghletters.org/
http://godwindiary.bodleian.ox.ac.uk/index2.html
http://txm.bfm-corpus.org/
Atouts d’un balisage TEI
Expressivité
Exploitabilité
Evolutivité
Réutilisabilité
Permet également de repousser certains choix au moment de l’utilisation et pas de la production !
par ex. normalisations : on encode les deux leçons, c’est le lecteur qui choisit !
Exercices pratiques
Programme
1. Prise en main de l’éditeur XML Oxygen Editor
2. Exercice : Transcription d’un court texte
3. Principes de transcription d’un apparat critique
4. Exercice : transcription du cahier de collation
5. Visualisations :
a. Diple (présentation classique avec affichage des variantes au survol de
la souris)
b. Versioning machine (voir en parallèle les différents témoins)
Prise en main
d’Oxygen Editor
Découverte de l’interface
★ Personnaliser l’espace de travail
★ Préférences : choisir le navigateur par défaut :
○ Safari (de préférence) ou Firefox
★ Expérimenter :
○ saisie d’une balise
○ balises possibles dans le contexte
○ valeurs possibles d’un attribut
○ documentation contextuelle
○ CTRL (CMD) + E
○ style
Exercice 1
Transcription d’une page d’un manuscrit
de Flaubert extrait des Dossiers documentaires de
Bouvard et Pécuchet
Ms g226 (8) f°198 - conservé à la Bibliothèque municipale de Rouen
http://www.dossiers-flaubert.fr/cote-g226_8_f_198__r____
Exercice de transcription en TEI
★ Depuis Oxygen, ouvrez le fichier : “TEI_exercice_SC/content/modele_exercice_0.xml”
★ Le fichier à transcrire se trouve dans : “TEI_exercice_SC/sources/exercice-flaubert”
★ Processus à suivre :
a. Analyser le document
b. Copier le texte dans l’éditeur (depuis “DBP_8_198_r_texte_avec_sauts_de_ligne.txt”)
c. Baliser :
i. la structure
ii. les interventions éditoriales de l’auteur (ajouts, suppressions, substitutions...)
iii. les normalisations
iv. les entités nommées
v. … et tout autre caractéristique qui vous paraît pertinente
Analyse du document
Objectifs :
★ repérer la structure textuelle
★ identifier les “distinctions”
pertinentes pour votre projet
éditorial ou les analyses souhaitées :
○ Orthographe ?
○ Variantes graphiques des lettres ?
○ Capitalisations ?
○ Ponctuation ?
○ Abréviations ?
○ Mise en page ?
○ Ajouts, suppressions ?
○ erreurs, omissions ?
○ etc.
Coller le texte dans le fichier xml
Baliser : à vous de jouer !
★ utilisez au choix la vue “auteur” ou “texte”
Quelques balises TEI courantes
Pour une information détaillée sur le modèle de données ou les attributs
possibles des balises TEI, se reporter à la documentation en ligne sur le site de la
TEI : http://www.tei-c.org/
<lb/> Saut de ligne
<head> titre
<div> division
<p> paragraphe
<del> suppression
<add> ajout
<subst> substitution
<choice> balisages alternatifs
<orig> forme originale
<reg> forme régularisée
<placeName> Nom de lieu
<persName> Nom de personne
Voir le résultat dans un navigateur
★ Cliquez sur le bouton “ouvrir dans le navigateur”
★ Le fichier s’affiche en fonction de la feuille de style CSS indiquée par les
instructions de traitement du début du fichier (donnés par le modèle)
Transformer le résultat
Utilisez les feuilles de style XSL de la TEI fournies avec
Oxygen :
★ Cliquez sur le bouton “configurer un scénario de transformation”
★ Choisissez le scénario de votre choix dans la liste “TEI P5”
○ xhtml, pdf, odt, etc.
Encoder l’apparat critique
Théorie
★ Cf. diaporama de M. Burghart (EHESS, UMR CIHAM)
★ cf. fichier pdf “Antisèche” dans le dossier
“TEI_exercice_SC/sources/exercice-JdeVitry”
Exemple 1 : pseudo-edition-test-file.xml
Déclaration de la méthode d’encodage :
<variantEncoding method="parallel-segmentation"
location="internal"/>
dans teiHeader//encodingDesc
Exemple 1 : pseudo-edition-test-file.xml
Liste des témoins
<front><div>
<listWit>
<witness xml:id="A">Manuscript A</witness>
<witness xml:id="B">Manuscript B</witness>
<witness xml:id="C">Manuscript C</witness>
<witness xml:id="D">Manuscript D</witness>
<witness xml:id="E">Manuscript E</witness>
</listWit>
</div></front>
Exemple 1 : pseudo-edition-test-file.xml
Groupes de variantes :
Exemple 1 : pseudo-edition-test-file.xml
Enchâssement de notes d’apparat :
Exercice 2
Transcription de votre cahier de collation
établi cette semaine (Valerio del Bierzo)
Encore à vous de jouer...
★ Ouvrez le fichier : TEI_exercice_SC/content/modele_apparat_critique.xml
★ à partir de votre cahier de collation
(ou de la mise en commun du stage d’ecdotique 2014 cf.
TEI_exercice_SC/sources/exercice-valere/stage SC.2014Travail2bis.doc), complétez le
fichier...
La granularité de la variation dépend des choix de l’
encodeur...
“Contrôle qualité”
Visualisez et contrôlez votre encodage à l’aide de l’outil
développé par M. Burghart “TEI Critical Edition Toolbox”
http://ciham-digital.huma-num.fr/teitoolbox/
Visualisations
Diple
http://developpements.enc.sorbonne.fr/diple/theme/enc/index.php
Versioning machine
http://v-machine.org/
2 façons différentes de transformer votre
fichier XML
Diple : dé-commentez l’instruction de traitement “<?xml-
stylesheet href="../src/vmachine.xsl" type="text/xsl" ?> ”
et lancez votre navigateur...
Versionning machine : copiez le fichier dans
“TEI_exercice_SC/vmachine_MB/samples” puis lancez votre
navigateur…

More Related Content

What's hot

Html de base
Html de baseHtml de base
Html de basekrymo
 
Intégration #2 : HTML 101 : Back to Basics
Intégration #2 : HTML 101 : Back to BasicsIntégration #2 : HTML 101 : Back to Basics
Intégration #2 : HTML 101 : Back to BasicsJean Michel
 
XML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQueryXML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQueryRachid NID SAID
 
Prsentationhtml5 html5 ii twebteck
Prsentationhtml5 html5 ii twebteckPrsentationhtml5 html5 ii twebteck
Prsentationhtml5 html5 ii twebteckTECOS
 
Intégration Web HTML 5 & CSS 3
Intégration Web HTML 5 & CSS 3Intégration Web HTML 5 & CSS 3
Intégration Web HTML 5 & CSS 3Stephane PERES
 
Présentation html5
Présentation html5Présentation html5
Présentation html5Kénium
 
Normes de base du Web GTI780 & MTI780 ETS A09
Normes de base du Web  GTI780 & MTI780  ETS   A09Normes de base du Web  GTI780 & MTI780  ETS   A09
Normes de base du Web GTI780 & MTI780 ETS A09Claude Coulombe
 
Kits formation html-les_bases
Kits formation html-les_basesKits formation html-les_bases
Kits formation html-les_baseskitsformation
 
xml dtd schema
xml dtd schemaxml dtd schema
xml dtd schemaDame Sy
 
technologie web - part2
technologie web - part2technologie web - part2
technologie web - part2Benoît Simard
 
Normes de base du Web - GTI780 & MTI780 - ETS - A08
Normes de base du Web - GTI780 & MTI780 - ETS - A08Normes de base du Web - GTI780 & MTI780 - ETS - A08
Normes de base du Web - GTI780 & MTI780 - ETS - A08Claude Coulombe
 
HTML 5 - intro - en francais
HTML 5 - intro - en francaisHTML 5 - intro - en francais
HTML 5 - intro - en francaisVlad Posea
 
Codedarmor 2012 - 06/03 - HTML5, CSS3 et Javascript
Codedarmor 2012 - 06/03 - HTML5, CSS3 et JavascriptCodedarmor 2012 - 06/03 - HTML5, CSS3 et Javascript
Codedarmor 2012 - 06/03 - HTML5, CSS3 et Javascriptcodedarmor
 
Présentation complète de l'HTML5
Présentation complète de l'HTML5Présentation complète de l'HTML5
Présentation complète de l'HTML5jverrecchia
 

What's hot (20)

Html de base
Html de baseHtml de base
Html de base
 
Intégration #2 : HTML 101 : Back to Basics
Intégration #2 : HTML 101 : Back to BasicsIntégration #2 : HTML 101 : Back to Basics
Intégration #2 : HTML 101 : Back to Basics
 
XML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQueryXML Avancé : DTD, XSD, XPATH, XSLT, XQuery
XML Avancé : DTD, XSD, XPATH, XSLT, XQuery
 
Prsentationhtml5 html5 ii twebteck
Prsentationhtml5 html5 ii twebteckPrsentationhtml5 html5 ii twebteck
Prsentationhtml5 html5 ii twebteck
 
Intégration Web HTML 5 & CSS 3
Intégration Web HTML 5 & CSS 3Intégration Web HTML 5 & CSS 3
Intégration Web HTML 5 & CSS 3
 
Formation HTML pour Bac Informatique
Formation HTML pour Bac InformatiqueFormation HTML pour Bac Informatique
Formation HTML pour Bac Informatique
 
Les base du Html5
Les base du Html5Les base du Html5
Les base du Html5
 
Présentation html5
Présentation html5Présentation html5
Présentation html5
 
Css
CssCss
Css
 
C5 Javascript
C5 JavascriptC5 Javascript
C5 Javascript
 
Normes de base du Web GTI780 & MTI780 ETS A09
Normes de base du Web  GTI780 & MTI780  ETS   A09Normes de base du Web  GTI780 & MTI780  ETS   A09
Normes de base du Web GTI780 & MTI780 ETS A09
 
Kits formation html-les_bases
Kits formation html-les_basesKits formation html-les_bases
Kits formation html-les_bases
 
xml dtd schema
xml dtd schemaxml dtd schema
xml dtd schema
 
technologie web - part2
technologie web - part2technologie web - part2
technologie web - part2
 
Normes de base du Web - GTI780 & MTI780 - ETS - A08
Normes de base du Web - GTI780 & MTI780 - ETS - A08Normes de base du Web - GTI780 & MTI780 - ETS - A08
Normes de base du Web - GTI780 & MTI780 - ETS - A08
 
Html et xhtml
Html et xhtmlHtml et xhtml
Html et xhtml
 
Outils front-end
Outils front-endOutils front-end
Outils front-end
 
HTML 5 - intro - en francais
HTML 5 - intro - en francaisHTML 5 - intro - en francais
HTML 5 - intro - en francais
 
Codedarmor 2012 - 06/03 - HTML5, CSS3 et Javascript
Codedarmor 2012 - 06/03 - HTML5, CSS3 et JavascriptCodedarmor 2012 - 06/03 - HTML5, CSS3 et Javascript
Codedarmor 2012 - 06/03 - HTML5, CSS3 et Javascript
 
Présentation complète de l'HTML5
Présentation complète de l'HTML5Présentation complète de l'HTML5
Présentation complète de l'HTML5
 

Viewers also liked

Audit SEO: Check-list pour l'indexation d'une page web
Audit SEO: Check-list pour l'indexation d'une page webAudit SEO: Check-list pour l'indexation d'une page web
Audit SEO: Check-list pour l'indexation d'une page webLaurent Mottet
 
Mode d’emploi LEDsky - Comment construire une armature?
Mode d’emploi LEDsky - Comment construire une armature?Mode d’emploi LEDsky - Comment construire une armature?
Mode d’emploi LEDsky - Comment construire une armature?LEDsky
 
Balisage sémantique des fiches produits
Balisage sémantique des fiches produitsBalisage sémantique des fiches produits
Balisage sémantique des fiches produitsFred Laurent
 
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...Search Foresight
 
Projet lumiere kathleen-berger
Projet lumiere kathleen-bergerProjet lumiere kathleen-berger
Projet lumiere kathleen-bergerkathleen90
 
Présentation de MEODEX 2015 - Vos modules LED sur mesure
Présentation de MEODEX 2015 - Vos modules LED sur mesurePrésentation de MEODEX 2015 - Vos modules LED sur mesure
Présentation de MEODEX 2015 - Vos modules LED sur mesureMarketing and Sales MEODEX
 
Lucibel Corporate presentation oct2011
Lucibel Corporate presentation oct2011Lucibel Corporate presentation oct2011
Lucibel Corporate presentation oct2011Giorgio Anselmetti
 
Le référencement pour les developpeurs
Le référencement pour les developpeursLe référencement pour les developpeurs
Le référencement pour les developpeursrelevant_traffic_france
 
Promenades et randonnées autour de Sainte-Maxime
Promenades et randonnées autour de  Sainte-MaximePromenades et randonnées autour de  Sainte-Maxime
Promenades et randonnées autour de Sainte-MaximeSainte-Maxime Tourisme
 
Pepsi Kick
Pepsi KickPepsi Kick
Pepsi KickM51
 
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2jicarbonelli
 
LED lighting - Iluminação LED - Dualcom
LED lighting - Iluminação LED - DualcomLED lighting - Iluminação LED - Dualcom
LED lighting - Iluminação LED - Dualcomdualcom
 
PORTIFÓLIO_LF BUILDING_LINKEDIN
PORTIFÓLIO_LF BUILDING_LINKEDINPORTIFÓLIO_LF BUILDING_LINKEDIN
PORTIFÓLIO_LF BUILDING_LINKEDINLuciano Fonseca
 

Viewers also liked (19)

Audit SEO: Check-list pour l'indexation d'une page web
Audit SEO: Check-list pour l'indexation d'une page webAudit SEO: Check-list pour l'indexation d'une page web
Audit SEO: Check-list pour l'indexation d'une page web
 
Mode d’emploi LEDsky - Comment construire une armature?
Mode d’emploi LEDsky - Comment construire une armature?Mode d’emploi LEDsky - Comment construire une armature?
Mode d’emploi LEDsky - Comment construire une armature?
 
Balisage sémantique des fiches produits
Balisage sémantique des fiches produitsBalisage sémantique des fiches produits
Balisage sémantique des fiches produits
 
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
 
Catalogue des ampoules Led 2013 fr
Catalogue des ampoules Led 2013 frCatalogue des ampoules Led 2013 fr
Catalogue des ampoules Led 2013 fr
 
Projet lumiere kathleen-berger
Projet lumiere kathleen-bergerProjet lumiere kathleen-berger
Projet lumiere kathleen-berger
 
Présentation de MEODEX 2015 - Vos modules LED sur mesure
Présentation de MEODEX 2015 - Vos modules LED sur mesurePrésentation de MEODEX 2015 - Vos modules LED sur mesure
Présentation de MEODEX 2015 - Vos modules LED sur mesure
 
Luz de led starlux
 Luz de led   starlux Luz de led   starlux
Luz de led starlux
 
Lucibel Corporate presentation oct2011
Lucibel Corporate presentation oct2011Lucibel Corporate presentation oct2011
Lucibel Corporate presentation oct2011
 
Le référencement pour les developpeurs
Le référencement pour les developpeursLe référencement pour les developpeurs
Le référencement pour les developpeurs
 
Promenades et randonnées autour de Sainte-Maxime
Promenades et randonnées autour de  Sainte-MaximePromenades et randonnées autour de  Sainte-Maxime
Promenades et randonnées autour de Sainte-Maxime
 
Pepsi Kick
Pepsi KickPepsi Kick
Pepsi Kick
 
Spot Mr16 Led lamp
Spot Mr16 Led lampSpot Mr16 Led lamp
Spot Mr16 Led lamp
 
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2
 
Catálogo Holle Iluminação 2016
Catálogo Holle Iluminação 2016Catálogo Holle Iluminação 2016
Catálogo Holle Iluminação 2016
 
Catálogo Neoflash Iluminação 2016
Catálogo Neoflash Iluminação 2016Catálogo Neoflash Iluminação 2016
Catálogo Neoflash Iluminação 2016
 
LED lighting - Iluminação LED - Dualcom
LED lighting - Iluminação LED - DualcomLED lighting - Iluminação LED - Dualcom
LED lighting - Iluminação LED - Dualcom
 
PORTIFÓLIO_LF BUILDING_LINKEDIN
PORTIFÓLIO_LF BUILDING_LINKEDINPORTIFÓLIO_LF BUILDING_LINKEDIN
PORTIFÓLIO_LF BUILDING_LINKEDIN
 
Leds
LedsLeds
Leds
 

Similar to 18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015

Comment récupérer un projet Web pourri ... et réussir à travailler dessus.
Comment récupérer un projet Web pourri ... et réussir à travailler dessus.Comment récupérer un projet Web pourri ... et réussir à travailler dessus.
Comment récupérer un projet Web pourri ... et réussir à travailler dessus.Guillaume RICHARD
 
Scenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expoScenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expoHusson Anne-Marie
 
Scenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expoScenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expoHusson Anne-Marie
 
Génération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTOGénération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTOguested7f6
 
Rappels Modularisation application C/C++
Rappels Modularisation application C/C++Rappels Modularisation application C/C++
Rappels Modularisation application C/C++Sylvain Leroy
 
Créer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresCréer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresRobert Viseur
 
Écrire de la documentation persistante pour un projet Drupal
Écrire de la documentation persistante pour un projet DrupalÉcrire de la documentation persistante pour un projet Drupal
Écrire de la documentation persistante pour un projet DrupalSymetris
 
Drupal7 - Bonnes Pratiques (Partie 1)
Drupal7 - Bonnes Pratiques (Partie 1)Drupal7 - Bonnes Pratiques (Partie 1)
Drupal7 - Bonnes Pratiques (Partie 1)Alexandre Marie
 
Drupal en bibliothèque (2008)
Drupal en bibliothèque (2008)Drupal en bibliothèque (2008)
Drupal en bibliothèque (2008)Nicolas Morin
 
DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisant
 DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisant DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisant
DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisantcluelessjoe
 
Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...stsire
 
Réussir son projet Drupal
Réussir son projet DrupalRéussir son projet Drupal
Réussir son projet DrupalAdyax
 
Algo vol.2 sujets
Algo vol.2   sujetsAlgo vol.2   sujets
Algo vol.2 sujetschrisdilane
 
PHP/ExtJs experience feedback - IAV case - 1
PHP/ExtJs experience feedback - IAV case - 1PHP/ExtJs experience feedback - IAV case - 1
PHP/ExtJs experience feedback - IAV case - 1fayway
 
Presentation mkframework software craftsmanship a l'afup
Presentation mkframework software craftsmanship a l'afupPresentation mkframework software craftsmanship a l'afup
Presentation mkframework software craftsmanship a l'afupMichael Bertocchi
 
Alfresco Meetup - ETL Connector & Talend
Alfresco Meetup - ETL Connector & TalendAlfresco Meetup - ETL Connector & Talend
Alfresco Meetup - ETL Connector & TalendMarc Dutoo
 
Drupal en bibliothèque (2009)
Drupal en bibliothèque (2009)Drupal en bibliothèque (2009)
Drupal en bibliothèque (2009)Nicolas Morin
 
ALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowMathias Kluba
 

Similar to 18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015 (20)

Comment récupérer un projet Web pourri ... et réussir à travailler dessus.
Comment récupérer un projet Web pourri ... et réussir à travailler dessus.Comment récupérer un projet Web pourri ... et réussir à travailler dessus.
Comment récupérer un projet Web pourri ... et réussir à travailler dessus.
 
Scenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expoScenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expo
 
Scenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expoScenari4 fabienne droullours eleanring expo
Scenari4 fabienne droullours eleanring expo
 
Génération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTOGénération de documents Office avec Open XML et VSTO
Génération de documents Office avec Open XML et VSTO
 
Rappels Modularisation application C/C++
Rappels Modularisation application C/C++Rappels Modularisation application C/C++
Rappels Modularisation application C/C++
 
Créer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresCréer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libres
 
Écrire de la documentation persistante pour un projet Drupal
Écrire de la documentation persistante pour un projet DrupalÉcrire de la documentation persistante pour un projet Drupal
Écrire de la documentation persistante pour un projet Drupal
 
Drupal7 - Bonnes Pratiques (Partie 1)
Drupal7 - Bonnes Pratiques (Partie 1)Drupal7 - Bonnes Pratiques (Partie 1)
Drupal7 - Bonnes Pratiques (Partie 1)
 
Drupal en bibliothèque (2008)
Drupal en bibliothèque (2008)Drupal en bibliothèque (2008)
Drupal en bibliothèque (2008)
 
DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisant
 DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisant DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisant
DDD, CQRS et Event Sourcing : quand coder propre n'est plus suffisant
 
Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...
 
Réussir son projet Drupal
Réussir son projet DrupalRéussir son projet Drupal
Réussir son projet Drupal
 
Algo vol.2 sujets
Algo vol.2   sujetsAlgo vol.2   sujets
Algo vol.2 sujets
 
PHP/ExtJs experience feedback - IAV case - 1
PHP/ExtJs experience feedback - IAV case - 1PHP/ExtJs experience feedback - IAV case - 1
PHP/ExtJs experience feedback - IAV case - 1
 
Presentation mkframework software craftsmanship a l'afup
Presentation mkframework software craftsmanship a l'afupPresentation mkframework software craftsmanship a l'afup
Presentation mkframework software craftsmanship a l'afup
 
Alfresco Meetup - ETL Connector & Talend
Alfresco Meetup - ETL Connector & TalendAlfresco Meetup - ETL Connector & Talend
Alfresco Meetup - ETL Connector & Talend
 
Crs javascript
Crs javascriptCrs javascript
Crs javascript
 
Etude des Frameworks PHP
Etude des Frameworks PHPEtude des Frameworks PHP
Etude des Frameworks PHP
 
Drupal en bibliothèque (2009)
Drupal en bibliothèque (2009)Drupal en bibliothèque (2009)
Drupal en bibliothèque (2009)
 
ALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - SpecflowALT.Net Juin 2012 - Specflow
ALT.Net Juin 2012 - Specflow
 

18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015

  • 1. Atelierpratiqued’éditionXML/TEI EmmanuelleMorlock IGE CNRS, UMR 5189 Proposé dans le cadre du Staged’ecdotique2015 de l’Institut Sources Chrétiennes, Lyon, 18/02/2015 cf. http://ecdotique.hypotheses.org/stages-et-formation/la-semaine-decdotique
  • 2. Objectifs de l’atelier ★ Présenter la TEI et quelques notions technique indispensables ★ Montrer que le balisage est une activité intellectuelle et analytique ★ Pratiquer l’encodage en deux étapes : ○ Encodage d’un court texte ○ Encodage d’un apparat critique à partir de votre “cahier de collation” ★ Utiliser des outils de visualisation du résultat de l’encodage et de relecture ○ Simple feuille de style CSS personnalisable selon des objectifs de relecture ○ Critical edition toolbox : pour faciliter le contrôle des encodages complexes ○ Modèle d’édition critique DIPLE (Ec. Nat. des Chartes) ○ Versioning Machine pour la visualisation parallèle de plusieurs témoins
  • 3. Introduction Qu’est-ce que la TEI ? Pourquoi utiliser XML pour une édition numérique ? Quelques exemples commentés
  • 4. La TEI c’est tout à la fois... ★ Un cadre d’encodage gratuit et libre ○ un cadre conceptuel pour la représentation des textes ○ une architecture informatique modulaire et évolutive ○ des “Guidelines” = documentation utilisateur des recommandations d’encodage ○ un modèle de document ★ Un écosystème ○ des outils très nombreux et variés ○ un consortium international ○ une communauté d’utilisateurs actifs ★ Plus qu’un “format standard” ○ un mécanisme pour produire des schémas de contrôle et de validation personnalisés ○ un mécanisme permettant de rendre explicite des lectures/interprétations d’un texte ○ un format permettant à l’archivage à long terme des données numériques
  • 5. Mais ce n’est pas... ★ Le seul standard dans le domaine de la représentation des textes ★ Un cadre contraingnant ( = “explique-moi ce que tu fais” et pas “fais ainsi”) ★ Non-interprétatif ou “objectif” ★ Utilisé de manière uniforme (même au sein d’un même projet) ★ Un standard stable et non-évolutif ★ Une finalité en soi ★ Un format de publication automatique ★ L’assurance de la préservation à long très terme... cf. James Cummings, “What is the TEI? And why should I care? “ (27/01/2015) <https://prezi.com/jcvxvvzecc1y/what-is- the-tei-and-why-should-i-care-a-brief-introduction-for-classicists/>
  • 6.
  • 10. Pourquoi utiliser XML pour une édition numérique de sources ?
  • 11. XML en (très) bref 1. XML ne sert pas à afficher les données mais à les décrire. Il ne fait rien. Appliqué à la représentation des textes, il permet de décrire notamment leur structure (livre, section, chapitre, paragraphe, phrase, mot…) 2. Les balises ne sont pas prédéfinies On peut librement créer ses propres balises (en fonction de la structure logique qu’on choisit de représenter par exemple) 3. On peut l’utiliser avec une “grammaire” de balises (DTD ou Schéma) Pour donner de la rigueur et encoder avec un langage commun entre projets 4. XML est auto-descriptif et assez facilement lisible On peut prendre connaissance de la structure d’un corpus assez rapidement en ouvrant simplement le fichier avec n’importe quel éditeur de texte
  • 12. Principe du balisage descriptif 1 ★ Délimitation de segments de texte de toutes tailles + ★ Explicitation de leur nature ou fonction <baliseX>Contenu textuel</baliseX> Balise ouvrante Balise fermante Segment balisé
  • 13. Principe du balisage descriptif 2 ★ Les attributs précisent le sens des balises <handNote xml:id="EP" medium="red-ink"> Ezra Pound's annotations. </handNote> Valeur de l’attribut Attribut
  • 14. Principe du balisage descriptif 3 ★ Le balisage descriptif = décrit les données sans indication de traitement ★ Le principe est celui de la séparation du contenu et de la présentation. ★ Comparez : ○ <author>Louise Labé</author> ○ <span class=”small-caps”>Louise Labé</span> ★ Le but est de décrire la fonction plus que l’apparence du rendu final : ○ c’est cela qui offre la flexibilité maximale permettant des chaînes éditoriales “multi-support” : le rendu est traité à une étape ultérieure, et peut être adapté à chaque support, au contexte de réception ou dispositif de lecture...
  • 15. Concrètement Fichier XML : <author><forename>Louise</forename> <surname>Labé</surname></author> Fichier CSS : surname { font-variant: small-caps; font-family: Times; } Résultat : Louise LABÉ
  • 16. Une source unique, des usages multiples ★ Un texte explicité et enrichi au moyen d’un métalangage simple, clair, universel, permettant de baliser n’importe quel type de texte ★ Une source “matrice”, à partir de laquelle on peut produire des versions différentes (vue normalisée vs vue diplomatique ; version pour le web, pour les liseuses, version “grand public, version savante) ★ Un fichier lisible par les humains (contrairement aux fichiers binaires) ★ Un fichier utilisable pour des recherches fines, des extractions ciblées, des analyses automatiques... ★ Un format libre, facilitant l’intéropérabilité
  • 19. Quelques principes à retenir ★ Texte vs Document ○ Le texte est une abstraction que l’on construit et que l’on peut encoder ○ Un document est un objet que l’on peut numériser ★ XML considère le texte comme un système de hiérarchies ordonnées d’objets de contenus (les balises doivent être strictement imbriquées) ★ L’encodage consiste à représenter l’information dans des structures arborescentes, en codant ces structures de manière compréhensible à un ordinateur.
  • 20.
  • 22. Processus global pour une édition numérique de sources ?
  • 23. Quoi encoder ? 4 dimensions principales ★ L’apparence physique et visuelle ○ représentation mimétique +/- transférable d’un support à un autre ★ La dimension linguistique et structurelle ○ qu’un lecteur humain peut décoder puis la transcrire ou la traduire ★ La dimension sémantique ○ que l’on peut comprendre (ou pas !) et annoter ★ Le contexte de production ou de réception ○ que l’on peut décrire par le biais de métadonnées
  • 24. Analyse préalable ★ Il s’agit d’identifier : ○ les éléments structurants et les caractéristiques principales du doc. ○ identifier les caractéristique liées aux centres d’intérêt de l’éditeur ★ Les deux peuvent venir de : ○ “pseudo-balisage” : déjà présents dans le document ○ explicitations issues du savoir externe de l’analyste ★ Au final, il s’agira toujours d’expliciter ce qui paraît important et les raisons de ses choix d’une manière la plus formalisée possible
  • 25. Processus ★ Analyse du document = quoi encoder ? = analyse et qualifiation des fonctions des objets d’intérêt ★ Choix des balises / création d’un schéma personnalisé (à l’aide ou non du fichier de spécification ODD (One Document Does it all) ★ Balisage par approfondissements successifs ★ Présenter le document : via des “feuilles de style” CSS ou XSLT ○ CSS : simple, attribution de caractéristiques visuelles aux balises ○ XSL : plus complexe, permet de transformer le document XML ★ Exploiter le document : langages de requête XPath et XQuery...
  • 27. Substitution . <subst> <subst> <del/> <add/> </subst> .. are all included. <del hand="#RG">It is</del> <subst> <add>T</add> <del>t</del> </subst>he expressed
  • 28. Abréviation avec expansion . <abbr> <choice> <abbr/> <expan/> </subst> <choice> <abbr>&amp;</abbr> <expan>et</expan> </choice>
  • 30. Changements de main . <handshift> milestone (balise sans contenu) Lorem ipsum dolor <handshift medium=”encre-verte” new=”#h1”/> sit amet (...) ailleurs dans le doc : <handNote xml:id=”h1”>Ecriture très régulière </handshift>
  • 31. Incertain . <unclear> Vade retro <unclear reason=”tache-d-encre” cert=”medium” resp=”#EM”> Satanas </unclear>
  • 32. texte restitué . <supplied> Il se retrouvait parmi le <supplied>reason=”erreur-du-scribe ” >s</supplied> siens.
  • 34. Atouts d’un balisage TEI Expressivité Exploitabilité Evolutivité Réutilisabilité Permet également de repousser certains choix au moment de l’utilisation et pas de la production ! par ex. normalisations : on encode les deux leçons, c’est le lecteur qui choisit !
  • 36. Programme 1. Prise en main de l’éditeur XML Oxygen Editor 2. Exercice : Transcription d’un court texte 3. Principes de transcription d’un apparat critique 4. Exercice : transcription du cahier de collation 5. Visualisations : a. Diple (présentation classique avec affichage des variantes au survol de la souris) b. Versioning machine (voir en parallèle les différents témoins)
  • 38. Découverte de l’interface ★ Personnaliser l’espace de travail ★ Préférences : choisir le navigateur par défaut : ○ Safari (de préférence) ou Firefox ★ Expérimenter : ○ saisie d’une balise ○ balises possibles dans le contexte ○ valeurs possibles d’un attribut ○ documentation contextuelle ○ CTRL (CMD) + E ○ style
  • 39. Exercice 1 Transcription d’une page d’un manuscrit de Flaubert extrait des Dossiers documentaires de Bouvard et Pécuchet Ms g226 (8) f°198 - conservé à la Bibliothèque municipale de Rouen http://www.dossiers-flaubert.fr/cote-g226_8_f_198__r____
  • 40. Exercice de transcription en TEI ★ Depuis Oxygen, ouvrez le fichier : “TEI_exercice_SC/content/modele_exercice_0.xml” ★ Le fichier à transcrire se trouve dans : “TEI_exercice_SC/sources/exercice-flaubert” ★ Processus à suivre : a. Analyser le document b. Copier le texte dans l’éditeur (depuis “DBP_8_198_r_texte_avec_sauts_de_ligne.txt”) c. Baliser : i. la structure ii. les interventions éditoriales de l’auteur (ajouts, suppressions, substitutions...) iii. les normalisations iv. les entités nommées v. … et tout autre caractéristique qui vous paraît pertinente
  • 41. Analyse du document Objectifs : ★ repérer la structure textuelle ★ identifier les “distinctions” pertinentes pour votre projet éditorial ou les analyses souhaitées : ○ Orthographe ? ○ Variantes graphiques des lettres ? ○ Capitalisations ? ○ Ponctuation ? ○ Abréviations ? ○ Mise en page ? ○ Ajouts, suppressions ? ○ erreurs, omissions ? ○ etc.
  • 42. Coller le texte dans le fichier xml
  • 43. Baliser : à vous de jouer ! ★ utilisez au choix la vue “auteur” ou “texte”
  • 44. Quelques balises TEI courantes Pour une information détaillée sur le modèle de données ou les attributs possibles des balises TEI, se reporter à la documentation en ligne sur le site de la TEI : http://www.tei-c.org/ <lb/> Saut de ligne <head> titre <div> division <p> paragraphe <del> suppression <add> ajout <subst> substitution <choice> balisages alternatifs <orig> forme originale <reg> forme régularisée <placeName> Nom de lieu <persName> Nom de personne
  • 45. Voir le résultat dans un navigateur ★ Cliquez sur le bouton “ouvrir dans le navigateur” ★ Le fichier s’affiche en fonction de la feuille de style CSS indiquée par les instructions de traitement du début du fichier (donnés par le modèle)
  • 46. Transformer le résultat Utilisez les feuilles de style XSL de la TEI fournies avec Oxygen : ★ Cliquez sur le bouton “configurer un scénario de transformation” ★ Choisissez le scénario de votre choix dans la liste “TEI P5” ○ xhtml, pdf, odt, etc.
  • 48. Théorie ★ Cf. diaporama de M. Burghart (EHESS, UMR CIHAM) ★ cf. fichier pdf “Antisèche” dans le dossier “TEI_exercice_SC/sources/exercice-JdeVitry”
  • 49. Exemple 1 : pseudo-edition-test-file.xml Déclaration de la méthode d’encodage : <variantEncoding method="parallel-segmentation" location="internal"/> dans teiHeader//encodingDesc
  • 50. Exemple 1 : pseudo-edition-test-file.xml Liste des témoins <front><div> <listWit> <witness xml:id="A">Manuscript A</witness> <witness xml:id="B">Manuscript B</witness> <witness xml:id="C">Manuscript C</witness> <witness xml:id="D">Manuscript D</witness> <witness xml:id="E">Manuscript E</witness> </listWit> </div></front>
  • 51. Exemple 1 : pseudo-edition-test-file.xml Groupes de variantes :
  • 52. Exemple 1 : pseudo-edition-test-file.xml Enchâssement de notes d’apparat :
  • 53. Exercice 2 Transcription de votre cahier de collation établi cette semaine (Valerio del Bierzo)
  • 54. Encore à vous de jouer... ★ Ouvrez le fichier : TEI_exercice_SC/content/modele_apparat_critique.xml ★ à partir de votre cahier de collation (ou de la mise en commun du stage d’ecdotique 2014 cf. TEI_exercice_SC/sources/exercice-valere/stage SC.2014Travail2bis.doc), complétez le fichier...
  • 55. La granularité de la variation dépend des choix de l’ encodeur...
  • 56. “Contrôle qualité” Visualisez et contrôlez votre encodage à l’aide de l’outil développé par M. Burghart “TEI Critical Edition Toolbox” http://ciham-digital.huma-num.fr/teitoolbox/
  • 57.
  • 59. 2 façons différentes de transformer votre fichier XML Diple : dé-commentez l’instruction de traitement “<?xml- stylesheet href="../src/vmachine.xsl" type="text/xsl" ?> ” et lancez votre navigateur... Versionning machine : copiez le fichier dans “TEI_exercice_SC/vmachine_MB/samples” puis lancez votre navigateur…