Dinah : une plateforme philologique pour l’annotation, la transcription et le classement de documents manuscrits

Dans le cadre d’un doc­to­rat1 dirigé par Sylvie Calabretto, nous tra­vaillons avec les cher­cheurs qui ana­ly­sent l’œuvre de Jean-Toussaint Desanti, plus par­ti­cu­liè­re­ment avec David Wittmann en séan­ces de tra­vail heb­do­ma­dai­res à l’Institut Desanti.

Le maté­riau prin­ci­pal d’étude, les fac-simi­lés numé­ri­ques de l’ensem­ble des docu­ments manus­crits de Desanti légués à l’École, se com­pose de brouillons pré­pa­ra­toi­res d’œuvres éditées, d’iné­dits, de cours et pré­pa­ra­tions de cours, etc. Les besoins sont le reclas­se­ment, la trans­crip­tion et l’anno­ta­tion col­la­bo­ra­tive du corpus de docu­ments manus­crits.

  • Reclassement : les archives ont été reçues par l’École désordonnées. Ceci implique des opérations de reclassements qui peuvent occasionner une confrontation des points de vue des chercheurs parfois en désaccord ou encore désireux de tester une hypothèse d’ordonnancement.
  • Transcription et annotation : les besoins de transcription et d’annotation sont classiques pour un projet d’analyse philologique de manuscrits pouvant aboutir à des éditions critiques (numériques ou papier). Nous trouvons de l’intérêt à permettre une édition collaborative des transcriptions et annotations.

De ces besoins nous extra­yons deux pro­blé­ma­ti­ques :

  • la première est de permettre l’expression conjointe de points de vues différents sous la forme de reclassements et d’annotations.
  • la seconde consiste en la mise en œuvre des procédures nécessaires à la construction collaborative de vocabulaires d’annotations. Nous appelons vocabulaire d’annotations un ensemble formé de types de termes, de types de relations (binaires) et de sa documentation.

Dinah, une pla­te­forme phi­lo­lo­gi­que pour l’anno­ta­tion, la trans­crip­tion et le clas­se­ment de docu­ments manus­crits, est une réponse pro­po­sée à ces pro­blé­ma­ti­ques. Elle permet aux cher­cheurs de clas­ser et de navi­guer au sein de l’archive (Images 1 et 2) tout en tra­çant l’ensem­ble de leurs opé­ra­tions. Une repré­sen­ta­tion anno­ta­ble de cette trace (Image 3) est utile au cher­cheur qui veut s’appro­prier et com­men­ter le tra­vail d’un col­lè­gue, mais aussi inter­pré­ter à nou­veau ses pro­pres tra­vaux. Dinah permet de créer ou de repren­dre des voca­bu­lai­res d’anno­ta­tions puis de les uti­li­ser pour anno­ter des objets quel­conques (Images 1 et 4). Elle pro­pose ensuite un sys­tème d’assis­tance à la trans­crip­tion de frag­ments de manus­crits (Image 5).

Cluster 13 : Culture, patrimoine et création

Cluster 13, mis en place et sou­tenu par la Région Rhône-Alpes.

Cluster 13 : Culture, patrimoine et création
Image 1. Interface de reclassement
Image 2. Interface de navigation
Image 3. Interface de visualisation de la trace
Image 4. Annotations multiples
Image 5. Interface de transcription

Pour finir, nous avons créé une métho­do­lo­gie pour la créa­tion de docu­ments (multi)struc­tu­rés qui auto­rise l’émergence, dans un contexte multi-uti­li­sa­teurs, de mul­ti­ples struc­tu­res docu­men­tai­res. Les algo­rith­mes qui sous-tien­nent la métho­do­lo­gie ont été déve­lop­pés dans le lan­gage fonc­tion­nel Haskell et sont main­te­nant portés sur la pla­te­forme Dinah.

Cluster 13 : Culture, patrimoine et création

Ce travail de thèse bénéficie d’une Allocation Doctorale de Recherche attribuée dans le cadre du Cluster 13, mis en place et soutenu par la Région Rhône-Alpes.