mardi 25 juin 2013

SOSIE : élaborez votre IR en OpenOffice, on se charge de le transformer en XML/EAD…

Source de l’image : "Manuel de l’utilisateur Sosie", édition 2010

Comme je l’avais fait (voir les précédents billets) pour les applications ETAREP ou ETANOT telles qu’on pouvait encore les consulter jusqu’à la fin 2013 avant la «salle des inventaires virtuelle» (SIV) des Archives nationales (modification drastique de la précédente configuration, laquelle, pour la consultation d’ETAREP par exemple, nécessitait obligatoirement le navigateur Internet Explorer (version 5 et surtout pas les nouvelles !) et en ayant, au préalable, chargé le logiciel gratuit Adobe® SVG Viewer…), bref, une grosse lourdeur qui sera supprimée dans la SIV)…
Comme je l’avais fait pour les applications ETAREP ou ETANOT donc, j’essaie ici à l’instar de Cassandre, de prévoir l’avenir de SOSIE dans la nouvelle configuration SIV du SIA (le système d’information archivistique).

D’abord qu’est-ce que c’est ? SOSIE (pour Saisie en Open office pour la structuration d'Instruments de recherche en EAD) est un modèle OpenOffice de production d'instruments de recherche (IR) utilisé depuis près de trois ans aux Archives nationales mais aussi dans certaines Missions des Administrations centrales de l’État et depuis peu par toute collectivité territoriale (qui en fait la demande) souhaitant élaborer des instruments de recherche en XML/EAD….

Maintenant un peu d’histoire : en 2007, un groupe de travail auquel je faisais partie, avait été missionné par la direction des Archives nationales pour réfléchir à un modèle qui utiliserait les fonctionnalités du logiciel OpenOffice (open source comme chacun le sait) pour produire des instruments de recherche directement convertibles en XML/EAD grâce notamment aux feuilles styles. Il s’agissait en fait d’attribuer à chaque style de ce modèle, un élément de la DTD EAD et éventuellement de son attribut lorsqu’il existait et lorsqu’il était pertinent de le qualifier. La simplicité était telle que chaque élément (donc chaque style) qui correspondait à un niveau de description (comme préconisé par la norme ISAD(G)) était en français dans le texte.

Exemples :
unitid qui correspond à Référence dans ISAD(G) avait pour style Cote_consultation ou Identifiant.
unittitle ou Intitulé/Analyse de l’ISAD(G) avait pour style Intitule
…et ainsi de suite vous l’aurez compris…
origination devenait Nom du producteur dans SOSIE de même que physdesc devenait Desc_physique
…et le tout sous la forme d'une arborescence savante qui reprend l’ordre logique de rédaction d’un instrument de recherche. Je pouvais ainsi structurer mon IR en choisissant l’élément de la DTD EAD dans la liste (en français) proposée.

SOSIE convenait donc particulièrement pour la production d'un nouvel instrument de recherche, mais aussi pour une «rétroconversion» c’est-à-dire une reprise d'un fichier saisi sous un autre traitement de texte.
Source de l’image : "Manuel de l’utilisateur Sosie", édition 2010

Sur cette page d'écran de SOSIE, le «0_En_tete_EAD» correspond aux métadonnées de l’instrument de recherche, c’est en fait la «page de titre» dans laquelle on mettra les informations sur les conditions d'accès et d'utilisation des unités documentaires décrites, leur mode d'entrée, le producteur, l'historique de la conservation, les sources complémentaires, etc. Suivent ensuite le «Corps de l'instrument de recherche» proprement dit et l’«Index»…ce sont respectivement les parties «1_Description_archivistique» qui reprend les vingt-six éléments de l’ISAD(G) de la zone d'identification à la zone de notes et «2_Indexation» pour les noms de collectivités, les mots matières, les noms de personnes, les noms de lieux géographiques …partie «Index», que j’avais, en réalité, très peu utilisé jusqu’à présent.
Autre vue d'OpenOffice avec le modèle SOSIE et à gauche tous les styles (les éléments EAD)
Source de l’image : "Manuel de l’utilisateur Sosie", édition 2010
Voilà pour l’historique et les caractéristiques généraux et les diverses fonctionnalités de ce bel outil qui permettait de faire de l’EAD sans le savoir et en s’affranchissant de l’achat d’un éditeur (genre XMETAL, OXYGEN ou autre).
Ensuite, une fois l’instrument de recherche rédigé, c’est une opération batch qui permet alors de le convertir en un format XML/EAD en le déposant dans un répertoire «In» (rappelons que jusqu’à présent il s’agit encore d’un fichier avec l’extension .odt) et c’est après le passage du programme, de le récupérer en un .xml dans un répertoire «Out» (le batch classique quoi). On pouvait également utiliser une extension OpenOffice (un greffon) qui lançait le programme de conversion directement depuis OpenOffice pour obtenir au final un format «xml» à partir du fichier «odt».

Que va devenir SOSIE dans la nouvelle configuration SIV du SIA (le système d’information archivistique) et plus précisément dans le module «production des instruments de recherche» ? et d’abord pourquoi la conversion de .odt en .xml sur SOSIE ne fonctionne plus correctement?
J’oublie de dire que lors des dernières formations dispensées au Centre Phoenix pour les Études Libanaises à Beyrouth  vers la mi-mai de cette année, puis à l’Association des Archivistes français (AAF) le 22 mai dernier [stage EAD, parcours «EAD et EAC : des standards d’encodage pour les instruments de recherche»], en voulant montrer un exemple de conversion d’un fichier OpenOffice en un format XML/EAD, j’ai eu un grand moment de solitude : la conversion ne fonctionnait plus ! C’est seulement en ce début de mois que j’ai résolu le problème : SOSIE ne fonctionne que sur la version 3.0 d’OpenOffice (jusqu’à la version 3.2. mais plus sur LibreOffice, sa suite logique), ensuite attention aux mises à jour de JAVA : si vous avez autorisé votre ordinateur à mettre à jour automatiquement le JRE de JAVA vous devez en être à la version 7…or la conversion de SOSIE ne fonctionne que sur la version 6 de JAVA! Fallait le savoir.
Ainsi pour montrer à mes stagiaires un exemple de saisie sur SOSIE et sa conversion, j’ai été obligé de désinstaller le JRE7 et d’installer à nouveau la version le JRE6 (fort heureusement j’ai toujours l’ancienne version d’OpenOffice).

Exemple de saisie sous ICA-ATOM, ici la Zone d'identification de l'ISAD(G)
(on devrait avoir à peu près la même configuration sur le SIA,
module production d'instruments de recherche en remplacement de SOSIE)

Maintenant, quelle sera la place de SOSIE dans le nouveau système d’information archivistique (SIA)?…ce qui est sûr, c’est que tous les IR élaborés jusqu’à présent sous SOSIE seront intégralement et naturellement migrés dans le SIA, lequel prévoit de fournir un outil de production intégré à une plateforme de diffusion et d'interrogation. Ainsi nos futurs instruments de recherche (des Archives nationales uniquement, pas des Missions) seront à l’avenir, directement élaborés sur le SIA. Et l’ergonomie dans tout cela ? la saisie d’un nouvel IR se fera comme sous ICA-ATOM ou AVENIO ou ARKHÉÏA pour ne citer que ces outils, mais on nous promet que les puristes du «code xml» ne seront pas oubliés (un export de cette saisie "avec formulaire" sera possible et le fichier xml ainsi obtenu pourra être lu et modifié sous OXYGEN)…à suivre donc.

Aucun commentaire: