Créatures ou IA : consultez, manipulez & annotez les images des bibliothÚques, musées⊠grùce à IIIF
Lâinitiative IIIF, pour International Image Interoperability Framework, est nĂ©e de la constatation que la diffusion dâimages patrimoniales sur le web Ă©tait « trop lente, trop coĂ»teuse, trop dĂ©cousue, trop complexe ». IIIF apporte une solution pĂ©renne et Ă©lĂ©gante Ă ces difficultĂ©s en conciliant accessibilitĂ©, interopĂ©rabilitĂ© et sobriĂ©tĂ©. Il intĂ©resse les GLAM (collections, bibliothĂšques, archives, musĂ©es, etc.) ainsi que les acteurs de lâenseignement et de la recherche.
ConcrĂštement, IIIF créé un cadre technique commun grĂące auquel les fournisseurs peuvent dĂ©livrer leurs contenus sur le web de maniĂšre standardisĂ©e, afin de les rendre consultables, manipulables et annotables par nâimporte quelle application compatible.
- lien ná” 1 : Site officiel
- lien ná” 2 : Introduction Ă IIIF (documentation Biblissima)
- lien nᔠ3 : Liste de ressources utiles maintenue par la communauté IIIF
- lien nᔠ4 : Interopérabilité des images : IIIF (France Archives)
- lien nᔠ5 : IIIF pour les musées de France
- lien nᔠ6 : Formation IIIF (par Régis Robineau)
- lien ná” 7 : Ătat des lieux de lâinitiative IIIF pour lâinteropĂ©rabilitĂ© des objets numĂ©riques sur le Web (video)
- lien nᔠ8 : IIIF, un outil pour visualiser les archives numérisées sur FranceArchives
- lien ná” 9 : Documentation and workshop materials for IIIF training
Sommaire
- Origine de IIIF
- Quâest-ce que IIIF ?
- Apports de IIIF
- Comment ça marche ?
- Au-delĂ de lâimage : lâaudio, la vidĂ©o et la 3D
- IIIF et IA
Origine de IIIF
En 2010, constitution dâun groupe de rĂ©flexion et dâexpĂ©rimentation sur lâinteropĂ©rabilitĂ© des manuscrits mĂ©diĂ©vaux numĂ©risĂ©s Ă lâinitiative de lâuniversitĂ© de Stanford. Ses travaux ont conduit Ă lâĂ©laboration dâun modĂšle de donnĂ©es Shared Canvas basĂ© sur le modĂšle dâannotation du W3C.
Ă la mĂȘme Ă©poque, de grandes bibliothĂšques nationales et des universitĂ©s ont travaillĂ© Ă la dĂ©finition dâun mĂ©canisme dâĂ©change des images pour aboutir en 2012 Ă la publication de la version 1 de lâAPI Image de l'International Image Interoperability Framework (IIIF).
Le Consortium IIIF a Ă©tĂ© créé en 2015 par onze institutions : la British Library, Artstor, Die Bayerische Staatsbibliothek, la BibliothĂšque nationale de France, Nasjonalbiblioteket (NorvĂšge), Wellcome Trust, et les universitĂ©s dâOxford, Stanford, Cornell, Princeton et Yale. Il compte actuellement 69 membres.
Quâest-ce que IIIF ?
Un aspect spectaculaire de IIIF réside dans la visualisation fluide des images et le zoom profond, cf. Sagami River, Kyoto (1660?-1670?). Princeton University, mais IIIF ne se résume pas à ça, loin de là .
IIIF dĂ©signe Ă la fois le cadre technique partagĂ© dâun ensemble de protocoles ouverts et une communautĂ© humaine qui les implĂ©mente, dĂ©veloppe des logiciels et in fine expose des contenus audiovisuels interopĂ©rables.
Ce standard de fait est utilisĂ© par de plus en plus dâinstitutions culturelles â collections, bibliothĂšques, musĂ©es, archives, etc. â et scientifiques â universitĂ©s, labos, musĂ©ums, etc. Ses fonctionnalitĂ©s sâĂ©tendent maintenant Ă lâaudio et Ă la vidĂ©o ; la prise en compte de la 3D est en cours.
Pour lâheure, IIIF est surtout utilisĂ© pour la diffusion dâimages numĂ©riques. Ce sont ainsi des centaines de millions dâimages qui deviennent vĂ©ritablement dĂ©couvrables, consultables, comparables, manipulables, citables, annotables et mixables par nâimporte quelle application compatible capable de se « brancher » sur les entrepĂŽts des uns et des autres.
Sans téléchargement de fichiers images, ces ressources de « premiÚre main » sont immédiatement utilisables par les professionnels comme par les amateurs. Elles intéressent aussi les chercheurs, les enseignants et les élÚves, et les médiateurs culturels, scientifiques et artistiques. IIIF facilite grandement la diffusion, la réutilisation et la valorisation de toutes ces ressources disséminées.
Principe gĂ©nĂ©ral dâinteropĂ©rabilitĂ© de IIIF : trois applications diffĂ©rentes sont branchĂ©es Ă trois entrepĂŽts IIIF (source : Biblissima+ â Licence Ouverte / Open License 2.0)
Visualisation dâun document
Copie dâĂ©cran du logiciel libre Tify prĂ©sentant une photographie de Martin Luther King et de Joan Baez (Bob Fitch, 1966). Ce document est fourni par un serveur IIIF opĂ©rĂ© par lâuniversitĂ© de Stanford.
Visualisation de plusieurs documents
La magie IIIF câest la capacitĂ© de jongler avec les rĂ©fĂ©rences des ressources, par exemple, pour les rĂ©unir dans des bibliothĂšques virtuelles ou encore pour servir de points dâentrĂ©e aux robots et autres IA afin dâanalyser les documents.
LĂ©onard Limosin est un peintre, Ă©mailleur, dessinateur et graveur français du XVIe siĂšcle. Deux de ses Ćuvres sont prĂ©sentĂ©es ci-aprĂšs dans le visualiseur libre IIIF Mirador.
- Médaillon, Art institute of Chicago, à gauche.
- Portrait prĂ©sumĂ© de Jeanne dâAlbret, MusĂ©es de la ville de Paris, Ă droite.
Sur cette page, vous pouvez explorer chaque image et zoomer, les comparer, lire leurs mĂ©tadonnĂ©es, passer en plein Ă©cran ou agencer diffĂ©remment les fenĂȘtres. Lâinterface de Mirador vous permet aussi dâaccĂ©der Ă dâautres rĂ©fĂ©rences en cliquant sur le bouton rond bleu puis en sĂ©lectionnant les documents prĂ©enregistrĂ©s.
Vous avez aussi la possibilitĂ© dâen ajouter dâautres via le bouton bleu Ajouter une ressource
en bas Ă droite, ensuite en insĂ©rant lâURL dâun manifeste IIIF. En faisant une recherche sur LĂ©onard Limosin vous trouverez diffĂ©rentes collections comportant certaines de ses Ćuvres. Certaines les exposent au standard IIIF. Dans ce cas, pour chaque notice il sâagit de rĂ©cupĂ©rer le lien dâun manifeste IIIF (explicite ou associĂ© au logo IIIF). Exemple, avec cette Crucifixion au Fitzwilliam Museum (Cambridge).
Le logiciel libre Omeka dispose de fonctionnalités IIIF et permet de créer des bibliothÚques virtuelles de ressources IIIF.
Apports de IIIF
DâaprĂšs IIIF en 5 minutes.
Pour les usagers
LâaccĂšs Ă des images de haute qualitĂ© ainsi quâĂ leurs mĂ©tadonnĂ©es, large choix de visualiseurs libres :
Ces outils, et dâautres encore, offrent une large palette dâinterfaces riches et universelles pour :
- visualiser et explorer les images notamment grĂące au zoom profond :
- comparer diffĂ©rentes vues dâun mĂȘme objet ou des images de diffĂ©rentes provenances :
- reconstituer un document Ă partir dâĂ©lĂ©ments dispersĂ©s, crĂ©er de nouveaux documents :
- manuscrit 5 de la bibliothĂšque municipale de ChĂąteauroux,
- IIIF Manifest Editor (Bodleian Libraries),
- citer et partager une image ou une zone dâintĂ©rĂȘt avec une URL :
- rechercher dans des contenus :
- annoter des images, proposer des explorations commentées :
- jouer :
- Antlitz,
- Puzzles : Puzzles! et une autre série,
- éditer et agréger des ressources :
Il existe de nombreux dispositifs pour utiliser ces ressources de « premiÚre main » et corpus dans un environnement éducatif et de recherche.
Pour les diffuseurs
- bĂ©nĂ©ficier dâune maniĂšre standardisĂ©e, cohĂ©rente et efficace, de prĂ©senter et de partager leurs collections,
- amĂ©liorer leur visibilitĂ©, lâaccessibilitĂ© Ă leurs donnĂ©es et dĂ©velopper des espaces de collaboration et de recherche,
- faciliter la gestion des ressources numériques en garantissant un accÚs homogÚne et pérenne,
- promouvoir la participation des usagers en mobilisant des outils avancĂ©s pour lâexploration et lâutilisation des ressources,
- proposer des projets de transcription, de crowdsourcing ou de sciences participatives en fournissant des documents annotables,
- réduire et mutualiser les coûts en utilisant un standard ouvert, des services et des logiciels éprouvés.
Pour les développeurs
Il existe de nombreux logiciels et composants compatibles avec les API de IIIF, beaucoup sont libres. La page officielle Awesome IIIF recense les principaux ainsi quâun grand nombre de ressources documentaires et de services.
IIIF est entiĂšrement basĂ© sur les standards et lâarchitecture du Web (principes REST et du Linked Data, Web Annotation Model du W3C, JSON-LD) ce qui facilite le partage et la rĂ©utilisation des donnĂ©es.
Le découplage entre la couche serveur et la couche cliente, la modularité des composants logiciels, la ré-utilisabilité des ressources offrent une grande souplesse et réduit la dépendance à un logiciel ou un prestataire.
La communauté des usagers et des développeurs est active.
Comment ça marche ?
Le manifeste est un Ă©lĂ©ment essentiel de IIIF. Câest un document au format JSON-LD qui reprĂ©sente gĂ©nĂ©ralement un objet physique numĂ©risĂ© tel quâun livre, une Ćuvre dâart, un numĂ©ro de journal, etc. Il peut Ă©galement rassembler des Ă©lĂ©ments de provenances diverses. Il dĂ©crit lâensemble du document, ses mĂ©tadonnĂ©es, sa structure et rĂ©fĂ©rence les images et les mĂ©dias quâil embarque.
- manifeste de la photo de Martin Luther King et de Joan Baez
https://purl.stanford.edu/hg676jb4964/iiif/manifest
Les liens des manifestes IIIF sont plus ou moins faciles Ă trouver dans les notices des catalogues. Une mĂ©thode simple consiste Ă rechercher le logo IIIF ou Ă explorer les informations fournies par les visualiseurs. Le site officiel de IIIF alimente un annuaire non exhaustif des sites et, site par site, fournit gĂ©nĂ©ralement un mode dâemploi pour rĂ©cupĂ©rer les manifestes.
Techniquement, IIIF comporte deux API principales, lâAPI Image et lâAPI Presentation qui fonctionnent de concert.
API Image
LâAPI Image fournit des informations basiques sur lâimage ainsi que les pixels de lâimage entiĂšre ou de zones Ă la demande.
Elle se présente avec les éléments suivants :
- une URL dâaccĂšs aux informations techniques dâune image,
abcd1234
est un exemple dâidentifiant :
http://www.example.org/image-service/abcd1234/info.json
- une URL Ă construire Ă la carte pour rĂ©cupĂ©rer et manipuler tout ou partie de lâimage en prĂ©cisant la zone, la taille, lâorientation, la qualitĂ© et le format de lâimage Ă produire.
VoilĂ ce que ça donne en pratique avec lâimage de test. Attention ! LinuxFR met en cache les images, si vous souhaitez effectuer les manipulations, copiez et modifiez les paramĂštres des url ci-aprĂšs.
Le fichier info.json
est le suivant :
https://stacks.stanford.edu/image/iiif/ff139pd0160/K90113-43/info.json
rendu homothĂ©tique de lâimage entiĂšre avec une largeur de 300px
https://stacks.stanford.edu/image/iiif/ff139pd0160/K90113-43/full/300,/0/default.jpg
dĂ©tail de la mĂȘme image
https://stacks.stanford.edu/image/iiif/ff139pd0160/K90113-43/1680,1100,1300,1300/300,/0/default.jpg
rotation et transformations
https://stacks.stanford.edu/image/iiif/ff139pd0160/K90113-43/1680,1100,1300,1300/150,/45/default.jpg
https://stacks.stanford.edu/image/iiif/ff139pd0160/K90113-43/1680,1100,1300,1300/150,/0/bitonal.jpg
https://stacks.stanford.edu/image/iiif/ff139pd0160/K90113-43/1680,1100,1300,1300/150,/0/gray.jpg
le rendu en niveaux de gris ne fonctionne pas avec ce serveur IIIF.
Pour en savoir plus consultez les spĂ©cifications de lâAPI Image (version 3.0 actuellement).
LâAPI Presentation
En complĂ©ment Ă lâAPI Image, lâAPI Presentation fournit les propriĂ©tĂ©s dâun document IIIF : mĂ©tadonnĂ©es, structures, annotations, etc.
Principales composantes dâun Manifeste IIIF (source : Biblissima+ â Licence Ouverte / Open License 2.0)
Il existe de nombreux visualiseurs pour afficher ces documents et les informations associées. On distingue alors dans différentes zones le rÎle de chacune des deux API principales.
Source : Biblissima+ â Licence Ouverte / Open License 2.0.
Source : Biblissima+ â Licence Ouverte / Open License 2.0.
Ă noter que le visualiseur optimise le trafic en ne demandant au serveur que la partie de lâimage Ă afficher
Pour en savoir plus consultez les spĂ©cifications de lâAPI Presentation (version 3.0 actuellement).
Les autres API
Voir la page des spécifications, extensions, traductions et travaux en cours.
- Authorization Flow (version 2.0) - dĂ©crit un systĂšme de contrĂŽle dâaccĂšs.
- Change Discovery (version 1.0) - fournit les informations nécessaires pour découvrir et utiliser les ressources IIIF.
- Content Search (version 2.0) - dĂ©finit le mĂ©canisme dâinteropĂ©rabilitĂ© permettant dâeffectuer des recherches dans les annotations textuelles associĂ©es Ă un objet.
- Content State (version 1.0) - permet de rĂ©fĂ©rencer tout ou partie dâun manifeste IIIF et de dĂ©crire des modalitĂ©s dâaccĂšs.
Au-delĂ de lâimage : lâaudio, la vidĂ©o et la 3D
Les rĂ©fĂ©rences Ă des ressources audio et vidĂ©o sont prises en compte dans la version 3.0 de lâAPI de prĂ©sentation IIIF. Ă noter quâil nâexiste pas pour lâaudio et pour la vidĂ©o dâĂ©quivalents de lâAPI Image, en effet, cet aspect est pris en charge par les navigateurs. Exemple : audio et vidĂ©o dâun morceau musical associĂ©s Ă la partition.
Il y a une forte demande pour la prise en compte de la 3D par IIIF. Un groupe de travail rassemble les institutions et les personnes intéressées. Il anime un dépÎt Github qui rassemble les documents et expérimentations du groupe.
IIIF et IA
IIIF est de plus en plus utilisĂ© par des dispositifs dâapprentissage et de reconnaissance automatique en raison de la facilitĂ© dâaccĂšs aux images entiĂšres ou Ă des zones, dans les dĂ©finitions et qualitĂ©s nĂ©cessaires. Il est aussi possible dâimaginer des IA qui gĂ©nĂšrent automatiquement des manifestes annotĂ©s.
La sociĂ©tĂ© française Teklia sâest spĂ©cialisĂ© dans ce domaine. Elle vient d'annoncer le passage sous licence libre de sa plateforme Arkindex.
Harvard Art Museums a créé AI Explorer qui mobilisent un certain nombre dâIA pour dĂ©cortiquer des reproductions dâĆuvres et des photographies.
Le Consortium IIIF a mis en place un groupe de travail et il existe une formation en ligne sur le sujet.
Commentaires : voir le flux Atom ouvrir dans le navigateur