Ressources
Logiciels
AGORA
Le logiciel AGORA permet d'extraire des méta-données
des images de documents historiques en fonction
d'un scénario défini par l'utilisateur.
Pour cela, AGORA repose sur l'analyse de deux cartes de segmentation en blocs de l'image :
une des formes et l'autre du fond.
AGORA procède alors à une classification des blocs extraits
pour la constitution des méta-données.
Cette classification opère selon un
scénario produit par l'utilisateur
au cours d'une phase d'interaction avec AGORA.
DEBORA
DEBORA propose des méthodes d’analyse et
d’interprétation du contenu des images pour à la fois réaliser une compression plus efficace
et extraire automatiquement des méta-données utiles à l’indexation par le contenu. Pour cela
DEBORA est basée sur une décomposition des images en objets indépendants qui seront
compressés avec des méthodes appropriées. DEBORA propose aussi un format de données
hétérogènes, adapté à la navigation dans les ouvrages numérisés compressés, qui permet
aussi de les modifier, les annoter ou les échanger sur Internet dans le cadre d’un travail
collaboratif.
DOCREAD
DocRead est un générateur automatique de systèmes de reconnaissance
de documents structurés. Il est constitué
d'un compilateur du langage EPF (permettant de décrire un document à l'aide d'une grammaire),
d'un module d'analyse lié à ce langage, d'un module de vision précoce
(binarisation et extraction de segments) et d'un classifieur ayant des capacités de rejet.
DocRead permet ainsi une adaptation rapide à un nouveau type de document. En effet,
il faut simplement définir une nouvelle grammaire (à l'aide d'EPF) qui décrit
le nouveau type de document.
EMMA
L'éditeur EMMA permet de réaliser des transcriptions dites "diplomatiques"
d'images de manuscrits. Son principal intérêt est de décharger le transcripteur
des problèmes fastidieux de mise en forme des transcriptions.
La sauvegarde des données s'effectue
dans un format XML baptisé Gustave_ML. Ce dernier facilite les échanges de données
en permettant l'enregistrement des transcriptions
dans différents formats tel que le HTML
pour la publication Web et le PDF pour l’impréssion papier.
QUEID
QUEID "QUery Engine on Image Databases" est un outil de diagnostic
de base d'images numérisées. Il extrait des bases
les caractéristiques des images (modèles, formats, résolutions, etc.)
afin d'en dresser une analyse statistique présentée
sous la forme de graphiques à l'utilisateur.
Ce dernier peut dans une deuxième étape utiliser QUEID en mode requête
sur les caractéristiques des images. Le but est de naviguer
au sein des bases afin d'identifier les éventuels problèmes de numérisation.
REIRE
REIRE "Run Encoding Image based Retrieval Engine" est un moteur de recherche
d'images similaires. Le but de REIRE est le traitement rapide de larges bases.
Pour ce faire REIRE exploite une représentation compressée des images à base de plages.
Cette représentation est utilisée à différents niveaux au travers d’un mécanisme
de recherche perceptif. La recherche est alors affinée successivement afin de limiter
l’espace de comparaison. Cette approche permet à REIRE d’effectuer des recherches
particulièrement rapides des images au sein de larges bases.
Bases d'images
Des base d'images graphiques (lettrines, marques typographiques, portraits, ...) des BVH sont mises à disposition sur la page suivante.
Une base experimentale d'impréssions anciennes constituée durant la Thèse de E. Baudrier est disponible à l'adresse suivante.