Le projet JADIS est issu d'une collaboration scientifique entre la Bibliothèque nationale de France (BnF) et l'Ecole Polytechnique Fédérale de Lausanne (EPFL). Les buts du projet sont les suivants:
La part du projet visible en ligne correspond principalement au second objectif. L'essentiel du projet consiste cependant à développer un algorithme permettant de géolocaliser automatiquement les cartes, en faisant appel à des technologies avancées d'intelligence artificielle, telles que les réseaux de neurones. Ce développement s'inscrit dans le cadre de la recherche expérimentale en humanités digitales et géospatiales. Le programme développé est entièrement disponible en libre-accès (voir l'onglet Téléchargement).
L'algorithme comprend deux axes principaux. Le premier vise à vectoriser automatiquement les cartes à l'aide d'un réseau neuronal. Le second vise à créer un réseau de similarité pour réaligner les cartes entre elles. Le tronc principal du programme permet ensuite d'identifier les similarités géométriques entre les cartes vectorisées pour déterminer la position des cartes les unes par rapport aux autres et également par rapport au tissu urbain actuel.
Le visualiseur JADIS en ligne permet de replacer les cartes automatiquement géolocalisées sur une carte actuelle et de comparer ces dernières. À titre expérimental, les résultats de la vectorisation automatique ("Îlots vectorisés") et de l'extraction du réseau viaire ("Réseau viaire filaire") sont également superposables à la carte. L'estimation de la "Déformation de la carte" est également disponible, sous la forme d'une carte colorée, sur laquelle les zones sombres indiquent les zones probablement peu déformées. Les zones colorées s'étalent sur plusieurs nuances de rouge, de rose et de bleu, où les régions bleutées indiquent une déformation verticale (positive ou négative) et où les régions rouges indiquent une plus forte déformation horizontale (ibidem).
Comment les cartes ont-elles été géolocalisées ?
Il n'y a pas d'intervention humaine dans le processus de géolocalisation des cartes. Un réseau de neurones ainsi qu'un algorithme de réalignement sont utilisés. De même, pour la segmentation des îlots et la vectorisation des rues, l'intelligence artificielle fonctionne sans intervention. La seule étape effectuée manuellement consiste à constituer le corpus de cartes présenté sur ce site. L'automatisation de cette étape longue et coûteuse nous a permis de vous proposer autant de données géoréférencée, mais elle explique également que certaines cartes peuvent être décalées, même lorsque le plan est géométriquement correct, car cette technologie est encore en développement.
Pourquoi les cartes historiques ne se superposent pas toujours à la carte actuelle ?
Outre l'automatisation de la géolocalisation (lire ci-dessus), les cartes anciennes sont très souvent déformées. La déformation résulte non seulement de l'usure de l'objet, mais peut également être causée par son conditionnement. Certaines cartes, par exemple, ont été découpées en plusieurs morceaux et collées sur un fond de toile. D'autre part, il faut retenir que jusqu'au début du XXème siècle, les cartes ne sont généralement pas basées sur une vue aérienne de la ville. Les imprécisions lors des relevés au sol sont très fréquentes. De même, la précision peut être également impactée par le processus de gravure et d'impression de la carte. Finalement, de nombreuses cartes du corpus sont stylisées. Les rues et les îlots peuvent ne pas être représentés de manière réaliste, par exemple pour des raisons de lisibilité. Des ellipses spatiales sont également souvent utilisées pour permettre de représenter sur le plan de ville des lieux périphériques plus éloignés.
Quel moteur de recherche permet de géoréférencer les noms de lieux ?
Le requêtage de deux bases de données permettent de retrouver les noms de lieux. Pour les données contemporaines, le moteur de recherche Nominatim d'OpenStreetMap est sollicité. Pour les rues et les lieux n'existant plus aujourd'hui, une recherche est effectuée dans la base de données des noms de rues issue du projet Repopulating Paris de l'Institut national d'Histoire de l'Art et de l'Ecole Polytechnique Fédérale de Lausanne. Ce projet a permis de géoréférencer plusieurs milliers de noms de rues, correspondant à plusieurs millions d'adresses.
Comment lire la couche de déformation des cartes ? À quoi correspond-elle ?
La couche de déformation des cartes est une estimation de la déformation des cartes par rapport à la géolocalisation calculée. Elle ne prend en compte que les déformations de moins de 250 pixels au niveau des points d'amer qui permettent de réaligner la carte ancienne sur la carte actuelle. Par assertion, la déformation est considérée nulle aux bords de la carte. Cela n'est évidemment pas toujours le cas, mais l'extension de la déformation jusqu'au bord de la carte ne serait pas plus correcte. Les régions sombres correspondent à un score d'alignement très élevé, tandis que les régions plus lumineuses correspondent à une déformation probablement plus importante. Les aires rouges indiquent à une déformation horizontale, tandis que les aires bleues signalent une déformation verticale. Les aires intermédiaires roses ou violettes indiquent une déformation à la fois verticale et horizontale.
À quoi correspond la notion de confiance ?
La confiance est une indication de la fiabilité de la géolocalisation. Elle prend notamment en compte le nombre d'amers utilisés pour géolocaliser la carte et la cohérence du résultat vis-à-vis de l'échelle et de l'angle de rotation de la carte. Trois catégories qualitatives sont utilisées sur le site pour rendre cet indice plus facilement utilisable : confiance acceptable, élevée, et très élevée. Les images qui n'ont pas obtenu un niveau de confiance acceptable n'ont évidemment pas été retenues pour le visualiseur.
Les données utilisées par le site web, en particulier les couches d'information des cartes sont disponibles en libre-accès sur Github Pages.
Les images de cartes sont téléchargeable gratuitement sur l'API IIIF de récupération des images de Gallica.
Finalement, l'algorithme développé pour géolocaliser les cartes automatiquement et pour créer les couches d'information est disponible en libre-accès sur Github.
Attribution
Site de la Bibliothèque nationale de France (BnF). 2020. CC-BY 2.0
Basé sur le site web de GeoHistoricalData. CC-BY 2.0.
Fond de carte : contributeurs d'OpenStreetMap et CARTO.