L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution.

Grâce à son école d’ingénieurs, l'ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).


Contexte

En réponse au mouvement des Gilets jaunes, le Gouvernement français a lancé en janvier 2019 le Grand Débat national (GDN), une large consultation citoyenne visant à recueillir les doléances et propositions de la population. Ce dispositif reposait à la fois sur une plateforme numérique, ou` les participants pouvaient répondre à des questions réparties en quatre thématiques, et sur des cahiers physiques mis à disposition dans les mairies pour une expression libre, sans contrainte de sujet, appelé les Cahiers citoyens.

Ces cahiers, collectés dans l’ensemble du territoire, représentent plus de 20 000 volumes. Les contributions qu’ils contiennent ont été rédigées directement sur papier ou transmises par courrier électronique avant d’être imprimées et ajoutées au support matériel. Après leur collecte, les cahiers ont été numérisés et transcrits automatiquement grâce à la reconnaissance optique de caractères (OCR), puis partiellement vérifiés manuellement sous la supervision de la Bibliothèque nationale de France (BnF).

L’ensemble forme le corpus des Cahiers citoyens (CC), utilisé dans le cadre des recherches menées par le groupe Géosem (EHESS et IGN), notamment dans la thèse de doctorat de Sami Guembour (ED MSTIC). Ce corpus, géolocalisable grâce aux codes INSEE et postaux des communes de dépôt constitue une ressource unique pour l’étude de l’expression citoyenne territorialisée

Missions

Des analyses textométriques et sémantiques ont permis d’en dégager les principales thématiques, d’identifier des clusters de phrases traitant de sujets similaires et de mettre en évidence des motifs de cooccurrence révélant les problématiques fréquemment associées dans les contributions.

L’objectif du stage consiste à explorer la dimension spatiale de ces contributions afin de mieux comprendre les préoccupations citoyennes et leur ancrage territorial. La répartition géographique des clusters et de leurs cooccurrences sera étudiée et d’éventuelles spécificités thématiques des territoires seront recherchées.

Le stagiaire aura pour missions :

-          préparer et structurer les données géolocalisées issues du corpus ;

-          projeter les clusters thématiques et leurs cooccurrences sur différentes échelles territoriales (communes, départements, régions) et éditer les cartes correspondantes ;

-          réaliser des analyses spatiales pour caractériser la répartition géographique (agrégation), et mettre en évidence et interpréter des spécificités territoriales ;

-          croiser les clusters thématiques avec des variables socio-démographiques (population, revenus, densité, etc.) et géographiques (taille et type des communes) issues de bases de données existantes (IGN, INSEE, données publiques) afin d’identifier de possibles corrélations entre préoccupation citoyennes et caractéristiques locales ;

-          proposer des visualisations synthétiques, graphiques et cartes, des résultats.

 

Le stage utilisera des méthodes de géomatique (méthodes d’analyse spatiale à partir de données complémentaires de description des territoires), et de traitement automatique des langues (modèles de langue et encodages de mots et de phrases correspondants, outils de classification)

Les productions attendues sont les suivantes :

-          un ensemble de cartes thématiques statiques ou interactives mettant en évidence la répartition géographique des clusters et de leurs cooccurrences ;

-          des cartes et tableaux croisant les thématiques avec des indicateurs socio économiques et géographiques pour enrichir l’analyse spatiale ;

-          des méthodes d’analyse spatiale, et les ressources permettant de les mettre en œuvre ;

-          un rapport de stage ou un document technique détaillant les réalisations du stage.

Le code produit devra être rendu disponible et commenté dans le but d’en faciliter le partage et la réutilisation.

Profil recherché

niveau M1 ou M2 ou cursus ingénieur, avec une formation suffisante pour une utilisation autonome d’outils de cartographie. Des connaissances en science des données ou en traitement automatique des langues peuvent être utiles pour mieux comprendre les données textuelles et statistiques à représenter.

Contact

Pour tout renseignement complémentaire :

Sami Guembour, doctorant, sami.guembour@ign.fr

Catherine Dominguès, chercheure HDR en TAL, catherine.domingues@ign.fr

Laurence Jolivet, chercheure en géomatique, laurence.jolivet@ign.fr

Aucune candidature envoyée à ces adresses mail ne sera prise en compte. 

Merci de postuler à cette offre en cliquant sur "Je postule"

Je postule

Suivez-nous en temps réel

Rejoignez nos communautés sur les réseaux sociaux