L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution.

Grâce à son école d’ingénieurs, l'ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).


Contexte

L’observation de la Terre est un enjeu de plus en plus important. Dans un contexte où la transition écologique est devenue un enjeu national et international, l’Institut national de l’information géographique et forestière (IGN) s’est donné comme mission de cartographier le plus fréquemment possible l’anthropocène, autrement dit les évolutions et l’impact de l’activité humaine sur le territoire.
L’IGN réalise depuis 2018 de travaux IA pour l’automatisation des détections à partir d’images aériennes et satellites. Entre autres, un modèle IA ainsi qu’un large jeu d’apprentissage IA ont été construits pour répondre au besoin de création d’une couche d’occupation grande échelle (OCSGE) sur la France. De plus ces travaux ont été menés de façon ouverte et ont débouché sur la publication en open-data des résultats de détection, des modèles IA ainsi que des données d’apprentissages et
la création de deux défis IA : FLAIR #1 et FLAIR #2.
Suite à ces publications, un intérêt fort a été remonté pour étendre ces résultats IA à des besoins plus spécifique d’occupation du sol, en particulier pour des thématiques agricoles. L’objectif proposer pour ce stage est de participer est de réaliser des travaux SIG d’amélioration du jeux d’apprentissage IA existant afin d’aider l’IGN à répondre à ces besoins utilisateurs.

Missions

L’objet du stage est d’étendre et améliorer le jeu d’apprentissage IA FLAIR existant afin qu’il puisse répondre à des nouvelles problématiques et d’entraîner des modèles IA avec plus de classes. Ces améliorations auront principalement pour objet de répondre aux besoins de détections de couverture du sol pour des thématiques agricoles comme la détection de vignes, vergers ou haies ou bien la détection des grandes catégories de cultures.
Le jeu d’apprentissage FLAIR est aujourd’hui constitué de données images et de labellisation IA de couverture du sol sur un ensemble de zones géographiques représentatives du territoire français. Son extension pour répondre aux nouvelles thématiques consistera donc à réaliser les objectifs suivant :

  • Spécifier le besoin en annotation IA pour une thématique. Que cela soit au niveau de la nomenclature des classes que sur le volume de données nécessaire par classe.
  • Étudier et récupérer les données géographiques existantes sur la thématique d’intérêt pour essayer de produire des labellisation "automatiques". Effectuer une analyse qualité de cette production automatique.
  • Étudier s’il est nécessaire d’ajouter de nouvelles zones géographiques aux dataset. Et si oui, mettre en place et documenter une méthodologie pour définir les nouvelles zones.
  • Prototyper et spécifier une méthodologie pour annoter finement les labels IA nécessaires aux thématiques recherchées. Pour cela le stagiaire pourra tester et utiliser des travaux IGN en cours sur une plateforme de labellisation de données IA.

Les tâches à réaliser pendant le stage seront principalement de l’analyse et du traitement de données géographique (SIG) au format raster ou vecteur, soit :

  • Étendre les données d’apprentissage existantes par récupération de données thématiques (par exemple RPG) et croisement avec les annotations IA existantes ;
  • Analyser les statistiques de distributions des classes sur les zones d’apprentissage existantes et proposer de nouvelles zones permettant d’améliorer la représentativité des nouvelles classes recherchées à moindre coût (moins d’ajout de zone, km² à annoter) ;
  • Étudier la qualité des annotations thématiques obtenues de façon automatique. (Saisie de données test et comparaison quantitative) ;
  • Étudier les nomenclatures possibles sur les thématiques agricoles ;
  • Test d’outils et mise en place de processus pour affiner les annotations IA (rédaction de spécifications de saisie et documentation du processus de saisie) ;
  • Étudier comment améliorer la structure du jeu d’apprentissage (métadonnées, format d’exploration etc..) pour permettre son utilisation plus facilement.

Les traitements et analyses de données SIG seront à faire via l’utilisation de code python pour pouvoir être automatisés et reproductibles. Cela pourra être fait soit via des notebooks jupyter soit par le développement de modules et scripts python. Les analyses, spécifications de nomenclature et propositions de processus de production feront l’objet de rédaction de documents.

Profil recherché

Formation initiale géomatique, informatique, statistique. Niveau Bac+4/Bac+5

  • Expérience en analyse de données géographique (calcul et étude de statistiques spatiales) ;
  • Expérience en développement informatique (notamment python) ;
  • Maîtrise des traitements SIG, notamment via les librairies python scientifiques.

Conditions particulières

Vous intégrerez l’équipe de l'IGN dédiée à l’innovation et à l’expérimentation (Département d’Appui à l’Innovation) de la Direction des Systèmes d’Information (DSI).  Les développements seront faits de façon open-source sur un répertoire Github de l’IGN. 

Il n'y a pas de déplacements prévus.

Atouts de l’environnement de travail

Les locaux de l’IGN sont placés à proximité du Bois de Vincennes, du métro ligne 1 et du RER ligne A.

L’IGN dispose de plusieurs associations sportives et culturelles qui permettent des échanges riches avec l’ensemble du personnel. Une cantine associative permet une restauration de qualité à un prix modéré (tarif préférentiel pour les stagiaires).

Contact

Pour tout renseignement complémentaire :

Nicolas DAVID : nicolas.david@ign.fr

Anatol GARIOUD : anatol.garioud@ign.fr

Eva BOOKJANS : ave.bookjans@ign.fr

Aucune candidature envoyée à ces mails ne sera prise en compte.

Merci de postuler à cette offre en cliquant sur "Je postule"

Je postule