L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution.

Grâce à son école d’ingénieurs, l'ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).


Contexte

Au sein de la DSI, le Service Innovation, Maturation et Valorisation (SIMV) est chargé de la mise en œuvre du programme de R&D. Il doit assurer l’entretien et l’évolution des plateformes et équipements technologiques permettant de structurer le processus d’innovation et d’assurer l’interface entre l’enseignement, la recherche, et les développements à caractère plus opérationnel. Il est chargé de développer des prototypes, technologiques d’une part et produits et d’usages d’autre part, qui seront de nature à évaluer l’innovation et à décider de son éventuelle valorisation industrielle en interne ou en externe. 

Au sein du SIMV, le département Appui à l'Innovation (DAI) réalise des études et des prototypes permettant de valider la pertinence et la maturité des travaux de recherche. Le cas échéant, il monte en maturité des codes de recherche vers les souches de production via le développement de maquettes, la réalisation de tests et la rédaction de documentation. 

Contexte du stage

L’IGN mène des travaux en intelligence artificielle (IA) visant à automatiser les cartographies s'appuyant sur des images aériennes et satellitaires. Ces recherches ont notamment permis de développer un modèle d’IA ainsi que l'obtention d'un vaste jeu de données d’apprentissage, conçus pour la production d’une couche d’occupation du sol à grande échelle (OCGSE) couvrant l’ensemble du territoire français. Conduits dans une démarche ouverte et collaborative, ces travaux ont abouti à la mise à disposition en open data des modèles d’IA et des données d’apprentissage associés, ainsi qu’à la création de deux défis scientifiques : FLAIR #1 et FLAIR #2, destinés à stimuler la recherche et l’innovation dans le domaine de la télédétection par IA. De plus, l’IGN a créé le jeu de données FLAIR-Hub, qui ajoute des modalités à FLAIR #1 et FLAIR #2 y compris des annotations sur la thématique agricole (types de cultures).  

Les retours d’expérience liés à l’utilisation des résultats de détection par IA ont mis en évidence un fort intérêt pour le développement d’un modèle capable de distinguer un plus grand nombre de classes que celles actuellement disponibles. Les besoins se concentrent notamment sur les thématiques agricoles (vignes, vergers, grands types de cultures) ainsi que sur la détection d’objets visibles sur les images, tels que les pylônes, éoliennes ou panneaux solaires. La performance d’un modèle d’IA supervisé à généraliser et à produire des prédictions fiables sur des données inédites dépend étroitement de la qualité du jeu d’apprentissage. Or, la production manuelle d’annotations reste une tâche longue et coûteuse. C’est pourquoi l’IGN explore actuellement des approches automatiques et semi-automatiques permettant de générer de nouvelles annotations thématiques à moindre coût, en tirant parti des données existantes et des bases de référence déjà disponibles. 

Missions

L’objectif du stage est d’enrichir le jeu de données d’apprentissage en intelligence artificielle (IA) sur la thématique agricole, afin d’entraîner un modèle performant capable de détecter et de distinguer différents types de cultures. Ce travail s’appuiera sur des études préliminaires déjà menées, notamment l’extension des annotations IA à de nouvelles classes agricoles à partir du Registre Parcellaire Graphique (RPG) — une base de données renseignant le type de culture présent sur chaque parcelle agricole— ainsi que l’identification de nouvelles zones d’apprentissage destinées à améliorer la représentativité et la diversité des classes ciblées.  

Les tâches à réaliser pendant le stage porterons principalement sur l’analyse et le traitement de données géographiques, afin de créer un jeu de données d’apprentissage IA permettant d’entraîner un modèle IA sur le thématique agricole. Les étapes suivies seront :    

  • Étudier les méthodologies développées lors de travaux précédents, ainsi que d’évaluer la qualité du jeu d’apprentissage généré de façon automatique. 
  • Proposer et mettre en œuvre de nouvelles approches méthodologiques visant à améliorer la qualité du jeu d’apprentissage en lien avec la thématique agricole et les besoins et performances des modèles IA.
  • Réaliser des analyses quantitatives et qualitatives, documenter les démarches poursuivies et présenter les résultats obtenus.
  • Mettre au propre du code et documentation en format dépôt git bien structuré
  • Entraîner, vérifier et valider les modèles intégrants le jeu de données enrichi. 

Profil recherché

Compétences techniques :  

  • Bonne connaissance en statistique et fort intérêt pour leur application à l’analyse des données ; 
  • Expérience en manipulation, modélisation et analyse des données, incluant l’utilisation de méthodes d’apprentissage automatique ;
  • Compétences en développement informatique, avec une bonne maîtrise des outils et environnements de programmation ;
  • Maîtrise de python, ses bibliothèques scientifiques et des notions d’une bibliothèque d’apprentissage profond (idéalement PyTorch) ; 
  • Intérêt pour le traitement d’images, l’optimisation et les problématiques liées à la création d’un jeu d’annotation pour des méthodes d’apprentissage profond supervisé ;
  • Une expérience en manipulation de l’information géographique est un plus ;  

Compétences organisationnelles et relationnelles :   

  • Expliquer et documenter une démarche, un résultat ;  
  • Collaborer et travailler en équipe ;  

Expérience professionnelle souhaitée :  

  • Formation initiale informatique, data science, statistiques ou équivalent
  • Niveau Bac+4/Bac+5 ou équivalent 

Atouts de l’environnement de travail

Le SIMV est un service qui accueille des profils très variés ayant des compétences fortes dans de nombreux domaines scientifiques et techniques. Les échanges avec les collègues permettent donc de développer ses propres compétences. 

Les travaux menés au SIMV permettent aussi de découvrir les différentes productions de l'IGN et d'être en contact avec la recherche. 

Contact

Pour tout renseignement complémentaire :

Eva Bookjans (eva.bookjans@ign.fr) 

Aucune candidature envoyée à cette adresse mail ne sera prise en compte. 

Merci de postuler à cette offre en cliquant sur "Je postule"

Je postule

Suivez-nous en temps réel

Rejoignez nos communautés sur les réseaux sociaux