STAGE DE RECHERCHE de Master 2ème annéeAnnée Universitaire 2024/2025
Sujet du stage: Corrections des biais instrumentaux dans les séries temporelles du SIRTA
par adaptation de domaine
STAGE DE RECHERCHE de Master 2ème année
Année Universitaire 2024/2025
Sujet du stage: Corrections des biais instrumentaux dans les séries temporelles du SIRTA
par adaptation de domaine
Laboratoire: IPSL
Equipe: SIRTA
Lieu du stage: LMD – Ecole Polytechnique
Durée: 4 à 6 mois
Coordonnées du responsable:
Prénom Nom: Jean-François Ribaud
Adresse: LMD/SIRTA, Ecole Polytechnique, 91128 Palaiseau
Téléphone: 01.69.33.51.59
Email: jean-francois.ribaud@lmd.ipsl.fr
Co-encadrement: Nicolas Chea (SIRTA) nicolas.chea@lmd.ipsl.fr, Martial Haeffelin (IPSL) martial.haeffelin@ipsl.fr
Sujet:
Le SIRTA (Site Instrumental de Recherche par Télédétection Atmosphérique,
www.sirta.ipsl.fr) est un observatoire de l’Institut Pierre-Simon Laplace (IPSL), situé sur le
plateau de Saclay (à 20 km au sud de Paris). Depuis plus de 20 ans, le SIRTA a pour
objectif d’étudier les processus physiques et chimiques dans la troposphère, en mettant
particulièrement l’accent sur les nuages, les aérosols, les processus de la couche limite
atmosphérique, le climat urbain et l’énergie solaire. Aujourd’hui, plus de 150 instruments de
pointe (télédétection active et passive, capteurs in situ) sont installés sur une parcelle de 2,5
hectares.
Au cours des 20 dernières années, les capacités technologiques des instruments (résolution
temporelle et/ou spatiale) se sont considérablement améliorées. Ainsi, plusieurs instruments
mesurant une même variable se sont parfois succédés (modernisation ou réparation). Bien
qu’étalonnés par les industriels, voire parfois au SIRTA, ces instruments ne présentent pas
toujours la même calibration d’un capteur à un autre, ce qui entraîne des « sauts » dans les
séries temporelles reconstituées de plusieurs variables clés mesurées au SIRTA
(température, humidité, rayonnement, radiomètre micro-ondes, etc.). Ces discontinuités
empêchent une reconstruction correcte des séries de mesures et biaisent leurs
interprétations à long terme.
Aujourd’hui de nouvelles méthodes en intelligence artificielle, notamment dans
l’apprentissage automatique, permettent de prendre en compte et de minimiser/corriger ces
biais instrumentaux (adaptation de domaine). Les modèles d’apprentissage profond tels que
les réseaux adverses génératifs (en anglais “Generative Adversarial Networks” – GANs) et
leurs variantes ouvrent notamment de nouvelles perspectives pour réduire l’impact de ces
biais instrumentaux et révolutionner le monde des observations [1-3].
L’objectif principal de ce stage est de développer une méthodologie pour corriger les biais
instrumentaux dans les séries temporelles du SIRTA. Pour commencer, un focus tout
particulier sera porté sur la mesure de la température à 2m. Pour se faire, les étapes
suivantes seront entreprises:
- Recherche bibliographique sur l’état de l’art et choix de la méthode (1 mois)
- Développement de la méthode et de l’architecture choisie (4 mois)
- Evaluation des résultats (1 mois)
- Bonus: généralisation sur d’autres variables SIRTA (humidité, rayonnement, …). On
veillera à utiliser la même méthodologie tout en adaptant l’architecture et ses
hyperparamètres aux nouvelles variables considérées.
Pour cela, le langage de programmation Python sera utilisé pour analyser les jeux de
données et construire l’architecture du modèle. Une demande d’accès aux ressources
informatiques de l’IDRIS (super-calculateur Jean Zay) sera effectuée. Un soutien sera
apporté par l’équipe SIRTA, tant sur les aspects instrumentaux que traitements de données.
L’exploitation scientifique des données sera supervisée par plusieurs chercheurs,
enseignant-chercheurs ou ingénieurs de recherche.
Ces travaux seront directement valorisés au travers du Centre d’Observation de la Terre de
l’IPSL (I-CEO, www.ipsl.fr) et l’infrastructure de recherche ACTRIS (www.actris.fr).
Prérequis:
- Formation (Master ou équivalent) en statistiques, mathématiques appliquées, data
science, ou machine learning. - Connaissances en physique de l’atmosphère serait un plus.
- Programmation avancée en Python (Numpy, Pandas, Xarray, Scikit-learn)
- Connaissances d’au moins un framework de Deep Learning (Pytorch et/ou
Keras/Tensorflow) - Connaissances de l’outil de versionnement Git
- Capacité de synthèse et de proposition
- Avoir de bonnes capacités rédactionnelles et orales en français et en anglais
Poursuite :
Ce stage peut-il donner lieu à un sujet de thèse ? Non
Bibliographie
[1] Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., … &
Bengio, Y. (2014). Generative adversarial nets. Advances in neural information processing
systems, 27.
[2] Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation
using cycle-consistent adversarial networks. In Proceedings of the IEEE international
conference on computer vision (pp. 2223-2232).
[3] Sambath, V., Viltard, N., Barthès, L., Martini, A., & Mallet, C. (2022). Unsupervised
domain adaptation for global precipitation measurement satellite constellation using cycle
generative adversarial nets. Environmental Data Science, 1, e24.