Estimation de la DSD par NTPP – Internship@CGS IPSL

Rechercher une offre

31-10-2025

Se ferme: 30-03-2026

LATMOS

Contact Email: webmaster@ipsl.fr

Informations sur le stage

Niveau de recrutement: Master - M2

Statut: En recherche de candidat

Durée du stage: 6 mois

Ville: 78280 Guyancourt

Publié: 31-10-2025

Postuler avant le: 30-03-2026

Nom encadrant: A. Chazottes

E-mail de contact: aymeric.chazottes@latmos.ipsl.fr

Fonction: Enseignant-chercheur

Lien avec l'IPSL: Collaborateur de l’IPSL

Autres Encadrants: Non

Equipe Encadrante:

Gratification de stage: oui, recherche de financement en cours

Possibilité de poursuite en thèse: Incertain

Thématiques du sujet: Theorie, Intelligence Artificielle, Apprentissage statistique

Mots clé thématiques: Intelligence artificielle, apprentissage automatique, apprentissage profond

Lié à un thème de recherche IPSL: Oui

Thèmes de recherche IPSL: Statistics for Analysis, Modelling and Assimilation (SAMA)

La description

La pluie est au cœur de nombreux domaines scientifiques (météorologie, hydrologie, télécommunication, …). Selon le sujet d’intérêt elle est considérée via des capteurs ayant des échelles et des procédés de mesure différents. Le plus souvent considérée comme une grandeur continue elle peut aussi être vue comme un ensemble discret de gouttes (distribuées dans l’espace et le temps). Il n’est pas toujours simple d’établir la correspondance entre les visions macro-physique (intensité de pluie) et microphysique (distribution de taille des gouttes).

L’interaction des ondes électromagnétiques avec l’atmosphère précipitante est influencée par la microphysique. La mesure d’un radar météorologique ou l’affaiblissement du signal lors d’une liaison de télécommunication sera donc liée à la répartition des gouttes dans l’atmosphère. L’hydrologue voudra lui connaître des volumes d’eau mesurés au niveau du sol. Dans cette perspective la pluie sera résumée par les mesures d’un pluviomètre. On la considérera comme un processus continu de taux précipitant (i.e. le volume d’eau d’un flux de gouttes captées par une surface sur un intervalle de temps).

Considérer la pluie comme un processus discret permet de la représenter plus finement. Cela permet aussi de mieux contrôler, expliquer et interpréter les paramètres du modèle retenu.

C’est la raison pour laquelle le travail proposé pour ce stage repose sur la mesure de la pluie à la résolution la plus fine et la plus détaillée (microphysique). Il est important de comprendre que le modèle incorpore aussi la représentation continue à plus grande échelle. Cette dernière peut être vue comme une intégration de ses sorties aux résolutions « macroscopiques ».

Sujets du stage :

Il existe de nombreux appareils de mesure de la pluie, nous nous intéresserons plus spécifiquement aux mesures fournies par un disdromètre. Cet appareil mesure les gouttes une à une dans une zone très localisée de l’espace. Notre jeu de données de départ sera donc constitué de triplets correspondant à une taille (Di), une vitesse (Vi) et un temps d’arrivée (ti).

Généralement ce genre de série temporelle est modélisé par un processus ponctuel temporel (TPP pour l’anglais Temporal Point Process) avec marque (mi). La marque est l’information qui vient en plus du temps (ti), ici la taille et/ou la vitesse de la goutte.

Il existe une littérature conséquente sur la modélisation stochastique de la pluie et de ses gouttes [1]. Il en découle une multitude de modèles dont certains incorporent un a priori sur la nature de la pluie [2] alors que d’autres sont purement stochastiques [3]. Ces différents modèles sont basés sur des hypothèses fortes qui conviennent mal à un phénomène aussi versatile que la pluie. Les contraintes/hypothèses du modèle doivent permettre une modélisation appropriée de la pluie et notamment assurer l’obtention de propriétés macroscopiques cohérente avec les mesures de la pluie.

Il semble important de proposer une modélisation à même de prendre en compte les connaissances a priori tout en restant fidèle à la mesure. L’objectif du stage est de développer un modèle dont on puisse valider et comprendre les paramètres

Récemment des modèles neuronaux NTPP (pour Neural TPP) [4][5] adaptés aux processus ponctuels inhomogènes avec marques ont été proposés. Ces modèles ont des architectures [5][6][7] leur permettant de prendre en compte les spécificités de la pluie tout en ajustant les propriétés propres aux séries temporelles apprises.

Déroulement du stage :

Les modèles et les données de ce stage sont assez spécifiques. Cela demandera donc une première étape de familiarisation avec le problème à traiter. Les jeux d’apprentissages et de validation sont issus de deux ans de mesures de la pluie. Pour cela on a deux capteurs colocalisés. Le premier, un disdromètre, fournit une mesure de la distribution des gouttes de pluie à une résolution de 1 minute. Le second, un pluviomètre, donne une mesure du volume d’eau plue (via les basculements d’un auget) avec une résolution de 5s. L’apprentissage de la pluie se fera via des modèles neuronaux NTPP qui apprendront la pluie en la considérant comme un processus ponctuel. Pour cela, on considérera la succession des histogrammes de gouttes. Après quelques tests, pour identifier une architecture à base de CNN, on se focalisera sur l’estimation de l’intensité des précipitations. Dans un second temps, il s’agira aussi d’identifier une loi de probabilité expressive pour apprendre la distribution des tailles de gouttes. (On considérera les lois de la famille exponentielle.) Pour réaliser ce choix, il faudra prendre en compte l’impact de ce nouveau terme dans la fonction de coût à minimiser. Une fois cet apprentissage réalisé, on comparera les résultats obtenus avec les données issues du second capteur, le pluviomètre, dont les mesures sont caractérisées par des basculements à la résolution de 5s.

Si le temps le permet on pourra réfléchir à une évolution de l’architecture permettant de prédire, et potentiellement, d’apprendre les intervalles entre les basculements du pluviomètre.

Mots clefs : Modèle génératif, Processus ponctuel, DSD (pour l’anglais Drop Size Distribution), Processus Ponctuel, NTPP (pour l’anglais Neural Temporal Point Process), Précipitations

Bibliographie :

[1] Michele and Ignaccolo. New perspectives on rainfall from a discrete view. HP, 2013.

[2] Lavergnat and Golé. A Stochastic Raindrop Time Distribution Model. JAM, 1998.

[3]Waymire and Gupta. The mathematical structure of rainfall representations. WRR, 1981.

[4] Shchur et al. Neural temporal point processes : A review. arXiv :2104.03528, 2021.

l’article : https://arxiv.org/abs/2104.03528
Présentation succincte : https://youtu.be/J7qH7i0EyfU?feature=shared

[5] Xue et al. Easytpp: Towards open benchmarking the TPP. arXiv:2307.08097, 2023.

l’article : https://arxiv.org/abs/2307.08097
le code-source : https://github.com/ant-research/EasyTemporalPointProcess.git

[6] Lin et al. Exploring generative neural temporal point process. arXiv:2208.01874, 2022.

[7] Bae et al. Meta temporal point processes. arXiv:2301.12023, 2023.

Rechercher une offre

École Polytechnique

Sorbonne Université

UVSQ

Suivre l'IPSL / Follow us