Optimisation par réduction d incertitudes : application à la recherche d idéotypes

Similar documents
Outils de Recherche Opérationnelle en Génie MTH Astuce de modélisation en Programmation Linéaire

Apprentissage automatique Méthodes à noyaux - motivation

Apprentissage automatique Machine à vecteurs de support - motivation

DETERMINING HIGH VOLTAGE CABLE CONDUCTOR TEMPERATURES. Guy Van der Veken. Euromold, Belgium. INVESTIGATIONS. INTRODUCTION.

Apprentissage automatique Classification linéaire - fonction discriminante

Statistiques en grande dimension

La question posée (en français, avec des mots justes ; pour un calcul, l'objectif doit être clairement écrit formellement)

Random variables. Florence Perronnin. Univ. Grenoble Alpes, LIG, Inria. September 28, 2018

Selection on selected records

Exercise sheet n Compute the eigenvalues and the eigenvectors of the following matrices. C =

A DIFFERENT APPROACH TO MULTIPLE CORRESPONDENCE ANALYSIS (MCA) THAN THAT OF SPECIFIC MCA. Odysseas E. MOSCHIDIS 1

The use of L-moments for regionalizing flow records in the Rio Uruguai basin: a case study

arxiv:cs/ v1 [cs.dm] 21 Apr 2005

(Generalized) Polynomial Chaos representation

On a multivariate implementation of the Gibbs sampler

Assimilation des Observations et Traitement des Incertitudes en Météorologie

Dynamics of cold dark matter. Michael Joyce

ANNALES. SÉBASTIEN DA VEIGA, AMANDINE MARREL Gaussian process modeling with inequality constraints

MGDA II: A direct method for calculating a descent direction common to several criteria

Basis Function Selection Criterion for Modal Monitoring of Non Stationary Systems ABSTRACT RÉSUMÉ

Detection of impurities with HPTLC

NORME INTERNATIONALE INTERNATIONAL STANDARD

ème Congrès annuel, Section technique, ATPPC th Annual Meeting, PAPTAC

Regression on Parametric Manifolds: Estimation of Spatial Fields, Functional Outputs, and Parameters from Noisy Data

Authors sort Title Reference code sort.l2.illst ~ pages

The measurement and description of rill erosion

Resumé. 1 Introduction Motivation Thesis outline... 2

MGDA Variants for Multi-Objective Optimization

( ) 2 ( kg) ( 9.80 m/s 2

Extending Zagier s Theorem on Continued Fractions and Class Numbers

Mathematical and Physical Examination of the Locality Condition in Bell s Theorem

Non-Standard Multiset. Jean-Louis Giavitto IRCAM umr 9912 CNRS UPMC & INRIA projet MuSync

Φ B. , into the page. 2π ln(b/a).

A Stochastic Approach For The Range Evaluation

A propos de quelques modèles à compartiments

Statistics of extreme values of stochastic processes generated by rotating machines and associated probabilistic reliability model

A pointwise equivalence of gradients on configuration spaces

Introduction to Machine Learning

cedram Article mis en ligne dans le cadre du Centre de diffusion des revues académiques de mathématiques

An non-ad hoc decision rule for Automatic Target Identification using Data Fusion of Dissimilar Sensors

Le classeur à tampons

Mesurer des déplacements ET des contraintes par correlation mécanique d images

Numerical solution of the Monge-Ampère equation by a Newton s algorithm

Some elements for improving interpretation of concrete electrical resistivity

Evaluating uncertainty in measurements of fish shoal aggregate backscattering cross-section caused by small shoal size relative to beam width

Cloud Feedbacks: their Role in Climate Sensitivity and How to Assess them

ANNALES. FLORENT BALACHEFF, ERAN MAKOVER, HUGO PARLIER Systole growth for finite area hyperbolic surfaces

Best linear unbiased prediction when error vector is correlated with other random vectors in the model

Modélisation & simulation de la génération de champs magnetiques par des écoulements de métaux liquides. Wietze Herreman

Bilinear Modelling of Cellulosic Orthotropic Nonlinear Materials

K. FUJITA INTRODUCTION. Dr., Managing Director of Hazama-Gumi, Ltd. K. UEDA. Deputy Director, Institute of Technology, Hazama-Gumi, Ltd. M.

CANADIAN GEOSCIENCE MAP 201 RECONNAISSANCE SURFICIAL GEOLOGY ENNADAI LAKE Nunavut NTS 65-C. preliminary

SÉMINAIRE DE PROBABILITÉS (STRASBOURG)

Application of computational fluid dynamics to spray drying

Hawn et al (2018) Ecology Letters 21:

REVUE FRANÇAISE D INFORMATIQUE ET DE

Cartesian closed 2-categories and rewriting

Counterexample to the infinite dimensional Carleson embedding theorem

Uncertainty learning for noise robust ASR

Introduction à la mécanique quantique. Emmanuel Fromager

It s a Small World After All Calculus without s and s

Which tools for which purposes?

Nonatomic strategic games and network applications

arxiv: v2 [gr-qc] 9 Sep 2010

SAEMIX, an R version of the SAEM algorithm for parameter estimation in nonlinear mixed effect models

Time-varying cascade model for flow forecasting

cedram Article mis en ligne dans le cadre du Centre de diffusion des revues académiques de mathématiques

BIA FRENCH IMMERSION----FIRST GRADE HOMEWORK CALENDAR. WEEK OF March 21 March 25, 2016

arxiv: v3 [stat.me] 24 Nov 2016 École Doctorale de Science Mathématiques de Paris Centre Thèse de Doctorat Discipline: Mathématiques

ANNALES SCIENTIFIQUES L ÉCOLE NORMALE SUPÉRIEURE. Cluster ensembles, quantization and the dilogarithm. Vladimir V. FOCK & Alexander B.

IMPROVED SUPPRESSION OF UNCORRELATED BACKGROUND NOISE WITH THE STSF TECHNIQUE

Comparison of linear modularization criteria using the relational formalism, an approach to easily identify resolution limit

Regret of Narendra Shapiro Bandit Algorithms

Estimation of monthly river runoff data on the basis of satellite imagery

TESTING AREAL INTERPOLATION METHODS WITH US CENSUS 2010 DATA

DEVELOPMENT OF THE ULTRASONIC HIGH TEMPERATURE BOLT STRESS MONITOR

Poisson s ratio effect of slope stability calculations

UNDERSEA FEATURE NAME PROPOSAL PROPOSITION DE NOM POUR UNE FORME DU RELIEF SOUS-MARIN (See NOTE overleaf / VoirNOTE au verso)

THÈSE DE DOCTORAT. Nikola Stanković. Sujet :

An improvement of the accuracy of Fizeau s experiment

OPTIMIZATION OF AN ULTRATHIN CENTRIFUGAL FAN BASED ON THE TAGUCHI METHOD WITH FUZZY LOGICS. Kuang-Hung Hsien and Shyh-Chour Huang

Adsorption of chain molecules with a polar head a scaling description

Basic building blocks for a triple-double intermediate format

Assimilation de données dans Polyphemus

Assimilation de Données, Observabilité et Quantification d Incertitudes appliqués à l hydraulique à surface libre

Pollution des sols et interaction avec la biosphère

ANNALES DE LA FACULTÉ DES SCIENCES DE TOULOUSE

THE RESOLUTION OF SAFFARI S PHASE PROBLEM. Soit K n := { p n : p n (z) = n

Kato s inequality when u is a measure. L inégalité de Kato lorsque u est une mesure

arxiv: v2 [math.dg] 13 Feb 2018

Multiple Valued Logic - MVL

Sediment sampling in rivers and canals

The utility of L-moment ratio diagrams for selecting a regional probability distribution

PRACTICAL EVALUATION OF LUGEON S AND PAUTRE S CRITERIA FOR LEAKAGES THROUGH CONCRETE DAMS

Uncoupled variational formulation of a vector Poisson problem Jiang Zhu 1, Luigi Quartapelle 2 and Abimael F. D. Loula 1 Abstract { This Note provides

On the direct kinematics of planar parallel manipulators: special architectures and number of solutions

DONAT PHARAND Professor of Law Emeritus, University of Ottawa, Canada Professeur de droit emerite, Universite d'ottawa, Canada

ISSN: (Print) (Online) Journal homepage:

Refined Hyers Ulam approximation of approximately Jensen type mappings

Boutros EL HAJJ. Modélisation Probabiliste de Dégradations Multiphasiques pour l'optimisation de la Maintenance d'infrastructures en Génie Civil :

Transcription:

: application à la recherche d idéotypes Victor Picheny 1, D. Da Silva et E. Costes 2 Rencontres du réseau Mexico, Toulouse 23 mai 2014 1. INRA MIAT 2. INRA GAP

Plan de l exposé 1 Introduction : recherche d idéotypes 2 Optimisation à l aide des processus gaussiens 3 4 Application au simulateur MAppleT 2/19

Retour sur le simulateur MAppleT Un problème simplifié : Traits géométriques : Performance : Distance internoeuds Surface feuille Diamètre branche Angle MappleT + VPLANT Interception lumineuse 3/19

Objectif : recherche d idéotypes performants Problème d optimisation classique Objectif : trouver la meilleure combinaison de traits pour l interception lumineuse Traits = variables continues Domaine de variation : intervalles réalistes Quelle pertinence des résultats? Optima dans les coins du domaine Variétés non atteignables (?) par croisement 4/19

Reformulation du problème Introduction d un deuxième objectif : coût de conception Coût de conception = distance d une combinaison de traits à des phénotypes réels Antagoniste avec la performance Quelle fonction de coût? Données disponibles : 123 observations Pas de lien explicite au génotype Solution raisonnable : distance au nuage de points 5/19

Coût de conception Coût log(d(x) densité de probabilité (gaussienne) des 123 observations Area 20 40 60 80 100 20 40 60 80 100 20 40 60 80 100 20 25 30 35 40 45 50 3 4 5 6 7 8 0 20 40 60 80 INL 20 30 40 50 20 30 40 50 3 4 5 6 7 8 0 20 40 60 80 Diameter 3 4 5 6 7 8 0 20 40 60 80 6/19

Optimisation multi-critères Deux objectifs antagonistes { min -Performance min Coût Solution = ensemble de Pareto Obj2 0.2 0.4 0.6 0.8 1.0 Obj1 7/19

Quels défis? Calcul de l interception lumineuse Modèle coûteux (45min) Boîte-noire (sans dérivées) Fonction non convexe (Stochastique!) Algorithmes classiques inutilisables Solution retenue (parcimonieuse!) Métamodèle + échantillonnage adaptatif Nouvel algorithme adapté au cas multi-objectifs 8/19

Une solution classique : métamodélisation x Simulateur y(x) Plan d'exp. Objectif Métamodèle S... S x 1,..., x N y 1,..., y N S ŷ(x) enrichissement Utiliser au mieux le métamodèle pour piloter les nouvelles expériences y(x) 4000 2000 0 2000 4000 x Prédicteur Observations 9/19

Métamodélisation par processus gaussiens Hypothèse fondamentale y est une réalisation de Y (x) PG ( µ(x), k(x, x ) ) Métamodèle = loi conditionnelle aux observations Métamodèle probabiliste Beaucoup d information exploitable pour l optimisation! y(x) 4000 2000 0 2000 4000 x Prédicteur Observations 10/19

Stratégies d enrichissement adaptatif Principe : critères d échantillonnage Mesure de l intérêt d une observation potentielle grâce au métamodèle Stratégie : on effectue l observation maximisant le critère Critères pour l optimisation Référence : Amélioration espérée = plus grand gain attendu sur l objectif Jones, Schonlau & Welch, Efficient global optimization of expensive black-box functions Journal of Global optimization 13 (4), 455-492 (1998) 4000 2000 0 2000 4000 0.0 1.0 2.0 Critère 11/19

Retour au problème multi-objectifs Illustration : 2 objectifs, 1 dimension, 6 observations Un modèle PG pour chaque objectif 3 observations Pareto-dominantes f1(x) 0.0 0.5 1.0 1.5 Obj1 f2(x) 4000 2000 0 2000 4000 Obj2 Obj2 4000 2000 0 2000 4000 Pareto front x x Obj1 Comment choisir l observation suivante? 12/19

Stepwise uncertainty reduction (SUR) Principe Mesure d incertitude par rapport à un objectif Observation suivante : réduction optimale de l incertitude SUR et optimisation multi-objectifs Critère d incertitude = volume de l ensemble d excursion derrière le front f1(x) 0.0 0.5 1.0 1.5 Obj1 Obj2 1.2 0 x x 13/19 f2(x) 4000 2000 0 2000 4000 4000 2000 0 2000 4000 p(x)

Calcul du critère d échantillonnage [CENSURÉ] Pour croquer dans cette pomme empoisonnée, lire : V. Picheny (2014) Multiobjective optimization using Gaussian process emulators via stepwise uncertainty reduction, Statistics and Computing (on press) 14/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 0 1 2 3 4 Obj2 Sampling crit 15/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 0 2 4 6 8 Obj2 Sampling crit 15/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 0 1 2 3 4 Obj2 Sampling crit 15/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 0.0 0.5 1.0 1.5 2.0 2.5 Obj2 Sampling crit 15/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 0.0 0.5 1.0 1.5 2.0 Obj2 Sampling crit 15/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 Obj2 Sampling crit 15/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 0.0 0.2 0.4 0.6 Obj2 Sampling crit 15/19

Illustration 4000 0 2000 4000 0.0 0.5 1.0 1.5 Obj1 Pareto 1.2 J 4000 0 2000 4000 0.0 0.2 0.4 0.6 Obj2 Sampling crit 15/19

Application au simulateur MAppleT Configuration Initialisation : 50 observations 110 itérations de l algorithme 1 min pour trouver la nouvelle observation (45min par simulation) Résultats Front étendu malgré le faible nombre de simulations Ensemble de variétés potentielles Feasability 5 0 5 10 15 20 Croix : observations initiales Cercles : nouvelles observations 350 250 150 50 Performance 16/19

3 arbres Pareto-optimaux Paramètre LB UB x1 x2 x3 Branching Angle 20 120 79 77 79 Internode Length (m) 0.008 0.051 0.050 0.048 0.044 Top Shoot Diameter (m) 0.001 0.0085 0.0069 0.0074 0.0066 Leaf Area (m 2 ) 0.0003 0.011 0.0089 0.0065 0.0046 PLA - - 360 310 214 Feas. - - 4-1.2-4.3 17/19

Quelques perspectives Application Résultats sous une forme plus facilement exploitables (chemins?) Approfondissement de la notion de faisabilité Traitement des aspects stochastiques Transposition à d autres modèles (SUNFLO) Algorithme Gestion des corrélations entre objectifs Parallélisation, données bruitées Paquet R en préparation... 18/19

The End 19/19

Ensemble des simulations MAppleT 0.0 0.4 0.8 0.0 0.6 BA 0.0 0.6 0.0 0.4 0.8 IL TSD 0.0 0.6 0.0 0.6 0.0 0.6 0.0 0.6 LA 19/19