2022 Optimization Days
HEC Montréal, Québec, Canada, 16 — 18 May 2022
MA5 - Méthodes statistiques et exploitation de données
May 16, 2022 10:30 AM – 12:10 PM
Location: Louis-Laberge (red)
Chaired by Jonathan Jalbert
4 Presentations
-
10:30 AM - 10:55 AM
Analyse de données fonctionnelles appliquée à des problèmes de cartographie génétique
L’objectif de la cartographie génétique est d’identifier des gènes ayant un effet sur un phénotype d’intérêt. Traditionnellement, le phénotype d’intérêt était binaire (cas vs témoin) ou quantitatif, mais il arrive de plus en plus qu’il prenne une forme fonctionnelle, par exemple il pourrait être une courbe ou une image. Le terme «données fonctionnelles» est employé afin de décrire de tels objets (courbe, surface, etc.) qui peuvent en fait être vus comme les réalisations d'une fonction aléatoire. Il existe une vaste littérature sur l’analyse statistique de telles données, qu’on appelle l’Analyse de Données Fonctionnelles (ADF). Dans cette présentation, je vais explorer ce que peut nous apporter l’utilisation de l’ADF dans des problèmes de cartographie génétique où le phénotype d’intérêt est fonctionnel. Dans un premier temps, je vais faire une revue de littérature des méthodes existantes et ensuite une nouvelle mesure d’association fonctionnelle sera définie. Finalement, la performance de la mesure proposée sera étudiée à l’aide d’une étude de simulations et d’une application à de vraies données.
-
10:55 AM - 11:20 AM
Stress Testing Extreme Events
We stress test extreme events, and suggest a framework suitable for heavy tailed distributions. Starting from a baseline probability measure, we solve the problem of finding the perturbed probability measure that exceeds a given risk tolerance and has the smallest Rényi divergence to the baseline measure. We study the optimisation problem with risk tolerances given by the Value-at-Risk, Expected Shortfall, and expectiles, and prove that the perturbed probability measures exist and are unique. We provide semi-analytical solutions and characterise the perturbed measures via the so-called lambda-exponential functions.
-
11:20 AM - 11:45 AM
Modeling panels of extremes
Extreme value applications commonly employ regression techniques to capture cross-sectional heterogeneity or non-stationarity in the data. Estimation of the parameters of an extreme value regression model is notoriously challenging due to the small number of observations that are usually available in applications. When repeated extreme measurements are collected on the same individuals, i.e., a panel of extremes is available, pooling the observations in groups can improve the statistical inference. We study three data sets related to risk assessment in finance, climate science, and hydrology. In all three cases, the problem can be formulated as an extreme value panel regression model with a latent group structure and group-specific parameters. We propose a new algorithm that jointly assigns the individuals to the latent groups and estimates the parameters of the regression model inside each group. Our method efficiently recovers the underlying group structure without prior information, and for the three data sets it provides improved return level estimates and helps answer important domain-specific questions.
-
11:45 AM - 12:10 PM
Copula diagonals, distortions and the asymptotic distribution of maxima
In its most common form, extreme value theory is concerned with the limiting
distribution of location-scale transformed block-maxima of a sequence of
identically distributed random variables. In case the members of the sequence
are independent, the weak limiting behavior of the maximum is adequately
described by the classical Fisher--Tippett--Gnedenko theorem. In this
presentation we are interested in the case of dependent random variables,
while retaining a common marginal distribution function for all members of
the sequence. This approach is facilitated by highlighting the connection
between block-maxima and copula diagonals in an asymptotic context. The main
goal of this presentation is to discuss a generalization of the
Fisher--Tippett--Gnedenko theorem in this setting, leading to limiting
distributions that are not in the class of generalized extreme value
distributions.