2023-2024
Les séminaires de STATQAM ont lieu à 15h30 (Heure de l’Est), certains seront en présentiel au PK-5115 et d’autres en ligne via Zoom.
Session Automne 2023
Jeudi 21 septembre : Mariia Samoilenko (UQAM)
Titre : Approches de médiation basées sur la régression avec réponse binaire : contourner l’hypothèse de la réponse rare ou commune
Résumé : Dans le cadre de la médiation causale simple, un certain nombre d’approches d’estimation basées sur la régression logistique ont été proposées pour estimer les effets naturels (EN) pour une réponse binaire sur l’échelle du rapport de cotes. Ces approches ont invoqué lesdites hypothèses de la réponse rare (VanderWeele et Vansteelandt (2010); Valeri et VanderWeele (2013)) ou commune (Gaynor et al. (2019)) afin d’obtenir des expressions approximatives simples et fermées pour les EN. Toutefois, l’évaluation de l’hypothèse de la réponse rare est problématique compte tenu de la difficulté à proposer des lignes directrices explicites permettant de faire cette vérification en pratique. Quant à l’approche de Gaynor et al. (2019), une performance adéquate des estimateurs proposés n’a été démontrée que pour un intervalle de prévalences de la réponse assez limité.
En lien avec ces travaux, nous introduirons des estimateurs exacts des EN basés sur la régression logistique pour la réponse, mais dérivés sans invoquer aucune hypothèse théorique simplificatrice, ce qui permet de surmonter les difficultés inhérentes à l’application des approches approximatives susmentionnées. Nos estimateurs sont développés pour des expositions et des médiateurs binaires ou continus, et ils accommodent trois échelles binaires standards (le rapport de cotes, le rapport de risques et la différence de risques). Nous illustrerons la performance de nos estimateurs dans des scénarios de simulation où la réponse est rare ou commune.
Jeudi 28 septembre : Roland Dossa (UQAM)
Titre : Tests d’association basés sur les copules pour un phénotype binaire et un ensemble de variants génétiques en présence de données familiales
Résumé : De nos jours, plusieurs études d’association à l’échelle du génome (Genome-Wide Association Study, GWAS) sont proposées dans le domaine de la statistique génétique. Face au flux de données génomiques générées par les nouvelles techniques de séquençage, les tests statistiques d’association analysant un variant génétique à la fois se sont avérés non-puissants. Afin d’augmenter la puissance statistique des tests d’association génétiques, des tests qui regroupent les informations provenant de plusieurs variants dans une région génomique donnée ont été développés. Ces tests calculent une statistique de test qui résume l’association globale entre les variants génétiques et le phénotype d’intérêt (ex: le statut de la maladie). Bien que les tests basés sur la région soient plus puissants, la majorité des modèles ne sont pas adéquats en présence de données familiales et phénotype binaire.Dans ce travail, nous présentons deux principales contributions dans ce contexte. Tout d’abord, nous proposons un test d’association flexible, basé sur la région, qui modélise la distribution conjointe du trait binaire au sein de chaque famille sur la base d’un modèle logistique marginal en intégrant des copules pour modéliser la dépendance entre les membres de la même famille. Dans la deuxième contribution, nous procédons à la modélisation de la distribution conjointe du trait binaire au niveau de chaque famille sur la base d’un modèle fonctionnel marginal en utilisant toujours des copules pour capturer la dépendance intrafamiliale. Nous illustrons la performance de la méthodologie proposée à l’aide de simulations et d’une étude d’association de la schizophrénie et le trouble bipolaire dans une cohorte familiale composée de 17 familles élargies de l’est du Québec.
Jeudi 5 octobre : Widemberg da Silva Nobre (Universidade Federal do Parana) par ZOOM : https://uqam.zoom.us/j/82455316664
Title : Modelling Death Probability among Hospitalisations due to Respiratory Diseases: A Causal Mediation Approach
Abstract : We present a causal mediation analysis framework designed to address time-varying observations in the presence of exogenous exposure. Our proposed approach involves modeling the mediator and outcome variables separately, while accounting for the temporal nature of the data. The proposed method is applied to model hospitalisation data for inpatient admissions with a primary diagnosis of respiratory disease recorded between January 2015 and October 2020. This time frame encompasses the onset of the first wave of the COVID-19 pandemic in Brazil, which we consider as the exogenous exposure of interest. We model the weekly number of deaths, with the average age of weekly inpatient admissions serving as the mediator variable. Our findings indicate higher estimates of natural indirect effects on the inpatient probability of death within the pandemic context. This is a joint work with Helio Migon and Alex Schmidt.
Keywords: Bayesian methods, Dynamic Generalized Linear Models, Inpatient admissions, Patient safety.
Jeudi 12 octobre : Philipp Ratz (UQAM)
Titre : Cherry-Picking by Design: Algorithmic Pricing in Risk Markets
Résumé : Like many other sectors, the risk industry is undergoing a rapid transformation due to increased usage of Artificial Intelligence. Given its crucial role in the functioning of an economy, regulators are increasingly concerned about the effects that the introduction of algorithmic pricing has on market outcomes. However, there is no consensus whether this will lead to beneficial or detrimental outcomes for the consumers. Empirical investigations have so far remained elusive, due to the absence of publicly available data and models. To bridge this gap, we conducted a large-scale online field experiment, where we collected a wide range of pricing models made by industry experts. We find that under standard market settings, algorithmic pricing leads firms to cherry-pick their customers, and only serve the least-risky part of the population. This in turn exerts a significant pressure on other market participants to adapt their models as well. A widespread adaption of such models then leads to higher prices for most of the population, in contradiction to what many standard arguments would predict. Whereas much of the recent discussion on algorithmic pricing has focused on issues related to data hoarding and privacy, our findings suggest that there needs to be a more fundamental discussion about the usage of ever more granular models.
Jeudi 19 octobre : Pankaj Bhagwat (University of Alberta) par ZOOM : https://uqam.zoom.us/j/84408907866
Titre : Predictive density estimators with integrated L1 loss
Résumé : https://statqam.uqam.ca/wp-content/uploads/sites/31/2023/10/Abstract_Pankaj-Bhagwat.pdf
Jeudi 2 novembre : Vladimir Reinharz (UQAM)
Titre : Modules structuraux d’ARN de taille arbitraire et exploration de leurs voisinages
Résumé : L’acide ribonucléique (ARN) est une biomolécule essentielle présente dans chaque organisme vivant qui adopte des structures tridimensionnelles complexes pour assurer ses fonctions. Même si l’éventail des configurations possibles de l’ARN est immense, des modules structuraux similaires ont été identifiés dans divers spécimens. Ces modules sont cruciaux pour appréhender les fonctions biologiques de l’ARN et peuvent être efficacement modélisés à l’aide de graphes. Ces derniers, annotés par les interactions entre nucléotides selon les 12 géométries de type Leontis-Westhof, fournissent une perspective inédite sur la structure de l’ARN.
Je discuterai d’abord de la pertinence des graphes dans la modélisation des structures d’ARN et des enjeux liés à l’analyse d’une grande quantité de données pour extraire automatiquement les modules pertinents. Ensuite, je présenterai une méthode d’échantillonnage s’appuyant sur des principes de physique statistique pour identifier l’ensemble des variants d’un module structurel au sein d’un ARN. Cette méthode considère les variations géométriques ainsi que les interactions absentes, offrant de ce fait une vision exhaustive des modules structurels.
Jeudi 9 novembre : Emily Berg (Iowa State University) par ZOOM : https://uqam.zoom.us/j/82022800557
Titre : Small Area Prediction for Exponential Dispersion Families under Informative Sampling
Résumé : Small area estimates are usually constructed from complex survey data. If the design is informative for the model, then procedures that ignore the design can suffer from important biases. Past work on small area estimation under informative sampling has focused heavily on linear models or on prediction of means. We propose to generalize existing small area procedures for an informative sample design. We develop procedures in the context of a broad class of exponential dispersion families with random small area effects. We consider two models for the survey weights. We construct predictions of means as well as more general parameters that are nonlinear functions of the model response variable. We evaluate the procedures through simulation using a logistic mixed model. We then apply the methods to construct small area estimates of several functions of a wetlands indicator using data from a large-scale survey called the National Resources Inventory.
Jeudi 16 novembre : Renaud Alie (Université McGill)
Titre : Bayesian Density Estimation Using a Nearest-Neighbor Gaussian Process Approximation
Résumé : Gaussian processes are ubiquitous in spatial statistics and many other fields. Their properties are well studied and understood. However, they can be challenging to work with from a computational standpoint because likelihood evaluations require a quantity of operations that scales with the number of observations cubed. Many approximating methods have been proposed to curb the computational cost and allow for the analysis of larger datasets. One such approach is the nearest-neighbor Gaussian process model which approximates the likelihood by a product of easier to compute conditional factors.
In this talk, we discuss the Gaussian process density sampler: a prior based on the method of rejection sampling. Via data augmentation, this model is used to conduct Bayesian non-parametric estimation of densities. We propose a new MCMC algorithm that relies on the theory of point processes. In its basic form, the nearest-neighbor approximation is not suited for this procedure. We introduce an alternative formulation that preserves the linear computational scaling of the original. Finally, we evaluate the performance of our new method both quantitatively and qualitatively.
Jeudi 23 novembre : Gracia Dong (University of Toronto and University of Victoria) par ZOOM : https://uqam.zoom.us/j/85453387054
Titre : Using Capture-Recapture methods with data extracts from healthcare records to estimate population sizes of vulnerable populations: an application to Vancouver Island
Résumé : Most attempts to enumerate the homeless population rely on point-in-time or shelter counts, which can be costly and inaccurate. As an alternative, we use electronic health data from the Vancouver Island Health Authority, British Columbia, Canada from 2013 to 2022 to identify adults contending with homelessness based on their self-reported housing status. We estimate the annual population size of this population using a flexible open-population capture-recapture model that considers 1) the age and gender structure of the population, including aging across detection occasions, 2) annual recruitment into the population, 3) behavioural-response, and 4) apparent survival in the population, including emigration and incorporating known deaths. We then compare our estimates of annual population size with reported point-in-time counts of homeless populations on Vancouver Island over the same period and find that using data extracts from electronic health records gives comparable estimates when data quality is good. We then discuss data requirements, data quality issues with administrative health data, and potential ways to remedy estimates when data is insufficient, while keeping into consideration constraints imposed by computational data privacy restrictions.
Session Hiver 2024
Jeudi 25 janvier : Marie Michaelides (UQAM)
Titre :
Résumé :
Jeudi 1 février : Sidi Wu (Simon Fraser University) par ZOOM
Titre :
Résumé :
Jeudi 8 février : Russell Steele (Université McGill)
Titre :
Résumé :
Jeudi 15 février : Anthony Coache (Université de Toronto)
Titre :
Résumé :
Jeudi 7 mars : Ewen Gallic (Aix-Marseille Université)
Title :
Abstract :
Jeudi 14 mars : Yanbo Tang (Imperial College London)
Titre :
Résumé :
Jeudi 21 mars : Simone Brugiapaglia (Université Concordia)
Titre :
Résumé :
Jeudi 4 avril : Ashley Buchanan (University of Rhode Island)
Titre :
Résumé :