Abstracts

Original: http://www.carolineuhler.com/algstatsIST12_abstracts.htm

Mikhail Belkin: Algebraic-geometric methods for learning Gaussian mixture modelsThe study of Gaussian mixture distributions goes back to the late 19th century, when Pearson introduced the method of moments to analyze the statistics of a crab population. They have since become one of the most popular tools of modeling and data analysis, extensively used in speech recognition and other fields. Yet their properties are still not well understood. Widely used algorithms, such as Expectation Maximization (EM) often fail even on simple generated data and their theoretical properties are often unclear. In my talk I will discuss certain theoretical aspects of the problem of learning Gaussian mixtures. In particular, I will discuss our recent result, which, in a certain sense, completes work on an active recent topic in theoretical computer science by establishing quite general conditions for polynomial learnability of mixtures by using  techniques of algebraic geometry.

Cristiano Bocci: Advances in model identifiability: Bernoulli, tensors, and beyond

In this talk I will show how the concept of weakly-defective varieties can give informations on the identifiability of statistical models. Then, using these varieties, I will show some recent result that improves previous bounds on the identifiability of Bernoulli and other statistical models.

Manfred Deistler: Generalized linear dynamic factor models – the single and the mixed frequency case

We consider generalized linear dynamic factor models. These models have been developed recently and they are used for high dimensional time series in order to overcome the “curse of dimensionality”. We present a structure theory with emphasis on the zeroless case, which is generic in the setting considered. Modelling of the latent variables is decomposed into two steps, first the transformation of the latent variables to static factors by a linear static transformation. Then, in the second step, modelling of the static factors as a possibly singular autoregressive process. The (generalized) Yule–Walker equations are used for parameter estimation. The Yule–Walker equations do not necessarily have a unique solu- tion in the singular case, and the resulting complexities are examined with a view to find a stable and coprime system. Finally, some preliminary results for the mixed frequency case are presented.

This is joint work with B.D.O. Anderson, E. Felsenstein, B. Funovits, and M. Zamani.

Alex Engstroem: Higher connectivity and expansion of fiber graphs of Gröbner bases

The Metropolis-Hastings algorithm is commonly employed to run random walks on graphs to estimate different statistics. Properties of the underlying graph will determine the efficiency of the algorithm. Diaconis and Sturmfels invented a method to use fiber graphs of Gröbner bases in this context. These graphs are connected, but more refined structural information is missing in general.

A graph is k-connected if you have to remove at least k vertices to have it fall apart. The minimal degree of a graph is an upper bound for the connectivity. I have conjectured that this bound is realized for fiber graphs of reduced Gröbner bases, and I will discuss two results supporting the conjecture. The first is by my student Samu Potka, who has proven it for graphs from contingency tables. The second result is that large fiber graphs essentially have a huge part that is D/2-connected where D is the maximal degree. Maximal — not minimal!

I will also report on results on expansion properties of fiber graphs.

Robin Evans: Algebraic constraints on marginalized DAGs

Directed acyclic graphs (DAGs) are a popular tool for modelling because they impose simple conditional independence constraints, their modular structure lends itself to computational efficiency, and they link easily to causal methods.  However if some of the variables in a DAG are unobserved, the simplicity of these constraints is lost: in particular, we may encounter algebraic (equality) constraints on the joint distribution which do not correspond to conditional independences, as well as semi-algebraic (inequality) constraints. In this talk we focus on the former.

We provide a class of graphs, called mDAGs, which is sufficient to describe the set of possible models induced by marginalizing a DAG, whilst making no assumption about the state space of the unobserved variables.  We define a suitable Markov property for this class. Previously known algebraic constraints on this class of models consist of conditional independences and so-called Verma constraints.

Models defined by these algebraic constraints have recently been described in the work of Richardson, Robins and Shpitser, using their nested Markov property.  In a large class of mDAG models, called decomposable, we characterize the algebraic constraints induced by the mDAG Markov property, finding that they consist of precisely the same constraints as the nested Markov property.  Therefore the nested Markov model is ‘complete’ in these cases, in the sense that it represents all algebraic constraints.  We also see that in non-decomposable models, any algebraic constraints missed by the nested Markov property must have a character quite distinct from conditional independences and Verma constraints.

Jesus Fernandez: Une approche phylogénétique au moyen de la géométrie algébriqueDans la phylogénétique, l’objectif est de reconstruire les relations ancestrales entre les organismes. Ces relations sont représentées au moyen d’un arbre phylogénétique, dont les noeuds représentent intérieur ancêtres de l’espèce en cours. De nos jours, une grande quantité de données obtenue par séquençage des génomes des espèces est disponible et que le domaine de la phylogénétique tente de déduire des arbres phylogénétiques concernant un groupe d’espèces à partir de leurs séquences d’ADN.
Les biologistes et mathématiciens ont contribué à la reconstruction de ces arbres phylogénétiques, mais de nombreuses questions restent encore théoriques ouverte. L’utilisation d’outils algébriques et géométriques peut aider à résoudre certaines de ces questions. Outils de reconstruction phylogénétiques utilisent souvent un modèle moléculaire de l’évolution sur un arbre. Nous allons rappeler comment ces modèles évolutifs conduisent naturellement à des variétés algébriques. Ensuite, nous allons essayer de comprendre comment les polynômes de fuite sur ces variétés peuvent contribuer à la reconstruction phylogénétique et comment les outils de la géométrie algébrique et la théorie de groupe peuvent aider à la compréhension de questions plus théoriques, comme identifiabilité ou de sélection de modèle problèmes.

Les résultats de l’entretien sont tirées de [PS05], [CFS07], [CFS08], [CFS11], [KDGC], [CKFS11].

Références:
[CFS07] M Casanellas and J Fernández-Sánchez. Performance of a new invariants method on homogeneous and nonhomogeneous quartet trees. Mol. Biol. Evol., 24(1):288-293, 2007.
[CFS08] M Casanellas and J Fernández-Sánchez. Geometry of the Kimura 3-parameter model. Adv.in Appl. Math, 41:265-292, 2008.
[CFS11] M Casanellas and J Fernández-Sánchez. Relevant phylogenetic invariants of evolutionary models. Journal de Mathamatiques Pures et Appliques, Volume 96, Issue 3,  2011, 207–229
[CKFS11] M Casanellas, A Kedzierska, and J Fernández-Sánchez. The space of phylogenetic mixtures of equivariant models. Preprint, 2012.
[KDGC] A Kedzierska, M Drton, R Guig o, and M Casanellas. SPIn: model selection for phylogenetic mixtures via linear invariants. Mol. Biol. Evol., 29(3): 929-937, 2012
[PS05] L Pachter and B Sturmfels, editors. Algebraic Statistics for computational biology. Cambride University Press, November 2005. ISBN 0-521-85700-7.

Christian Haase: Certaines facettes de polytopes marginaux

Résumé

Raymond Hemmecke: bases Graver pour Nmatrices de pliage 4blocs

Dans cet exposé, nous considérons bases plus graves pour certaines matrices structurées qui se présentent comme matrices de problèmes dans la programmation entier. La structure des bases Graver permet la construction d’un algorithme poly-temps de certains problèmes de minimisation convexe séparables. D’un point de vue statistique, on peut utiliser ces bases Graver efficace pour l’échantillonnage, bien que leurs tailles augmentent de façon exponentielle avec N.

Stephan Huckeman: inférence asymptotique sous courbure: cercles, d’arbres et d’espaces forme

Les données sur les espaces collecteur (stratifiés) sont abondants, par exemple (trois dimensions) repère espaces de forme (et des espaces d’arbres phylogénétiques). Zéro intrinsèque et descripteurs de données de dimensions supérieures vivent à nouveau sur les espaces multiples (stratifiés). La moyenne intrinsèque est juste un point dans l’espace original, une première composante principale géodésique est un point dans un espace de géodésiques, etc. inférence sur ces descripteurs est basé sur la détermination de leur distribution asymptotique.
Les états classiques théorème central limite (CLT) qui traduit convenablement et la racine n rééchelonnées moyennes des échantillons indépendants ont tendance à une gaussienne multivariée. Essentiellement sous trois conditions, cela se traduit au collecteur espaces stratifiés: l’unicité, collecteur stabilité (à savoir que la moyenne est supposée sur la strate dimensionnelle la plus élevée) et en omettant du locus de coupe (ce est à dire pas de masse près du lieu géométrique de la moyenne de taille). Nous étudions la «stabilité collecteursur la forme et des espaces d’arbres et «omettant le cut locussur les cercles.

Franz Kiraly: Matrix achèvement

Matrice achèvement est la tâche d’estimation de reconstruire une matrice de rang connu à partir d’un sous-ensemble fixe de ses entrées, éventuellement mesuré avec bruit. Il est d’intérêt appliqué élevée, par exemple appliqué en tant que recommandation ou une prédiction stratégie de rang bas modèles paramétriques.

Dans mon discours, je vais vous présenter le problème de Matrix achèvement et de montrer comment il est générative algébrique et combinatoire. En utilisant des méthodes de base de la géométrie algébrique, je vais tirer une formulation algébrique du problème matrice d’achèvement et de montrer comment le problème est paramétré par la combinatoire. Je vais vous montrer comment cela peut être utilisé pour produire de nouveaux résultats théoriques sur la possibilité d’identifier la matrice achèvement et de nouveaux algorithmes de combinatoires algébriques pour résoudre le problème.

Abraham Martin del Campo: normalité du modèle de la chaîne de Markov homogène Toric

En 2011, Hara et Takemura suggéré un Monte Carlo (MCMC) approche de Markov Chain à un test de qualité d’ajustement en utilisant des bases de Markov sur la chaîne de Markov homogène torique (THMC) modèle et ont donné une description complète des bases de Markov pour le deux modèle état THMC qui ne dépend pas du temps. Inspirés par leur travail, nous avons étudié propriétés algébriques et combinatoires de l’homogène modèle torique de chaîne de Markov. En particulier, on donne une borne sur le nombre de sommets du polytope associé au modèle qui ne dépend pas du temps. Sur la base de nos calculs, nous supposons également la stabilisation de la f-vecteur du polytope, analyser la normalité de la semi-groupe, et donner limites hypothétiques du degré de bases de Markov.

Hugo MaruriAguilar: La méthode algébrique pour modèles expérimentauxPoursuivant sur le travail séminal de Gianni Pistone et Henry Wynn, nous avons récemment exploré différentes façons de décrire les modèles issus de l’algèbre dans des modèles expérimentaux. Une simple description d’un modèle est donné par son degré total pondéré, et une autre description récente d’un modèle est donné en fonction de la complexité de la frontière de modèle. Nous décrivons et présente en détail lorsque ces deux descriptions coïncident.

Ce est un travail conjoint avec Henry Wynn (LSE) et Eduardo Saenz (La Rioja).

Fero Matus: Sur les modèles donnée par les contraintes de l’indépendance conditionnelle

Contraintes de l’indépendance conditionnelle ont été crédités pour fournir des définitions significatives de familles de multivariées distributions de probabilité discrètes ou gaussiennes. Si une telle famille a des propriétés supplémentaires, il peut être parfois décrit plus en détail. Nous allons rappeler quelques cas de résultats dans ce sens et les problèmes en suspens concernant la saveur algébrique. La conférence sera basée principalement sur le manuscrit Sur indépendance conditionnelle et connectezconvexité” (http://www.imstat.org/aihp/accepted.html).

Giovanni Pistone: exemples de modèles toriques pour les chaînes de Markov

Résumé

Fabio Rapallo: objets Max-plus pour étudier la complexité des graphiques

Étant donné un graphe non orienté $ G $, nous définissons un nouvel objet $ H_G $, appelé le mp-tableau de $ G $, en algèbre max-plus. Nous l’utilisons, avec le max-plus permanente, pour décrire la complexité des graphiques. Nous montrons comment calculer la moyenne et la variance de $ H_G de dollars en termes de la matrice d’adjacence de $ G $ et nous donnons un théorème central limite pour $ H_G $. Enfin, nous montrons que le MP-tableau est facilement traitable aussi pour le graphique de complément.

Johannes Rauh: Les marges positives et décomposition primaire
(travail en commun avec T. Kahle et S. Sullivant)

Nous étudions les marches aléatoires sur les tableaux de contingence avec marginaux fixes, correspondant à un (loglinéaire) modèle hiérarchique. Si l’ensemble des mouvements autorisés ne est pas une base de Markov, alors il existe des tables avec les mêmes marginaux qui ne sont pas connectés. Nous étudions les conditions linéaires sur les valeurs des marginaux qui assurent que toutes les tables dans une fibre donnée sont connectés. Nous montrons que de nombreux modèles graphiques ont la propriété des marges positives, qui dit que toutes les fibres avec marginaux strictement positifs sont reliés par les mouvements du second degré qui correspondent aux déclarations d’indépendance conditionnelle.

Tamas Rudas: modèles log-linéaire sans effet global

Modèles log-linéaires sans un effet global surviennent naturellement dans l’apprentissage machine (sélection de fonction), dans de nombreux problèmes de statistiques officielles (par exemple, l’analyse des anomalies congénitales) ou dans les études de marché (panier d’analyse de marché). Certaines des propriétés de ces familles de distributions sont assez surprenant, à la fois de la algébrique et les points de vue stochastiques. Algébriquement, les modèles peuvent être exprimés en utilisant un ensemble de rapports de cotes généralisées, d’où il est exactement celui qui est nonhomogène. Poisson et probabilités multinomiales en vertu de ces modèles ne sont pas équivalentes, statistiques suffisantes ne sont pas conservés dans les estimations du maximum de vraisemblance, et l’existence d’une factorisation d’un modèle ne implique pas la probabilité indépendance des composants. Calculer les estimations du maximum de vraisemblance dans les modèles sans effet global ne est pas simple, car les algorithmes GIF ou SIG standards ne se appliquent pas et IIS, utilisé dans l’apprentissage machine, peuvent produire des résultats erronés. Une nouvelle généralisation de l’algorithme IPF est présentée qui donne les MLE et également des estimations des paramètres, pour ces modèles.

Ce est un travail conjoint avec Anna Klimova (Université de Washington)

Analyse algébrique de la fiabilité du système: Eduardo Saenz De Cabezon Irigaray

Chaque système cohérent a un idéal de monôme associé. L’étude de la structure algébrique de l’idéal nous donne une méthode pour évaluer la fiabilité du système. Dans cet exposé, nous allons présenter les bases de la méthode, ses avantages et ses inconvénients avec quelques résultats obtenus sur plusieurs systèmes pertinents.

Milan Stehlik: Les méthodes algébriques pour extrêmes

Au cours de l’exposé, nous allons discuter de la base algébrique pour modélisation extrême et d’inférence. En particulier, nous allons montrer l’importance des groupes pour la fonction d’inférence. Aussi, nous allons discuter de la groupe de max-automorphismes sur R par rapport au comportement asymptotique des statistiques d’ordre. Des exemples seront donnés.

Milan Studeny: Remarques sur l’approche de programmation linéaire à l’apprentissage des modèles graphiques

L’idée de base d’une approche géométrique de l’apprentissage de modèles graphiques statistiques est de les représenter par certains vecteurs intégrales spéciales (= points treillis). La conférence sera d’apprendre la structure du réseau bayésien à partir de données (complètes) (de base) par la méthode de la note de maximisation. Plus précisément, si le représentant de vecteur est choisi correctement, il permet de re-formuler la tâche de trouver le maximum global de la note sur les structures BN comme un problème de programmation linéaire. Je vais revoir quelques tentatives récentes d’apprendre la structure du réseau bayésien par l’approche de programmation linéaire entier et d’indiquer quelles sont les questions mathématiques (ouverts) pertinentes (mise en œuvre) ou des problèmes à résoudre.

Volkmar Welker: commandes partielles du modèle de classement statistique

Dans cet exposé, nous discutons de deux directions pour étendre les modèles de classement statistiques à une prédiction d’un ensemble partiellement ordonné. Tout d’abord, nous étudions les aspects algébriques de modèles classement sous contraintes (de travail conjoint avec Sturmfels). Deuxièmement, nous étudions l’expressivité des modèles de rang en vertu d’un seuil (conjointe avec Cheng, Huellermeier, Waegeman).

Piotr Zwiernik: structures du Groupe pour les modèles de gaussiennes graphiques de la chaîne sans drapeaux

Dans notre projet précédent, nous avons analysé le groupe des transformations linéaires qui stabilise un modèle gaussien donné un graphe non orienté. Ce groupe a ensuite été utilisé dans l’analyse de
robustesse des estimateurs équivariantes arbitraires. Dans le présent projet, nous généralisons ce travail à des graphiques de la chaîne arbitraires sans drapeaux, qui comprend à la fois les graphes non orientés et graphiques orientés acycliques. Le principal obstacle est que généralement plus d’une chaîne graphique définit le même modèle. Nous montrons que la structure du groupe est relativement simple, mais il nécessite de passer à la chaîne graphique maximale unique, sans drapeaux, qui a été discuté par exemple Milan Studený et Alberto Roverato. Nous montrons ensuite que cela peut être rendu plus efficace pour les graphes acycliques dirigés en utilisant leurs imsets structurelles.