Le GDR MASCOT-NUM organise un atelier autour des 2 thèmes suivants :
Exposés 2002 : Mémoire de DEA
Séminaire GEODE
Exposés 2003 : 1° Journée MASH
Exposés 2004 : Séminaire GRIMM/SMASH (deux fois)
Exposés 2005 : SAMOS, Université Paris I ;
Séminaire de statistique du LSP, Université Toulouse III ;
Séminaire de l’"Instituto de Territorio y Patrimonio Historico", Université de Grenade, Espagne ;
Soutenance de thèse ;
Séminaire du groupe de travail MAFIA, Université Toulouse III ;
Séminaire du LOG, ENAC, Toulouse.
Exposés 2006 : Séminaire du GREMAQ, Université Toulouse I.
Exposés 2007 : Journée FREMIT, Université Toulouse III ;
Séminaire Biopuces, Université Toulouse III.
Séminaire CANSO, XLim, Univerité de Limoges.
Exposés 2008 : Séminaire Groupe de travail STAPH->, Institut de Mathématiques de Toulouse ;
Rencontres BoSanTouVal, Castro Urdiales, Espagne ;
Séminaire de l’Unité de Biométrie et Intelligence Artificielle, INRA, Castanet Tolosan.
Short lectures on functional data analysis and statistical learning (4 presentations) in Havana, Cuba.
Séminaire de Statistique du GREMAQ, Toulouse School of Economics.
Journées FREMIT
Séminaire de statistiques et applications, Institut de Mathématiques de Luminy
Exposés 2009 : Dagstuhl seminar on "Similarity-based learning on structures ", Shloss Dagstuhl, Germany
Groupe de travail BioPuces, INRA d’Auzeville
Department seminar, Toulouse School of Economics
Groupe de travail BioPuces, INRA d’Auzeville
Journée HélioSPIR 2009, École d’Ingénieurs de Purpan
Groupe de travail BioPuces, INRA d’Auzeville
Séminaire de probabilités et statistique de Montpellier, Université Montpellier 2
Groupe de travail BioPuces, INRA d’Auzeville
Exposés 2010 : Workshop on "Challenging problems in Statistical Learning", Équipe SAMM, Université Paris 1
Groupe de travail BioPuces, INRA d’Auzeville (x2)
Seminar at Climate Change Unit, European Commission, Ispra, Italy
Séminaire BioMaths, INRA d’Auzeville
Séminaire du LJK, Grenoble
Groupe de travail BioPuces, INRA d’Auzeville (2x)
Journées FREMIT 2010, IRIT, Université Toulouse 3 (Paul Sabatier).
Exposés 2011 : Groupe de travail BioPuces, INRA d’Auzeville
12ème Journées MSTGA, INRA d’Auzeville
Groupe de travail BioPuces, INRA d’Auzeville
Exposés 2012 : Séminaire de Probabilités et Statistique de l’Institut de Mathématiques de Bordeaux
Les cafés de l’IMT, Institut de Mathématiques de Toulouse
Groupe de travail Graphes, SAMM, Université Paris 1
Dagstuhl seminar « Information visualization, visual data mining and machine learning », Schloss Dagstuhl, Germany
Séminaire BIA, INRA d’Auzeville
Séminaire LIPN, Université Paris 13
Exposés 2013 : Groupe de travail Graphes, SAMM, Université Paris 1
Séminaire Biostat, Plateforme biostatistique de Toulouse
March, 19th, 2013 : Consensual gene co-expression network inference with multiple samples, Séminaire Biostat, Plateforme biostatistique de Toulouse
January, 25th, 2013 : Multiple kernel Self-Organizing Maps, Groupe de travail Graphes, SAMM, Université Paris 1
November, 15th, 2012 : Clustered graph, visualization and hierarchical visualization, Séminaire LIPN, Université Paris 13
Abstract : Clustering is a useful approach to provide a simplified and meaningful representation of large graphs. By extracting dense communities of nodes, the "big picture" of the network organization is enlighten. Moreover, hierarchical clustering may help the user to focus on some parts of the graph which is of interest for him and that can be displayed with finer and finer details. This talk will present some strategies to analyze and display graphs based on previous node clustering. Self-organizing map like-strategies, using kernel or an modularity based optimization will be presented, as well as strategies based on a hierarchical nodes clustering. Finally, strategies trying to take the benefit of the nodes’ labels will be discussed.
April, 4th, 2012 : A comparison of learning methods to predict N
O fluxes and N leaching, Séminaire BIA, INRA d’Auzeville
Abstract : The environmental costs of intensive farming activities are often underestimated or not traded by the market, even though they play an important role in addressing future society’s needs. The estimation of nitrogen (N) dynamics is thus an important issue which demands detailed simulation based methods and their integrated use to correctly represent complex and nonlinear interactions into cropping systems. To calculate the N2O ux and N leaching from European arable lands, a modeling framework has been developed by linking the CAPRI agro-economic dataset with the DNDC-EUROPE bio-geo-chemical model. But, despite the great power of modern calculators, their use at continental scale is often too computationally costly. By comparing several statistical methods this paper aims to design a metamodel able to approximate the expensive code of the detailed modeling approach, devising the best compromise between estimation performance and simulation speed.
February 21st, 2012 : Clustered graph, visualization, hierarchical
visualization, Dagstuhl seminar « Information visualization, visual data mining and machine learning », Schloss Dagstuhl, Germany (2012/02/19-24).
Abstract : Clustering is a useful approach to provide a simplified and meaningful representation of large graphs. By extracting dense communiites of nodes, the "big picture" of the network organizatin is enlighten. Moreover, hierarchical clustering may help the user to focus on some parts of the graph which is of interest for him and which can be displayed with finer and finer details. This talk will try to present some open issues with graph visualization based on a hierarchical nodes clustering. These issues include displaying the clusters in a coherent way between the different layers of the hierarchy or integrating information about the clustering evaluation in the visualization.
February 17th, 2012 : Reading revue of « Inferring Multiple Graphical Structures », Groupe de travail Graphes, SAMM, Université Paris 1. password protected
January 19th, 2012 : Des réseaux sociaux aux réseaux historiques, Les cafés de l’IMT, Institut de Mathématiques de Toulouse (diaporama à accompagner de la vidéo à placer dans un sous-répertoire "video").
Résumé : Des actes notariés du Moyen-Age aux réseaux sociaux actuels, l’oratrice nous montrera l’utilité des outils mathématiques que sont les graphes dans l’étude de ce type de données. Au-delà de l’aspect mathématique, c’est donc à un voyage dans le temps que l’oratrice nous convie.
January 12th, 2012 : Combiner classification et visualisation pour l’exploration de grands réseaux, Séminaire de Probabilités et Statistique de l’Institut de Mathématiques de Bordeaux (diaporama à accompagner de la vidéo à placer dans un sous-répertoire "video").
Résumé : Les graphes (ou réseaux) sont devenus des outils courants de modélisation des données relationnelles dans de nombreuses applications. Or, lorsque le nombre de sommets dépasse quelques centaines, la visualisation du graphe dans son ensemble, qui est un outil important de compréhension du réseau, est un problème complexe : les approches traditionnelles, basées sur des algorithmes de forces, s’avèrent coûteuses en temps de calcul et ne mettent pas bien en valeur la structure du réseau en parties denses (souvent appelées communautés). Dans cet exposé nous présentons plusieurs méthodes de visualisation basée sur des classifications des sommets d’un graphe : certaines combinent classification et visualisation, d’autres procèdent en deux temps mais permettent d’obtenir une visualisation hiérarchique du réseau qui autorise une exploration avec un niveau de détail progressif. Nous illustrerons ces approches sur plusieurs jeux de données publics ou bien réels.
December 16th, 2011 : Large network analysis : visualization and clustering, Groupe de travail BioPuces, INRA d’Auzeville. password protected
November 8th, 2011 : Combiner classification et visualisation pour l’exploration de grands réseaux, 12èmes Journées MSTGA, INRA d’Auzeville.
January 15th, 2011 : Définition et analyse de graphes
d’interactions de gènes pour la qualité de
la viande de porc ; relations avec le PH, Groupe de travail BioPuces, INRA d’Auzeville.
September 21st, 2010 : Graphes, multigraphes et recherche d’information, Journées FREMIT 2010, IRIT, Université Toulouse 3 (Paul Sabatier).
June 25th, 2010 : Définition et analyse de graphes d’interactions de gènes pour la qualité de la viande de porc, Groupe de travail BioPuces, INRA d’Auzeville.
May 21st, 2010 : Metabolomic data : combining wavelet
representation with learning approaches, Groupe de travail BioPuces, INRA d’Auzeville.
April, 10th, 2010 : Discrimination et régression pour des dérivées : un résultat de consistance pour des données fonctionnelles discrétisées, Séminaire du LJK, Grenoble.
Résumé : L’utilisation de la dérivée est une pratique courante, notamment en spectrométrie, pour améliorer les performances dans des problèmes de discrimination ou de régression dont la variable explicative est fonctionnelle. Nous nous proposons de présenter un résultat qui prouve que, dans certaines conditions, l’utilisation des dérivées permet également d’approcher asymptotiquement l’erreur optimale, sous des hypothèses assez générales.
March 30th, 2010 : Comparaison de méthodes de classification de sommets dans un réseau biologique, Séminaire BioMaths, INRA d’Auzeville.
March 18th, 2010 : A comparison of three learning methods to
predict N2O fluxes and N leaching, Seminar at Climate Change Unit, European Commission, Ispra, Italy.
Web page of the seminar
March 12th, 2010 : Données métabolomiques : Apprentissage et ondelettes, Groupe de travail BioPuces, INRA d’Auzeville.
February 12th, 2010 : Compte-rendu bibliographique sur les réseaux biologiques (III), Groupe de travail BioPuces, INRA d’Auzeville.
Sujet abordé : Classification de sommets
January, 28th, 2010 : Visualization of graphs by organized clustering : application to social and biological networks, Workshop on "Challenging problems in Statistical Learning", Équipe SAMM, Université Paris 1.
Abstract and Slides.
Full presentation (with sound)
November 6th, 2009 : Compte-rendu bibliographique sur les réseaux biologiques, Groupe de travail BioPuces, INRA d’Auzeville.
Sujet abordé : Structure des réseaux biologiques et recherche de motifs
October 19th, 2009 : Discrimination et régression non paramétriques pour des dérivées : un résultat de consistance pour des données fonctionnelles discrétisées, Séminaire de probabilités et statistique de Montpellier, Université Montpellier 2.
Résumé : Lors de l’analyse de données fonctionnelles, il est bien connu que les problèmes de discrimination et de régression sont parfois mieux résolus si on utilise les dérivées plutôt que les fonctions observées. Nous nous proposons de présenter un résultat qui prouve que, dans certaines conditions, l’utilisation des dérivées permet également d’approcher asymptotiquement l’erreur optimale, pour des méthodes de discrimination ou de régression très générales.
October 9th, 2009 : Compte-rendu bibliographique sur les réseaux biologiques, Groupe de travail BioPuces, INRA d’Auzeville.
Sujet abordé : Inférence de graphes
September 30th, 2009 : Application de l’analyse des données fonctionnelles à l’identification de blé dur fusarié, moucheté et mitadiné, Journée HélioSPIR 2009, École d’Ingénieurs de Purpan.
June 5th, 2009 : Representation of metabolomic data with wavelets, Groupe de travail BioPuces, INRA d’Auzeville.
April 29th, 2009 : Classification and regression based on derivatives : a consistency result for sampled functions, Department Seminar, Toulouse School of Economics.
Abstract : In some applications, curve classifiers achieve better performances if they work on the derivatives of order m of their inputs. Although the use of derivatives is a common practice, no theoretical result proves that this approach is relevant. More precisely, this paper proves that the use of the derivatives instead of the function itself does not lead to a dramatic loss of information and that it has no consequence for the convergence of the method to the Bayes function. To that aim, we rely on a smoothing spline based approach that gives a strong theoretical background to the common practice of using derivatives in the realistic case where the observed functions are only known by their values on a discrete sampling grid. The consistency of a very general derivative based classifier or regression scheme is proved.
24 avril 2009 : Fouille de données sur des graphes : Introduction, Groupe de travail BioPuces, INRA d’Auzeville.
February 19th, 2009 : Topographic graph clustering with kernel and dissimilarity methods, Dagstuhl seminar on "Similarity-based learning on structures ", Shloss Dagstuhl, Germany.
Abstract : Finding meaningful communities in social network, or, to use a more classical vocabulary, clustering a graph, is a very important problem in social network analysis. For very large graphs, a fast clustering algorithm provides a coarse graining of the graph and can be considered a preprocessing phase before time consuming algorithms. For small to medium size graphs, communities can be analyzed manually (or at least semi-automatically) by specialists in order to figure out the global organization of the underlying social network.
This talk focuses on the second case, when the goal is to display to an end user a visual representation of a social network. The main idea of our work is to find communities that can be displayed easily on a plane. Our method is based on the self-organizing map paradigm.
We first recall briefly some extension of the self-organizing map to kernel and dissimilarity data. Then we give examples of kernels and dissimilarities that can be constructed to compare the nodes of a graph using its link structure. We show what type of results can be obtained in this framework on real world graphs and outline advantages and drawbacks of the method.
18 décembre 2008 : Fouille de données pour des grands graphes, Séminaire de statistiques et applications, Institut de Mathématiques de Luminy.
Résumé : La recherche de groupes de sommets d’un grand graphe fortement liés et l’étude des relations existant entre ces groupes est une thématique d’intérêt dans plusieurs domaines applicatifs : réseaux sociaux, réseaux biologiques, recherche d’information, etc. Dans cette optique, nous présenterons des méthodes d’organisation de sommets sur des cartes de faibles dimensions. Ces méthodes sont soit des adaptations d’algorithmes de cartes auto-organisatrices à des données non vectorielles par le biais de noyaux, soit des algorithmes stochastiques ou déterministes de recuit conduisant à l’optimisation d’un critère de qualité de l’organisation du graphe. Nous illustrerons notre propos sur des réseaux sociaux réels.
8 décembre 2008 : Fouille de données pour de grands graphes.
Recherche de communautés et organisation, Journées FREMIT.
6 octobre 2008 : Fouilles de données pour des grands graphes, séminaire de statistique du GREMAQ, Toulouse School of Economics.
Résumé : La notion de graphes intervient de manière naturelle dans plusieurs domaines applicatifs : réseaux sociaux, réseaux biologiques, recherche d’information, réseaux d’entreprises, ... Dans ces contextes, la recherche de groupes de sommets qui soient fortement liés et l’étude des relations existant entre ces groupes est souvent une thématique d’intérêt majeur. Je présenterai ici un travail pour l’étude d’un réseau social réel issu d’archives médiévales pour lequel nous avons développé une méthode de type "carte de Kohonen" adapté à des données non vectorielles par l’utilisation d’un noyau construit à partir du Laplacien du graphe.
15/18 september, 2008 : Short courses on functional data analysis and statistical learning in Havana, Cuba.
21 mars 2008, Séminaire de l’Unité de Biométrie et Intelligence Artificielle : Fouille de données issues d’un grand graphe par carte de Kohonen à noyau à accompagner avec les fichiers images 1clusters.jpg, 2dates.jpg, 3clusters-dates.jpg, 4lieux.jpg et 5clusters-lieux.jpg.
Résumé : La recherche de groupes de sommets d’un grand graphe fortement liés et l’étude des relations existant entre ces groupes est une thématique d’intérêt dans plusieurs domaines applicatifs : réseaux sociaux, réseaux biologiques, recherche d’information, etc. Dans ce but, nous avons proposé une méthode de type "carte de Kohonen" adapté à des données non vectorielles, de type graphe, par l’utilisation d’un noyau construit à partir du Laplacien du graphe. Cette méthode a été utilisée pour l’étude d’un réseau social réel issu d’archives médiévales.
1 février 2008, Rencontres BoSanTouVal : Graph mining with kernel self-organizing map.
14 janvier 2008, Groupe de travail STAPH : Carte de Kohonen par noyau et application a la classification de sommets de graphes : Résumé et Diaporama à accompagner avec les fichiers images 1clusters.jpg, 2dates.jpg, 3clusters-dates.jpg, 4lieux.jpg et 5clusters-lieux.jpg.
23 novembre 2007, Séminaire CANSO, XLim, Université de Limoges : Analyse de données fonctionnelles par Machines à Vecteurs de Support (SVM) : diaporama
Résumé : L’analyse des données fonctionnelles a pour objet l’étude de données qui se présentent sous la forme de courbes discrétisées. Nous nous intéressons ici plus particulièrement à la classification de courbes par Machines à Vecteurs de Support (SVM) et présentons diverses stratégies applicables dans ce cadre. Nous démontrons pour celles-ci des résultats de convergence et les illustrons au travers d’exemples issus de situations réelles. Enfin, nous élargirons le champ de cet exposé en montrant les liens qui peuvent exister entre cette thématique et celles du traitement du signal et de l’automatique ainsi qu’en esquissant les ouvertures prévues dans ces domaines.
12 novembre 2007, Séminaire Biopuces, Université Toulouse III : Introduction à l’étude des grands graphes : diaporama à accompagner avec les fichiers images 1clusters.jpg, 2dates.jpg, 3clusters-dates.jpg, 4lieux.jpg et 5clusters-lieux.jpg
Rq : Le film présent en page 20 n’est pas inclu dans le document PDF mais vous pouvez le visualiser ici.
16 octobre 2007, Journée FREMIT, Université Toulouse III : Graphes, noyaux et cartes de Kohonen : diaporama
Résumé : De nombreux problèmes concrets peuvent être modélisés de manière naturelle par l’utilisation de graphes : c’est le cas, notamment, de la structure du Web, de l’étude de divers réseaux sociaux, de l’extraction d’information, de la confrontation des connaissances. L’objectif du projet est de proposer des méthodes permettant à la fois la classification pertinente de sommets de graphes en groupes ``homogènes’’ et la visualisation globale des interactions existants entre ces groupes. Ceci peut être réalisé au travers de l’algorithme de cartes de Kohonen par l’utilisation d’un noyau résumant les informations de proximités entre sommets. Cette méthodologie doit être généralisée aux graphes orientés ainsi qu’à la comparaison de graphes.
7 avril 2006, Séminaire du GREMAQ, Université Toulouse I : Discrimination de courbes par SVM : version diaporama ou version imprimable
Résumé : Dans de nombreuses applications, les variables explicatives sont des fonctions discrétisées et beaucoup de méthodes d’analyse statistique des données ont été transposées au cadre fonctionnel. Nous nous proposons ici de présenter l’utilisation des SVM, connus pour leurs bonnes capacités de généralisation, pour la discrimination de courbes. Nous introduisons divers noyaux permettant d’aboutir à des procédures consistantes (basés sur des bases hilbertiennes ou s’appuyant sur la structure de RKHS des espaces de Sobolev) et illustrons notre propos par plusieurs expériences sur données réelles ou simulées.
24 novembre 2005, Séminaire du laboratoire d’optimisation globale, ENAC, Toulouse : Discrimination de courbes par SVM : version diaporama ou version imprimable
Résumé : Dans de nombreuses applications, les variables explicatives sont des fonctions discrétisées et non des données multidimensionnelles classiques. Beaucoup de méthodes d’analyse statistique des données ont été transposées au cadre fonctionnel sous le nom générique de FDA (Fonctional Data Analysis). Nous nous proposons ici de présenter l’utilisation des SVM, connus pour leurs bonnes capacités de généralisation, pour la discrimination de courbes. Nous montrons comment des noyaux simples peuvent prendre en compte la nature fonctionnelle des données et produire des classifieurs consistants. Nous illustrons notre propos par diverses expériences sur données réelles ou simulées.
16 novembre 2005, Séminaire du groupe de travail MAFIA, Laboratoire de statistique et probabilités, Université Paul Sabatier, Toulouse : Discrimination de courbes par SVM : version diaporama ou version imprimable
21 octobre 2005 : Soutenance de thèse : Éléments d’apprentissage en statistique fonctionnelle - Classification et régression fonctionnelles par réseaux de neurones et Support Vector Machine.
Résumé : Le développement des capacités de calcul des ordinateurs a permis l’émergence de nouvelles méthodes de traitement des données dont les réseaux de neurones et les Support Vector Machine font partie. Ainsi, un nombre croissant de travaux scientifiques s’intéressent à ces deux outils. Dans cette thèse, nous présentons d’abord les résultats d’un travail inter-disciplinaire dans lequel nous avons utilisé les capacités d’adaptation des perceptrons multi-couches pour la prévision de cartes géographiques d’occupation du sol. Ensuite, nous nous focalisons sur la généralisation de l’utilisation des réseaux de neurones et des SVM au traitement de données fonctionnelles. Le but est de disposer d’outils non linéaires pour le traitement de ce type de données. Une partie de nos travaux est basée sur une approche semi-paramétrique utilisant une généralisation de la méthode de régression inverse au cadre fonctionnel. Enfin, nous explorons une approche différente par la construction de noyaux pour SVM qui prennent en compte la nature spécifique des données. Dans tous ces travaux, la théorie de l’apprentissage statistique joue un rôle important et nous nous attachons, autant que possible, à expliciter des résultats de convergence des méthodes décrites.
30 mai 2005 : Séminaire de l’Instituto de Territorio y Patrimonio Historico, Université de Grenade, Espagne : Modélisation de la dynamique d’occupation du sol par réseaux de neurones dans le cadre d’un séjour de recherche (une semaine) à l’université de Grenade.
16 mai 2005 : Séminaire du Laboratoire de Statistique et Probabilités, Université Toulouse III : Traitement de données fonctionnelles par Support Vector Machine
4 février 2005 : Séminaire du SAMOS, Université Paris I : Réseaux de neurones et SVM à entrées fonctionnelles : une approche par régression inverse
Résumé : Dans le domaine de l’analyse des données fonctionnelles, les méthodes statistiques classiques sont confrontées à des problèmes nouveaux dus au fait que les variables aléatoires étudiées vivent dans des espaces de dimension infinie. Beaucoup de méthodes statistiques classiques ont donc été repensées pour s’adapter aux données fonctionnelles. Nous nous intéressons ici à l’utilisation des perceptrons multi-couches pour traiter des problèmes de régression et de classification à entrées fonctionnelles : la méthode proposée est basée sur une approche par régression inverse permettant d’obtenir un pré-traitement pertinent des données ; des résultats théoriques et des applications sur données réelles montrent l’efficacité de cette approche. Nous expliquons également comment cette méthodologie peut être adaptée à d’autres types de traitements statistiques et, notamment, aux Support Vector Machine ; là aussi, des simulations illustrent notre propos.
22 octobre 2004 : Séminaire GRIMM/SMASH, Université Toulouse II : Théorie de l’apprentissage et SVM : présentation rapide et premières idées dans le cadre fonctionnel
8 octobre 2004 : Séminaire GRIMM/SMASH, Université Toulouse II : Réseaux de neurones à entrées fonctionnelles
Résumé : Nous proposons une méthode pour l’extension de l’utilisation des réseaux de neurones multi-couches (perceptrons) à des entrées fonctionnelles. L’originalité de la méthode est basée sur un pré-traitement des données permettant d’obtenir une base de projection pertinante. Nous démontrons alors la convergence des paramètres empiriques du réseau vers les paramètres optimaux. Enfin, nous illustrons le modèle au travers d’exemples à partir de données réelles et simulées.
8 avril 2003 : Premières Rencontres MASH, Université Toulouse II : Dynamique de l’occupation des sols de la région des Garrotxes
Résumé : La projet vise à analyser et à modéliser la dynamique spatio-temporelle de l’occupation du sol du milieu montagnard méditerranéen en prenant appui sur une zone d’étude située dans les Pyrénées Orientales : le bassin versant des Garrotxes. L’objectif est de développer des scénarii d’évolution raisonnés pour apporter une aide à la décision et à la gestion de ces milieux ; plusieurs approches ont été développés dans un but de confrontation et de synthèse : entre autres, une méthode SIG (Système d’Information Géographique) et une méthode par réseaux de neurones.
Octobre 2002 : Séminaire GEODE : Dynamique de l’occupation des sols de la région des Garrotxes
Juin 2002 : Soutenance de DEA : Réseaux de neurones. Réseaux de neurones et statistique, utilisation pour des variables aléatoires fonctionnelles