Ir al contenido

Documat


Using SOMbrero for clustering and visualizing graphs

  • Olteanu, Madalina [1] ; Villa-Vialaneix, Nathalie
    1. [1] Université Paris
  • Localización: Journal de la Société Française de Statistique & revue de statistique appliquée, ISSN 0037-914X, Vol. 156, Nº. 3, 2015 (Ejemplar dedicado a: Special Issue on Networks and Statistics), págs. 95-119
  • Idioma: inglés
  • Títulos paralelos:
    • Utiliser SOMbrero pour la classification et la visualisation de graphes
  • Enlaces
  • Resumen
    • English

      Graphs have attracted a burst of attention in the last years, with applications to social science, biology, computer science... In the present paper, we illustrate how self-organizing maps (SOM) can be used to enlighten the structure of the graph, performing clustering of the graph together with visualization of a simplified graph. In particular, we present the R package SOMbrero which implements a stochastic version of the so-called relational algorithm: the method is able to process any dissimilarity data and several dissimilarities adapted to graphs are described and compared. The use of the package is illustrated on two real-world datasets: one, included in the package itself, is small enough to allow for a full investigation of the influence of the choice of a dissimilarity to measure the proximity between the vertices on the results. The other example comes from an application in biology and is based on a large bipartite graph of chemical reactions with several thousands vertices.

    • français

      L’analyse de graphes a connu un intérêt croissant dans les dernières années, avec des applications en sciences sociales, biologie, informatique, ... Dans cet article, nous illustrons comment les cartes auto-organisatrices (SOM) peuvent être utilisées pour mettre en lumière la structure d’un graphe en combinant la classification de ses sommets avec une visualisation simplifiée de celui-ci. En particulier, nous présentons le package R SOMbrero dans lequel est implémentée une version stochastique de l’approche dite « relationnelle » de l’algorithme de cartes auto-organisatrices.

      Cette méthode permet d’utiliser les cartes auto-organisatrices avec des données décrites par des mesures de dissimilarité et nous discutons et comparons ici plusieurs types de dissimilarités adaptées aux graphes. L’utilisation du package est illustrée sur deux jeux de données réelles : le premier, inclus dans le package lui-même, est suffisamment petit pour permettre l’analyse complète de l’influence du choix de la mesure de dissimilarité sur les résultats. Le second exemple provient d’une application en biologie et est basé sur un graphe biparti de grande taille, issu de réactions chimiques et qui contient plusieurs milliers de nœuds.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno