mogéo : Les mots-clés des géographes en réseaux



Réglages graphiques
Download plot
Réglages graphiques
Download plot
Réglages graphiques
Download plot

          
Réglages d'ensemble

Figure 1

Figure 2

Figure 3

Réglages graphiques

User guide

Description

Outil interactif d'analyse des mots-clefs du Répertoire des géographes.

License

GNU GPLv3

Citation

Les données sont issues de …

Bla bla bla


Méthodologie

Attributs des noeuds et des liens

Les noeuds du réseau sont dotés de deux attributs: le nombre de géographes qui citent le mot et le degré du mot, c'est-à-dire l'ensemble des liens reliant ce mot aux autres mots (pas de distinction entre degré entrant/sortant puisque le graphe est non dirigé).

Les liens du réseau sont dotés de deux attributs. Le premier est le poids observé: pour deux mots A et B, le poids observé est le nombre de géographes qui co-citent ces deux mots. Le second est un attribut de résidu relatif qui est calculé comme le rapport entre le poids observé du lien et le poids espéré ou théorique. Ce poids espéré est conçu comme la probabilité d'occurrence de deux tirages successifs d'un noeud d'origine puis d'un noeud de destination. La probabilité de tirer un noeud d'origine puis un noeud de destination est l'intersection de deux probabilités dépendantes. La probabilité de tirer un noeud i d'origine est égale à w i w w i est le poids du noeud i (degré pondéré) et w la somme des poids (sur la moitié de la matrice de poids). Puis la probabilité de tirer un noeud j de destination est égale à w j w w i car les deux évènements ne sont pas indépendants.

La probabilité d'existence d'un lien de i vers j s'écrit donc :

P i > j = w i w × w j w w i

La probabilité d'existence d'un lien de j vers i, qui n'est pas forcément égale à celle de i vers j s'écrit :

P j > i = w j w × w i w w j

La probabilité d'existence d'un lien entre les deux noeuds, tous sens confondus (i.e. non dirigé) est l'union des deux :

P i < > j = P i > j + P j > i

Finalement, le poids espéré est :

w e = w ( P i < > j 2 )

Algorithme de détection de communautés

La plupart des algorithmes utilisés en théorie des graphes s'appuient sur une mesure de modularité. Pour un graphe dans lequel on distingue plusieurs communautés ou clusters, la modularité est forte quand les liens intracommunauté sont forts et les liens intercommunauté sont faibles. Cette mesure (Q) est définie comme la différence entre la proportion observée de liens intracommunauté et la proportion que l'on observerait dans un graphe aléatoire conservant la distribution de degrés du graphe originel.

Q = 1 2 m i , j [ A i j w i w j 2 m ] δ ( c i , c j )

m est la somme de la matrice de poids, où A i j est le poids du lien entre i et j et où la fonction δ est une fonction qui renvoie 1 si i et j font partie de la même communauté et 0 sinon.

La modularité peut être utilisée comme mesure de la qualité d'une partition réalisée a priori mais aussi comme une fonction à maximiser par un algorithme pour produire une partition cohérente. C'est sur ce principe que fonctionne l'algorithme utilisé ici, développé par V. Blondel et al. (2008), dit “méthode de Louvain”. Il produit une partition du graphe qui correspond à un optimum de modularité.


Onglet bla bla

Bla bla