vendredi 10 janvier 2014

Indice Wikipedia

N'en déplaise à certains, Wikipedia reste la plus grosse source d'infos du web.
Vous avez peut-être même comme moi remarqué à quel point il est difficile de trouver des informations en dehors de Wikipedia.

On pense souvent que du fait de son aspect communautaire, les informations qu'on y trouve ne sont pas fiables. Mais en fait il s'agirait que ce soit même le contraire. Apparemment de solides équipes de modération s'occupent de supprimer les contenus inappropriés très rapidement (je ne fais pas de pub, je constate)

Il faut aussi compter sur ce que j'appellerais un "équilibre de communauté" :
Le fait que ce soit un site communautaire signifie que n'importe qui peut venir y écrire une grosse connerie. Mais cela signifie aussi que n'importe qui peut venir corriger la grosse connerie.
L'équilibre de communauté réside simplement dans le fait que les personnes qui vont consulter un article Wikipedia sont naturellement des personnes intéressées par le sujet, donc avec une forte probabilité d'en savoir ne serait-ce qu'un peu dessus.
Ces gens-là pourront alors corriger les éventuelles erreurs et enrichir le sujet. Et s'ils enrichissent avec des informations inexactes, un autre viendra le corriger et l'enrichir à nouveau.
En gros Wikipedia c'est comme la communauté scientifique. En théorie chaque nouvelle contribution ne fait qu'améliorer le domaine, justement par le fait qu'elle est accessible à tous.
Et si vous pensez que c'est faux, demandez-vous comment on en est arrivé à construire des ordinateurs et des avions. Et non ce n'est pas monsieur Avion qui l'a inventé de A à Z tout seul dans son coin.
Et je ne parle pas des vertus de Wikipedia comme traducteur en contexte (essayez et vous verrez)

Mais ce n'est même pas là mon propos principal.
Puisque non content de vous vanter les vertus de l'équilibre communautaire, je vais aussi mettre en lumière un effet secondaire intéressant.
Comme toujours le constat de base est simple. Les articles les plus consultés sont ceux qui intéressent le plus de monde et ceux qui ont le plus de chances d'être enrichis.
j'en déduis donc qu'on peut mesurer la popularité ou la visibilité d'une personne ou d'une notion en fonction de son article Wikipedia.

J'appelle cela l'Indice Wikipedia (ou IW)

Il y a plusieurs critères pour le calculer :
- La longueur de l'article
- Le nombre de langues dans lequel il a été traduit
- Les médias associés (documentation)
- Les sources citées

Prenons un exemple arbitraire : l'article Wikipedia sur Angelina jolie
http://fr.wikipedia.org/wiki/Angelina_Jolie

On est en présence d'un article très détaillé, agrémenté de nombreuses photos et tableaux et disponible en pas moins de 99 langues. Il est de plus étayé par de très nombreuses sources citées qui ne font qu'agrandir la crédibilité de l'article et donc l'IW

Ceci prouve sans équivoque la popularité de la star à l'échelle internationale.

Prenons maintenant l'article de Raymond Barre
http://fr.wikipedia.org/wiki/Raymond_Barre

L'article est beaucoup plus détaillé et documenté que je ne l'aurais cru et est de plus étayé par un nombre conséquent de ressources. Il est aussi disponible en tout de même 28 langues.
Malgré un indice IW contre toute attente relativement élevé, la supériorité écrasante de l'IW d'Angelina Jolie est sans appel sur sa popularité nettement supérieure, ce qui je pense n'était de toute façon pas à prouver.

Une autre expérience intéressante est de calculer un IW par pays. On voit ainsi que l'article de Raymond Barre est beaucoup plus léger en anglais et quasi anecdotique en japonais. Tandis que l'article anglais d'Angelina Jolie est évidemment immense et son article japonais conséquent, ce qui montre son rayonnement international.

Je vous laisse comparer, juste par curiosité scientifique avec l'IW de Mickaël Vendetta
http://fr.wikipedia.org/wiki/Micka%C3%ABl_Vendetta