Zeldman vs the tag clouds

Jeffrey Zeldman soulève quelques objections intéressantes par rapport aux tag clouds, ces listes de mots clés créés par les utilisateurs et dont la taille varie selon la fréquence de leur utilisation (un exemple ici sur MeFi). Il explique que cette forme de présentation enlève la possibilité de guider les utilisateurs dans leur recherche et favorise les mots clés populaires. On se retrouve donc face à un phénomène de nivellement.

The idea behind tag clouds is that users know best. Their actions determine how other users navigate. Their choices leave a trail. Typically, though not always, the “important” topics get big while those considered less important (which in this case only means less popular) get small. Once they get small enough, they disappear.

La popularité prends le pas sur la l’aide à la recherche et la relation de hiérarchie des taxonomies traditionnelles du type Rameau ou LCSH disparaît.

As tag clouds come to replace expert taxonomies in common practice, carefully constructed hierarchies vanish. In their place is a flattened world where every idea, at any level, is a topic as worthy as any other (…) Instead of a hierarchy based on user-centered classification systems, the tag cloud “hierarchy” is based on raw usage (…) The intellectual problem is that tag clouds create a data world where subtopics are detached from their parents; where the very notion of parent/child relations no longer exists.

Je suis assez d’accord avec lui, cette méthode de présentation ne doit pas être utilisée à l’exclusion des autres. Il faudrait aller vers une fusion entre folksonomies et indexation traditionnelle comme je le disais ici :

Je suis surtout intéressé par la forme que vont prendre les mots clés utilisés. La forme souple et bordelique des tags créés par les utilisateurs est à l’opposé du système rigide des vedettes matières utilisés dans le monde des bibliothèques mais on va peut être se diriger vers un juste milieux. Après un certain temps, une sélection naturelle va s’opérer au niveau des tags et qui sait peut être vont-ils fusionner selon une méthode combinatoire ressemblant à Rameau/LCSH.

Il faudrait rajouter une étape à l’utilisation des tags clouds. Après le choix d’un mot clé il faudrait avoir accès à une liste reprenant les termes synonymes, un peu comme si sous Rameau le choix de mot clé constituerait le terme générique (TG) et les synonymes moins utilisés constitueraient les termes exclus (EP) et les termes associés (TA). De plus, cette liste devrait reprendre tous les mots clés associés par les utilisateurs au terme choisi. Ce type de présentation peut très bien fonctionner en parallèle à un système d’indexation classique et permettrait cette qualité exploratoire que Zeldman craint de voir disparaître.

Tag clouds harness all that mindless accidental randomness and make it the driving engine for navigating deep, ever-expanding content troves. Older ways, based on library science, undoubtedly suffer from the disadvantage of not being new. But they help people find what they need. And that is what navigation should do.

De toute manière, le débat est loin d’être clos et au niveau des weblogs personnels de nouvelles techniques de classification et de catégorisations sont régulièrement expérimentées (sur Kottke ou Binary Bonsai par exemple).
Un dernier détail amusant : je crois savoir d’où viennent (en partie) ces craintes de Zeldman face à l’indexation par les utilisateurs en opposition à l’indexation bibliothéconomique traditionnelle. Il faut savoir que la femme de ce prophète des standards Web et de l’Internet sémantique est bibliothécaire et travaille pour la bibliothèque digitale de la NYPL…

2005 se dirige vers les vedettes matières

Le sujet à été disséqué, étudié et documenté à travers tout Internet, mais je pouvais pas faire autrement que d’en toucher un mot.
Le concept de mots clés générés par les utilisateurs ou folksonomies est en train d’exploser sur le web. Nous avions tout d’abord del.icio.us et flickr qui offraient dès l’origine cette possibilité. Par la suite et comme Colin l’avait signalé, la possibilité a été développée de combiner les mots clés des deux sites. Le service de surveillance des blogs Technorati a également rejoint le mouvement en permettant de rajouter des tags pour chaque notice des blogs et offrant ainsi de nouvelles possibilités de recherche par mots clés. L’indexation par mots clés s’est également développée au niveau local pour certains sites comme par exemple metafilter qui a offert avec un succès immédiat la possibilité de catégoriser les notices postées par ses utilisateurs.
La volonté de se diriger vers un Web sémantique et l’utilisation de l’XHTML a permis cette orientation vers de nouveaux systèmes de classification et d’indexation du contenu d’Internet. Le phénomène est pour l’instant cantonné au monde des blogs mais c’est un début. Je suis surtout intéressé par la forme que vont prendre les mots clés utilisés. La forme souple et bordelique des tags créés par les utilisateurs est à l’opposé du système rigide des vedettes matières utilisés dans le monde des bibliothèques mais on va peut être se diriger vers un juste milieux. Après un certain temps, une sélection naturelle va s’opérer au niveau des tags et qui sait peut être vont-ils fusionner selon une méthode combinatoire ressemblant à Rameau/LCSH. Le tout selon une syntaxe fixe développée par les utilisateurs d’Internet avec une rigueur héritée de Wikipedia. Nous sommes dans une période intéressante pour l’univers documentaire…

Folksonomies

Folksonomies – Cooperative Classification and Communication Through Shared Metadata est un article de Adam Mathes, un étudiant spécialisé en informatique documentaire qui fait un masters en bibliothéconomie et sciences de l’information. Il y étudie les métadonnées utilisées pour l’organisation des sites Del.icio.us et Flickr. Ces métadonnées sont créées par les utilisateurs de ces sites et ne suivent donc pas un thésaurus préétabli comme les métadonnées utilisées en bibliothèque ou centre de documentation.
Le sujet est assez passionnant. Ce genre de métadonnées est en train de se développer sur Internet à l’intersection des moteurs de recherche comme Google (qui n’utilise pas de thésaurus ou de mots clés) et des métadonnées utilisées par les professionnels de l’information (comme Rameau et les thésaurus des centres de documentation spécialisés).
Il est bien possible que ce genre de métadonnées créées par et pour les utilisateurs va se développer à l’avenir sur Internet. Une sorte d’auto organisation quelque peu anarchique mais plus orienté utilisateur que les méthode traditionnelles d’indexation documentaire. D’ailleurs, ce développement va peut être s’accélérer : il circule des rumeurs comme quoi Google compte racheter Flickr.