recherche documentaire

Digital Reference: Reference services and Twitter

Utilisation de Twitter pour les services de référence de bibliothèques. Sur le très utile Digital Reference.

une bibliothèque publique américaine laisse tomber la Dewey

Une bibliothèque publique américaine (et c’est la première) à décidé de laisser tomber le système de classement Dewey pour ses ouvrages et de les remplacer par des grands thèmes. Pour les non bibliothécaires, la Dewey et le système de classement numérique dont est inspirée la CDU utilisée en Belgique. Alors qu’aux Etats-Unis c’est une première (il y avait juste des bibliothèques expérimentales comme la Prelinger dont je parlais ici qui avait tenté cette expérience), je crois me souvenir qu’en Belgique plusieurs bibliothèques ont délaissé la CDU et utilisent un système de classement simplifié. Par contre je vous avoue que je ne souvient plus exactement lesquelles… Je les rajouterais ici si je retombe dessus.
(via)

Library Stuff : Hennepin County Library Offers Patron Comments on Catalog Entries

Sur Library Stuff, un post sur le catalogue de la bibliothèque de Hennepin aux Etats-Unis qui permet (entre autres possibilités très intelligentes) aux utilisateurs de laisser des commentaires sur les différents ouvrages. Un feed RSS est même disponible pour suivre les différents commentaires. J’aime beaucoup le concept. Si j’en avais les capacités et que ma bibliothèque utilisait un SIGB dont on pourrait manipuler le code, je pense que le stade suivant serait de permettre aux lecteurs d’indexer les documents par des mots clés libres. Cela risque de générer pas mal de bruit documentaire lors des recherches. Mais je crois qu’une possibilité de recherche uniquement sur ce type de mots clés en gardant une indexation stricte en parallèle pourrait donner des résultats intéressants. L’idée serait de rajouter le système de folksonomy comme point d’entrée pour les recherches dans le catalogue.

Zeldman vs the tag clouds

Jeffrey Zeldman soulève quelques objections intéressantes par rapport aux tag clouds, ces listes de mots clés créés par les utilisateurs et dont la taille varie selon la fréquence de leur utilisation (un exemple ici sur MeFi). Il explique que cette forme de présentation enlève la possibilité de guider les utilisateurs dans leur recherche et favorise les mots clés populaires. On se retrouve donc face à un phénomène de nivellement.

The idea behind tag clouds is that users know best. Their actions determine how other users navigate. Their choices leave a trail. Typically, though not always, the “important” topics get big while those considered less important (which in this case only means less popular) get small. Once they get small enough, they disappear.

La popularité prends le pas sur la l’aide à la recherche et la relation de hiérarchie des taxonomies traditionnelles du type Rameau ou LCSH disparaît.

As tag clouds come to replace expert taxonomies in common practice, carefully constructed hierarchies vanish. In their place is a flattened world where every idea, at any level, is a topic as worthy as any other (…) Instead of a hierarchy based on user-centered classification systems, the tag cloud “hierarchy” is based on raw usage (…) The intellectual problem is that tag clouds create a data world where subtopics are detached from their parents; where the very notion of parent/child relations no longer exists.

Je suis assez d’accord avec lui, cette méthode de présentation ne doit pas être utilisée à l’exclusion des autres. Il faudrait aller vers une fusion entre folksonomies et indexation traditionnelle comme je le disais ici :

Je suis surtout intéressé par la forme que vont prendre les mots clés utilisés. La forme souple et bordelique des tags créés par les utilisateurs est à l’opposé du système rigide des vedettes matières utilisés dans le monde des bibliothèques mais on va peut être se diriger vers un juste milieux. Après un certain temps, une sélection naturelle va s’opérer au niveau des tags et qui sait peut être vont-ils fusionner selon une méthode combinatoire ressemblant à Rameau/LCSH.

Il faudrait rajouter une étape à l’utilisation des tags clouds. Après le choix d’un mot clé il faudrait avoir accès à une liste reprenant les termes synonymes, un peu comme si sous Rameau le choix de mot clé constituerait le terme générique (TG) et les synonymes moins utilisés constitueraient les termes exclus (EP) et les termes associés (TA). De plus, cette liste devrait reprendre tous les mots clés associés par les utilisateurs au terme choisi. Ce type de présentation peut très bien fonctionner en parallèle à un système d’indexation classique et permettrait cette qualité exploratoire que Zeldman craint de voir disparaître.

Tag clouds harness all that mindless accidental randomness and make it the driving engine for navigating deep, ever-expanding content troves. Older ways, based on library science, undoubtedly suffer from the disadvantage of not being new. But they help people find what they need. And that is what navigation should do.

De toute manière, le débat est loin d’être clos et au niveau des weblogs personnels de nouvelles techniques de classification et de catégorisations sont régulièrement expérimentées (sur Kottke ou Binary Bonsai par exemple).
Un dernier détail amusant : je crois savoir d’où viennent (en partie) ces craintes de Zeldman face à l’indexation par les utilisateurs en opposition à l’indexation bibliothéconomique traditionnelle. Il faut savoir que la femme de ce prophète des standards Web et de l’Internet sémantique est bibliothécaire et travaille pour la bibliothèque digitale de la NYPL…

moteurs de recherche

Toujours utile pour le bibliothécaire face aux questions des lecteurs : ce site rassemble et catégorise un grand nombre des moteurs de recherche disponibles sur internet.

2005 se dirige vers les vedettes matières

Le sujet à été disséqué, étudié et documenté à travers tout Internet, mais je pouvais pas faire autrement que d’en toucher un mot.
Le concept de mots clés générés par les utilisateurs ou folksonomies est en train d’exploser sur le web. Nous avions tout d’abord del.icio.us et flickr qui offraient dès l’origine cette possibilité. Par la suite et comme Colin l’avait signalé, la possibilité a été développée de combiner les mots clés des deux sites. Le service de surveillance des blogs Technorati a également rejoint le mouvement en permettant de rajouter des tags pour chaque notice des blogs et offrant ainsi de nouvelles possibilités de recherche par mots clés. L’indexation par mots clés s’est également développée au niveau local pour certains sites comme par exemple metafilter qui a offert avec un succès immédiat la possibilité de catégoriser les notices postées par ses utilisateurs.
La volonté de se diriger vers un Web sémantique et l’utilisation de l’XHTML a permis cette orientation vers de nouveaux systèmes de classification et d’indexation du contenu d’Internet. Le phénomène est pour l’instant cantonné au monde des blogs mais c’est un début. Je suis surtout intéressé par la forme que vont prendre les mots clés utilisés. La forme souple et bordelique des tags créés par les utilisateurs est à l’opposé du système rigide des vedettes matières utilisés dans le monde des bibliothèques mais on va peut être se diriger vers un juste milieux. Après un certain temps, une sélection naturelle va s’opérer au niveau des tags et qui sait peut être vont-ils fusionner selon une méthode combinatoire ressemblant à Rameau/LCSH. Le tout selon une syntaxe fixe développée par les utilisateurs d’Internet avec une rigueur héritée de Wikipedia. Nous sommes dans une période intéressante pour l’univers documentaire…

Folksonomies

Folksonomies – Cooperative Classification and Communication Through Shared Metadata est un article de Adam Mathes, un étudiant spécialisé en informatique documentaire qui fait un masters en bibliothéconomie et sciences de l’information. Il y étudie les métadonnées utilisées pour l’organisation des sites Del.icio.us et Flickr. Ces métadonnées sont créées par les utilisateurs de ces sites et ne suivent donc pas un thésaurus préétabli comme les métadonnées utilisées en bibliothèque ou centre de documentation.
Le sujet est assez passionnant. Ce genre de métadonnées est en train de se développer sur Internet à l’intersection des moteurs de recherche comme Google (qui n’utilise pas de thésaurus ou de mots clés) et des métadonnées utilisées par les professionnels de l’information (comme Rameau et les thésaurus des centres de documentation spécialisés).
Il est bien possible que ce genre de métadonnées créées par et pour les utilisateurs va se développer à l’avenir sur Internet. Une sorte d’auto organisation quelque peu anarchique mais plus orienté utilisateur que les méthode traditionnelles d’indexation documentaire. D’ailleurs, ce développement va peut être s’accélérer : il circule des rumeurs comme quoi Google compte racheter Flickr.

Google print (suite)

Pour en revenir sur le sujet du projet Google print, voici deux liens intéressants : Un article de Rory Litwin sur la monétarisation des bibliothèques par Google et une discussion sur les estimations peut être un peu optimistes de Google sur la durée du projet.

print implications : Google as builder

Ca ne m’avait pas effleuré mais John Battelle remarque que le projet de digitalisation du contenu des bibliothèques universitaire dont j’ai parlé ici est un changement radical dans la politique de Google. Pour la première fois, Google va référencer du contenu tout en le mettant sur Internet. En effet, ils vont héberger et mettre en forme les textes digitalisés (nous ne sommes donc pas dans le même cas qu’avec Blogger qui leur appartient). Ce contenu auto-produit va-t-il affecter leurs algorithmes d’indexation ? Il est peut être un peu tôt pour le dire. Mais il est vrai que le passage de l’indexation pure à la création de contenu risque de changer la donne dans les années à venir.

this is the day the world changes

L’information a été annoncée sur tous les médias en ligne (ici le NYT et là la BBC), Google va collaborer avec l’université du Michigan, Stanford, Harvard, Oxford et la bibliothèque publique de New York dans le but de digitaliser le contenu de leurs bibliothèques et archives. L’idée est de mettre ce contenu en ligne et qu’il soit entièrement indexé par Google afin de permettre de faire des recherches dans les documents (cela concerne les textes tombés dans le domaine public). Il y a beaucoup de choses à dire sur le sujet (mais je n’ai pas le temps de m’étaler, examen oblige) et je crois que ce projet est une étape important pour l’histoire des bibliothèques et du partage de la connaissance. Si le sujet vous intéresse je vous conseille ces entrées sur blog de John Battelle et les discussions sur Slashdot et Metafilter.