Miklos
« Je donne mon avis non comme bon mais comme mien. » — Michel de Montaigne

This blog is © Miklos. Do not copy, download or mirror the site or portions thereof, or else your ISP will be blocked. 

27 août 2009

De quelques bibliothèques numériques

Classé dans : Actualité, Livre, Sciences, techniques — Miklos @ 12:58

Quelques grands projets visent à mettre en ligne le patrimoine culturel français, européen ou mondial. Un petit tableau tente de mettre en regard quelques-unes des caractéristiques de quatre d’entre eux (pour autant que l’on puisse comparer). Les chiffres, quand il y en a, sont ceux qui sont affichés ou annoncés sur leurs sites respectifs.

Ces quatre projets n’ont pas été choisis au hasard : ils concernent tous, directement ou non, le patrimoine écrit français et font l’objet de l’intérêt actuel (qui est en général passager…) des médias :

· Gallica, mis en œuvre par la Bibliothèque nationale de France, et qui comprend une partie croissante de ses fonds numérisés ;

· Culture.FR, portail des collections patrimoniales françaises, mis en place par le ministère de la culture et de la communication ; il permet de localiser des documents détenus par les bases qu’il indexe (et donc d’y accéder via ces bases directement), d’une part, et a vocation de fournir les informations qu’il a collectées à Europeana ;

· Europeana, portail de la culture en Europe, projet en cours soutenu par l’Union européenne ; à l’instar du portail français, il est destiné à permettre de localiser des documents détenus par les bases qu’il indexe ;

· Google Books, qui comprend des livres numérisés provenant de grands fonds internationaux (principalement : bibliothèques) ; ce n’est pas un portail : les documents numériques sont stockés dans leur système.

Ce ne sont pas les seuls projets de ce genre : la Bibliothèque numérique mondiale est un projet culturellement et techniquement ambitieux porté par la Bibliothèque du Congrès. Il qui ne semble pas viser, a contrario, une exhaustivité ou une volumétrie aussi importante que ces quatre projets. Il est intéressant de trouver parmi leurs donateurs Google et Microsoft…

On n’insistera jamais trop sur la différence fondamentale – même si elle n’est pas directement visible pour l’utilisateur – entre une bibliothèque numérique au sens strict du terme et un portail : la première détient les documents que son moteur référence : elle peut donc en assurer un référencement, une présentation et un contrôle d’accès uniformes, et, le cas échéant, en indexer aussi les contenus (textuels, mais pourquoi pas image, vidéo ou musique).

Un portail s’apparente à un moteur de recherche : il ne détient pas de documents, mais uniquement les informations concernant des documents – qui peuvent être très sommaires (titre et auteur, par exemple) ou détaillés, allant jusqu’à l’indexation du contenu de ces documents, ce qui nécessite de sa part de les récupérer temporairement pour en extraire ce type d’information (ou, ce qui est moins commun, que le détenteur la lui fournisse). Le contenu n’étant pas stocké « dans » le portail, le lecteur n’est pas assuré d’y avoir toujours accès, même s’il y a trouvé une mention (c’est le même cas pour un moteur de recherche, qui peut répondre à une requête en indiquant un site, mais que, lorsqu’on clique pour y accéder, on s’aperçoit que le site a disparu ou n’est pas accessible ou a changé).

Autre détail qui ne manque pas d’importance, dans le contexte actuel : le fait qu’une bibliothèque numérique (comme Gallica, Google ou la Bibliothèque numérique mondiale) soit accessible sur l’internet n’implique pas forcément que ses documents soient référencés (ou indexés) par tel ou tel moteur de recherche ; et, s’ils le sont, que leur contenu (le texte du livre, par exemple) y soit aussi indexé, en sus des informations les concernant (titre, auteur…). C’est ainsi que les contenus des livres de Google Books sont indexés dans le moteur de recherche de Google – mais pas ailleurs… Ceci a pour conséquence de « forcer » l’internaute qui recherche des ouvrages à aller interroger soit le moteur Google, soit Google Books.

18 août 2009

« Quand Google défie l’Europe »

Classé dans : Actualité, Livre, Sciences, techniques — Miklos @ 8:36

…il finit par gagner, contrairement à ce que souhaitait l’ex président de la Biblio­thèque nationale de France, Jean-Noël Jeanneney.

Ses prises de position, de principe (essentiellement : ne pas laisser s’instaurer une seule source – et d’autant plus commerciale –, donc forcément hégémonique, pour la diffusion du patrimoine culturel sur l’Internet) avaient amené à la mise en place du projet Europeana, qui vise à mettre en ligne un volume important du patrimoine culturel européen numérisé : livres, bien entendu, mais aussi images (tableaux, estampes…), musique et vidéo. Ce n’était pas une opposition absolue à Google, dont la BnF avait discrètement adopté le moteur de recherche, mais là c’est un revirement stratégique (résultant de considérations financières) et la BnF se rend à Canossa : selon La Tribune d’aujourd’hui (dixeunt Reuters et d’autres sources), la BnF serait en négociation avec Google pour numériser son patrimoine, suivant ainsi l’exemple – tant décrié à l’époque – de la bibliothèque municipale de Lyon.

Il sera intéressant de voir, si cette négociation aboutit, comment la bibliothèque numérique de la BnF, Gallica, évoluera : en volumétrie (qui n’avait pas beaucoup crû pendant longtemps) mais surtout en qualité (de la numérisation, des accès aux contenus – ergonomie et fonctionnalités). Et, par contrecoup, Collections, le portail des collections patrimoniales françaises mise en place par le ministère de la culture et de la communication, puis, de là, Europeana elle-même, que cette base est censée nourrir.

Le cercle est bouclé : Europeana, ayant émergé « contre » Google, sera consolidée par des contenus produits par ce qui se positionne comme « la » bibliothèque numérique mondiale. Finalement, Jeanneney avait raison…

Cette démarche s’inscrit dans la logique économique actuelle, celle de l’évolution vers une société de services : la BnF, n’ayant pas les moyens de s’offrir une numérisation maison, fait appel aux services (reconnus pour leur efficacité et pour leur qualité) de Google. Quant aux lecteurs, ils réduiront leurs achats de livres (qu’ils empruntaient déjà, pour certains), tout en augmentant leurs acquisitions du droit de les lire en ligne (triste cure d’amaigrissement pour les bibliothèques personnelles et publiques…), comme ça l’est déjà le cas pour la musique enregistrée ou les films. Résultat : les éditeurs réduiront d’autant plus leur production papier la demande baissant, cercle vicieux – ou plutôt spirale – dont on peut craindre les effets sur la disponibilité future de l’objet livre, dont la durée de vie sur les étagères de librairies se raccourcit, à l’instar de la présence de (bons) films sur nos écrans après leur sortie. On nous objectera que l’impression à la demande – à l’unité ! – s’y substituera. Le prix en sera sans doute plus élevé que celui d’un livre imprimé en série, mais surtout, la qualité de l’objet lui-même – du papier, de la couverture, de l’encre – ne sera plus au rendez-vous.

Il en est déjà ainsi aussi pour des usages plus matériels : si l’on pouvait louer quasiment de tout pour une certaine durée, il est de plus en plus possible de le faire à l’usage, pour les bicyclettes par exemple (les vélibs), et on nous le promet bientôt pour les voitures (les autolibs ?). Cette disparition annoncée de la propriété est un autre clin d’œil ironique à l’histoire et on ne peut résister au plaisir de faire appel à Google Books pour afficher l’origine de la célèbre phrase « Qu’est-ce que la propriété ? C’est le vol. »

Cette tendance à déléguer à plus compétent/capable que soi peut encou­rager non seulement les monopoles, mais la diminution de la créativité inhérente à la diversité. Érigée en principe, les effets pervers de cette démission (voire dé-mission) ne tarderont pas à se faire sentir : plus besoin d’apprendre à jouer du piano, de composer de la musique, d’écrire des poèmes, de photographier, de faire du théâtre en amateur – il y en a qui le font mieux ; l’amateur n’a plus de place face au professionnel, et le « petit » professionnel n’en a pas face au plus grand. C’est la place assurée à l’uniformisation et au nivellement. Et à la domination de tous par des « boîtes » hyperspécialisées. Brave New World.

4 juin 2009

Sic transit

Classé dans : Livre, Sciences, techniques, Société — Miklos @ 2:32

« Qui bene amat, bene castigat. » — Proverbe latin

« Ceux qui méritent le plus d’être loués supportent le mieux d’être critiqués. » — Alexander Pope

Je viens d’apprendre – indirectement, c’est symptomatique – la fermeture de la liste de diffusion Biblio-FR. Cette liste avait été créée en 1993 par Hervé Le Crosnier à l’intention de « bibliothécaires et documentalistes francophones, et toute personne intéressée par la diffusion électronique de l’information documentaire ».

J’avais découvert cette liste peu après sa création (ses archives contiennent un message que j’y avais envoyé en janvier 1994), et il m’arrivait d’y faire part d’informations qui me semblaient intéressantes pour ses membres. Mais son utilité pour moi s’est surtout révélée lorsque j’ai été chargé, en 1995, du projet de constitution d’une médiathèque ; elle devait réunir les fonds d’une bibliothèque existante, équipée d’un petit progiciel basé sur des formats propriétaires, avec un fonds, qu’il me fallait constituer, d’archives physiques et numériques.

Si je m’étais rapidement fait une opinion sur les usages et les interfaces – une bibliothèque hybride, physique et numérique, utilisant les technologies émergentes du Web pour interface – je n’étais ni bibliothécaire ni documentaliste ni archiviste ; il me fallait donc trouver comment me renseigner (en quelques semaines !) pour me faire mon opinion sur les options, les standards, les solutions, les tendances, du moins en ce qui concernait la bibliothéconomie, métier que, jusque là, je n’avais vu que de l’extérieur, même si, par curiosité et, entre autres, par fréquentation de Biblio-FR et la réalisation d’autres projets, j’en connaissais certains aspects.

Biblio-FR fut l’une de mes trois sources d’information primaires et primordiales, du fait de la présence de professionnels disposés à partager avec générosité leur expérience et à répondre avec compétence, patience et indulgence aux questions de l’outsider que j’étais. Je retrouve dans ses archives un écho à mon message à la liste à ce sujet (cité dans une des réponses en juillet 1995 ; le message d’origine est absent des archives, ainsi que la réponse qu’Hervé Le Crosnier y avait apporté et que j’aurais aimé relire) :

Bonjour,
 
Pour un projet en cours, je recherche un logiciel de bibliothèque qui :
- permette la gestion du catalogue de la bibliothèque (saisie, interrogation) ;
- gère la circulation (emprunts) ;
- permette d’accéder au « matériau » lui-même s’il est accessible sur informatique (livre, image ou son numérisé) ;
- de préférence, tourne sous Unix ;
- de préférence, possède une interface Z39.50.
 
Où dois-je commencer à regarder ? Recommendations ?
 
Merci d’avance

C’était alors une petite « communauté virtuelle » – la réussite de la constitution d’une telle communauté n’est pas à attribuer à l’outil, mais principalement à son créateur et animateur – et les réponses utiles ne tardèrent pas à arriver1 : Biblio-FR m’a rendu là un service inestimable, qui manifeste l’esprit d’entraide et de collaboration amicale au-delà des contraintes institutionnelles et matérielles que j’ai trouvé dans la communauté réelle sur laquelle la liste s’adosse.

Une fois le projet abouti (en 1996), je n’ai pas quitté ce forum. Le contenu des messages m’intéressait souvent, et leur volume était gérable même s’il était en croissance constante : 43 messages (regroupés, comprenant chacun un ou plusieurs messages « source », mais en nombre raisonnable) en septembre 1994, 60 messages à la même période un an plus tard, pour en arriver à plus de 300 messages mensuels ces derniers temps (l’un d’eux contenant lui-même 43 messages…), diffusés avec des retards croissants. L’intérêt des contenus n’a pas crû avec le volume. J’ai exprimé ailleurs ma frustration à l’égard de cette saturation, qui m’a menée à me désabonner de la liste, et à la consulter de plus en plus rarement.

Biblio-FR, ouverte à tous, a été victime non pas uniquement de son succès, mais du phénomène général lié à la banalisation des technologies de la communication et à leur adoption par un nombre croissant d’utilisateurs pour des usages personnels et plus uniquement professionnel, notamment du fait de l’émergence du Web qui a permis de mettre en œuvre des modes d’accès bien plus conviviaux et abordables pour des « non initiés », de la baisse des coûts du matériel informatique et de la connectivité à l’internet, de la croissance des débits, puis, actuellement, de la convergence informatique – téléphonie.

Cette banalisation s’accompagne évidemment d’une croissance des messages et des informations auxquels l’utilisateur de ces technologies est directement exposé, volontairement ou non, autant de la part de contacts personnels ou professionnels que des spams. Nos boîtes aux lettres se remplissent à une vitesse bien plus grande qu’auparavant, et, de ce fait, il est plus difficile d’accorder son attention à chaque message (et il arrive à chacun de ne pas en remarquer de significatifs). Les téléphones portables sonnent à tout bout de champ – même en plein concert – quand bien même il est possible de les éteindre et de consulter ultérieurement leur messagerie vocale ou la liste des SMS reçus.

Non seulement le malheureux utilisateur est potentiellement en ligne directe de tout autre utilisateur (de l’internet, de la téléphonie…), mais comme il est beaucoup plus facile et presque gratuit d’envoyer un message ou d’appeler un correspondant, on le fait sans discrimination, là où, auparavant, on réfléchissait sur la méthode la plus adaptée à communiquer – lettre, télégramme, téléphone… – en fonction de l’importance du message, de son coût et de son temps de transmission. Le fonctionnement par impulsion et par envie, dans l’immédiat, sont les caractéristiques d’une société de consommation et d’innovation technologique qui s’emballe (jusqu’à ce que les ressources, qu’elle suppose, dans sa logique de fonctionnement basée sur la « création destructrice », infinies, s’épuisent finalement).

Biblio-FR se retrouve englouti dans ce tsunami qui a rendu ce médium difficilement utilisable, c’est-à-dire lisible. De débats, il s’est transformé en un immense dazibao, un mur d’un Jacques Villeglé, où les affiches se recouvrent les unes les autres avec une telle rapidité que leur contenu n’en est plus perceptible, que la masse noie l’essence. Le plus ciblé côtoie le plus banal, l’information la plus objective alterne avec l’opinion parfois virulente, et la couverture des sujets est si vaste du fait de l’évolution des métiers qu’il est probable que chaque lecteur n’est intéressé que par une partie infime des messages – pour certains d’une grande richesse –, le reste étant, pour lui, du bruit. Et ce bruit devient assourdissant.

La modération – bénévole – aurait peut-être pu en laisser passer moins pour tenter de préserver un volume raisonnable et donner à la liste une orientation plus ciblée (par exemple, débats plutôt qu’annonces), mais c’était de toute façon mission impossible : elle a dû faire face à un nombre croissant de messages à traiter et a elle-même saturé. L’outil – liste de diffusion modérée – n’est plus adapté à ses usages actuels.

Face à cette surcharge informationnelle, de nouveaux outils émergent. Il s’agit, pour faire bref, de plateformes plus spécialisées à certains types de communication combinant commentaires, annotations et débats (par exemple : blogs) et de constitution collaborative de contenus (par exemple : wikis) et fournissant des méthodes pour leur organisation sémantique (thématisation, indexation, taggage… préétablis, libres, automatisés…) et temporelle (discerner une information à valeur temporelle courte – news – ou longue – document de référence, par exemple), des principes variés de recherche de l’information et de « navigation » mais aussi de dispositifs permettant le choix et l’organisation personnels de sources d’informations par les usagers : fils RSS, interfaces à la netvibes… Mais l’outil ne (se) suffit pas : il lui faut aussi le médiateur, et c’est un équilibre complexe entre les deux qui en conditionne le succès.

La disparition de Biblio-FR pourrait encourager le développement de services utilisant une ou plusieurs de ces technologies. Si on y gagnera dans le ciblage, on y perdra une caractéristique essentielle de Biblio-FR : elle était la référence première pour tout ce qui touchait de près ou de loin les bibliothèques (physiques puis numériques), elle était l’usuel qu’on consultait en cas de besoin. Cette fragmentation est-elle inévitable ? Elle s’est aussi produite dans d’autres domaines – d’où la nécessité croissante de passer par des moteurs de recherche généralistes, puis, plus récemment, par des moteurs spécialisés (ou portails). Le portail sera-t-il l’avatar de Biblio-FR ?

Le futur est la chose qu’il est le plus difficile de prévoir ou de prédire ; je ne peux que parler avec certitude du passé, et en particulier de celui que j’ai connu : Biblio-FR m’a été extrêmement utile, et je suis donc très reconnaissant que cette liste ait existé. Elle m’a aussi poussé à réfléchir, suscité des réflexions et la nécessité de leur formulation, et pour cela aussi, j’en suis reconnaissant. Je devine aussi l’immense travail, sans doute rarement gratifiant, que ses organisateurs, Hervé Le Crosnier, puis Sara Aubry, ont fourni bénévolement pour faire fonctionner cette liste qui devenait de plus en plus pesante, je leur en suis d’autant plus reconnaissant.


1 Maintenant, un tel message sur la liste aurait suscité des réactions virulentes et son auteur assimilé à « ceux qui jettent une bouteille à la mer faute d’une formation professionnelle idoine » – pour reprendre une expression de Bertrand Calenge dans un récent billet critiquant l’évolution de la liste – contribuant ainsi à son bruit et à son inutilité. Autres temps, autres mœurs.

27 mars 2009

Offre d’emploi : développeur (h/f) informatique expérimenté sur les technologies du Web (CDD) Pourvu.

Classé dans : Offre d'emploi — Miklos @ 17:02

Dans le cadre du projet de Portail de la musique contemporaine (ouvert en 2007) qui fédère les ressources d’organismes culturels français et est partenaire d’Europeana, un CDD est proposé pour un poste de développeur informatique expérimenté sur les technologies du Web.

Description du poste

La personne recrutée sera chargée de poursuivre le développement du Portail :

  • Mise en place d’un service d’hébergement et d’entrepôts OAI statiques pour le dépôt de documents numériques et de leurs métadonnées par les partenaires du projet.
  • Nouvelles interfaces « sociales » (blog, annotations) et évolution des interfaces actuelles (modalités de recherche et de navigation).
  • Backoffice (gestion des moissons OAI, statistiques d’utilisation).
  • Ingénierie (gestion de versions, généricisation du logiciel, de son déploiement et des installations, documentation).

Profil recherché

Requis : expérience concrète (dans des projets déployés) des technologies suivantes :

  • Langages et bases de données : PHP, MySQL, Javascript, Smarty…
  • Protocoles : OAI, RSS.
  • Formats : XML.
  • Systèmes : Apache et un CMS (de préférence Drupal).

Souhaité : connaissance des technologies et formats suivants :

  • Flash.
  • MP3.
  • Mime.
  • Dublin Core, MODS, Unimarc.

Capacités

  • À rentrer rapidement dans un système complexe pour se l’approprier.
  • À structurer son code et sa documentation.
  • Haute productivité.
  • Travail en équipe.
  • Intérêt pour la musique.

Informations sur le poste

Lieu de travail : Ircam (Paris centre).
Durée : 9 mois.
Salaire : selon compétences et adéquation.
Disponibilité : immédiate.

Candidature

une lettre de motivation et un CV détaillant le niveau d’expérience/expertise dans les domaines mentionnés ci-dessus (ainsi que toute autre information pertinente).

13 mars 2009

Google Books, ou quand le mieux est l’ennemi du bien

Classé dans : Littérature, Livre, Sciences, techniques — Miklos @ 3:13

Jusqu’à très récemment, on pouvait rechercher dans la fort riche et intéressante bibliothèque numérique de Google des ouvrages publiés avant ou après une certaine année : le formulaire d’interrogation avancée permettait de spécifier l’une ou l’autre (ou les deux). Dorénavant, on peut limiter la recherche au mois près (très utile pour une éventuelle intégration de leur service de presse numérisée à celui-ci) : ces deux cases sont remplacées par des menus déroulants, comprenant d’une part le nom d’un mois, de l’autre le quantième de l’année (et dont les intitulés n’ont pas été traduits, dans la version française de la page). Mais attention, il ne suffit pas de choisir ces dates, il faut en sus cocher l’option de recherche ciblée (ce qui n’était pas le cas dans la version précédente de l’interface) : si on oublie de le faire, ces dates sont purement et simplement ignorées.

Or la première année présente dans ce menu est 1776. Historique, il est vrai (c’est celle de la naissance de la patrie de Google), mais trop limitative : il y a nombre d’ouvrages bien plus anciens dans ce fonds, et l’utilisation de ces menus, tous deux obligatoires si l’on veut cibler la recherche sur une période particulière, ne permet plus de le faire comme auparavant : impossible, par exemple, de chercher un ouvrage publié au XVIIe s.

Heureusement qu’il est encore possible – pour ceux qui l’avaient remarqué auparavant – d’effectuer ce type de recherche ciblée en rajoutant date:1600-1699 dans le corps de la requête : c’est ainsi qu’on peut obtenir les documents souhaités.

Ce n’est pas la première ratée chez Google, cette année – même si celle-ci risque d’être moins remarquée (après tout, combien ont-ils de lecteurs de livres préhistoriques, pardon, pré-1776 ?) : l’étiquetage par Google de tous les sites web comme « risquant d’endommager votre ordinateur » en janvier, les pannes de Gmail en février et en mars, les plus récentes erreurs de partage dans Google Documents, le détecteur de gays du Google Phone (on croit rêver !)…

Comme quoi, la crise frappe tout le monde de folie, même les plus grands.

The Blog of Miklos • Le blog de Miklos