Miklos
« Je donne mon avis non comme bon mais comme mien. » — Michel de Montaigne

This blog is © Miklos. Do not copy, download or mirror the site or portions thereof, or else your ISP will be blocked. 

15 novembre 2009

Avant le commencement d’Europeana était le verbe

Classé dans : Livre, Sciences, techniques — Miklos @ 11:46

Une bibliothèque numérique qui ne contienne pas que des livres

« Comme le montre l’emprise de Google, le patrimoine en question ne se limite pas à l’écrit – ce qui se reflète d’ailleurs dans la variété des collections de la Bibliothèque nationale de France – il sera donc inévitable à terme d’articuler un tel projet avec celui de l’accès aux autres fonds : estampes, cartes, musique, film. Là aussi s’impose une réflexion qui prendrait en compte ce futur. » (23 février 2005)

C’est le cas d’Europeana. Se distinguant de Google Books qui ne contient que des livres, c’est un portail qui fournit l’accès à des livres, des images fixes et animées et des enregistrements sonores. Mais la musique en est encore la parente pauvre à deux égards au moins : peu d’enregistrements (le problème des droits, que la Commission européenne veut enfin aborder), et pas de distinction pour la notation musicale (les partitions) : dans le modèle actuel, une partition imprimée sera indexée « texte », tandis qu’une partition manuscrite sera identifiée comme une « image fixe ».

Une bibliothèque 2.0

« Le numérique est un des avatars de l’écrit ; dans sa forme actuelle, il a tendance à supprimer la médiation. Mais les techniques offrent des moyens de la réintroduire autrement ; certaines bibliothèques fournissent des services d’accès à distance par courriel, mais rien n’empêche d’envisager d’autres modes de mise en relation de lecteurs avec des bibliothécaires et avec d’autres lecteurs (…). » (23 février 2005)

« Envisageons une bibliothèque offrant une interface de ce type : les lecteurs peuvent communiquer, le cas échéant, entre eux, pour échanger des conseils, collaborer sur un travail commun. Un documentaliste de service est aussi présent : le lecteur ayant besoin d’aide dirige ainsi son avatar vers celui du documentaliste et l’interroge (à l’aide du clavier ou via un microphone) ; le documentaliste répond de la même façon et déplace éventuellement son propre avatar pour guider le lecteur vers une section de la bibliothèque. À la différence des représentations anthropomorphiques utilisées dans certaines interfaces dont l’intelligence n’excède pas celle d’un robot mécanique, il s’agit d’une mise en rapport avec une compétence humaine bien réelle : là est peut-être une des clés d’une certaine (ré)humanisation de l’informatique. » (mai 2000)

On peut en voir ici et là les prémices : la Médiathèque de l’ESC Lille (médiation en ligne), les quelques réseaux sociaux autour du livre : Libfly (échanges autour des bibliothèques personnelles des internautes), Points communs (site de rencontre par affinités culturelles…).

La bibliothèque numérique : plus qu’un portail, un fonds en réseau

« Je verrai bien la bibliothèque européenne du futur sous forme d’un réseau dynamique permettant le raccordement de bibliothèques petites et grandes – certifiées, c’est essentiel (autant pour la « validité » des fonds que l’adéquation technique) –, avec leurs fonds numérisés (qu’ils auraient constitués selon leurs propres critères), s’intégrant facilement dans un maillage (utilisant probablement des protocoles de type OAI plutôt que Z39.50) qui offrirait, entre autres outils, recherche dans les contenus et accès réparti (DOI ?) à l’ensemble des fonds ainsi disponibles, de façon répartie. » (17 mai 2005)

« On pourrait envisager ainsi un dispositif dans lequel chaque bibliothèque nationale faisant partie de ce réseau, ayant numérisé ses fonds propres dans des formats compatibles4, en ait le contrôle5, au lieu d’avoir à les transférer à une tierce partie qui en aurait la maîtrise, comme Google le souhaiterait pour son projet. Quant à cette bibliothèque virtuelle, elle offrira des modes d’accès, de présentation de collections et de contextualisation des ouvrages6, de recherche dans les métadonnées et dans les contenus eux-mêmes7. » (24 mars 2005)

Dans sa version actuelle, Europeana utilise effectivement le protocole OAI afin de récupérer les informations (métadonnées) concernant les documents numérisés chez ses partenaires. Elle permet donc de les localiser si on en connaît un bout du titre ou de l’auteur : c’est donc bien un (vaste) portail. Mais contrairement à Google Books, Europeana n’indexe pas les contenus : il est donc impossible d’y retrouver un livre contenant un mot ou une phrase souhaitée. C’est en ce sens qu’Europeana n’est pas (encore) une bibliothèque numérique. Cela tient à deux facteurs indépendants : la version actuelle est un prototype, Europeana version 1.0 étant prévu pour 2010 ; mais surtout, c’est la problématique des droits d’auteur (que Google aborde, comme on le sait, tel un corsaire) : variable d’un pays à l’autre, elle peut ne pas autoriser la récupération par Europeana de fichiers numériques (par exemple : des livres) stockés chez ses partenaires pour les indexer en texte intégral. Il y aurait bien une alternative technique – que chaque partenaire effectue cette indexation et ne fournisse que les indexes à Europeana au lieu des fichiers – mais cela nécessiterait des développements chez chacun des partenaires, ce qui est exclu. À moins… à moins que le droit n’évolue dans le sens qui offrirait à des bibliothèques, physiques et numériques, des exceptions qui permettraient un bien meilleur partage des ressources culturelles, sans léser les ayants droits, mais sans léser non plus les lecteurs ni faire peser un poids financier insupportable sur les bibliothèques.

Europeana comme garantie de l’accès au patrimoine culturel numérisé

« Ce danger – de concentration dans les mains d’une entreprise à visées purement commerciales (voire financières) – concerne aussi les contenus numériques culturels patrimoniaux. Ainsi, le projet de numérisation des fonds universitaires par Google créera une “bibliothèque numérique universelle” dans son propre réseau, qui ne pourra être indexée par d’autres moteurs de recherche. Cette concentration est inquiétante à un autre égard, que j’avais déjà soulevé en 1999 : “imaginez un embargo d’une grande puissance sur une plus petite, qui aurait pour effet de lui couper l’accès aux réseaux…”. » (13 février 2006)

« Ce genre de problème [les erreurs de numérisation, les erreurs dans les métadonnées] démontre, s’il le fallait, que le numérique ne doit pas être considéré comme l’unique moyen de conservation à long terme : la préservation de l’original est primordiale. Il démontre aussi le danger d’une stratégie de numérisation qui voudrait éviter, pour des raisons d’économie, de numériser un document qui l’aurait déjà été ailleurs : imaginez qu’un hapax se trouve dans la page d’un livre mal numérisé, mais dont il n’existerait qu’un seul et unique exemplaire numérique : il sera impossible de trouver ce mot. Raison de plus de l’importance de l’existence de bibliothèques numériques concurrentes… » (14 novembre 2009)

Les arguments invoqués alors et hier à l’encontre du monopole et de l’exclusivité de Google sont d’autant plus valables aujourd’hui, et justifient, s’il le fallait, l’effort important que fait l’Union européenne pour fournir, non pas un service concurrent à Google, mais une ressource – probablement surtout complémentaire – reflétant le patrimoine culturel européen dans sa variété et dans sa richesse. On lui souhaite de réussir à s’imposer comme référence incontournable, aux côtés des quelques autres grandes références disponibles sur l’internet, qu’elles soient publiques ou privées.

14 novembre 2009

Une bibliothèque, c’est fait pour…

Classé dans : Livre, Sciences, techniques — Miklos @ 16:46

Et véritablement aussi ce n’est pas la quantité de Livres, qui fait l’excellence & le prix d’une Biblio­thèque : mais c’est leur bonté : Ce que Sénèque exprime très-bien dans sa 45e Épistre, où il dit, Non referi quam multos Libros, sed quam bonos habeas. C’est-à-dire, il n’importe pas d’avoir beaucoup de Livres, mais il importe de les avoir bons. — Traité des plus belles biblio­thèques de l’Europe, par le Sieur Le Gallois. À Paris, 1685.

…lire, même si elle est numérique. Ou du moins, consulter des livres, parce que – on le reconnaîtra volontiers – le livre de poche est un objet bien plus commode qu’un clavier-écran-souris, question ubiquité et portabilité (dans le métro, debout agrippé d’une main et le livre dans l’autre, dans sa chambre allongé sur le dos sous sa couette ou en plein désert sans prise électrique à 300 km à la ronde pour le recharger, il n’en a pas besoin), visibilité (même en plein soleil sur la plage) et maniabilité.

Il est certains livres qu’on ne lit en général pas de la première page au dernier, tels les encyclopédies ou les dictionnaires (sauf si on est habité du vertige de la liste). Ils sont aussi pour la plupart moins maniables qu’un livre de poche (même si certains ont été réduits à cette taille). On les utilise autrement : l’amateur de la sérendipité ou du heureux hasard les ouvre au hasard, passe d’un terme à un autre à la façon que permet l’hypertexte ou les feuillette « à cette heure un livre, à cette heure un autre, sans ordre et sans dessein, à pièces descousues » (Montaigne, Essais). Un autre y recherche un mot précis – et c’est surtout là le grand apport des bibliothèques numériques, du moins lorsqu’elles indexent le contenu des ouvrages qu’elles contiennent : il suffit d’y rechercher le mot ou la phrase désiré pour que le livre s’ouvre à la page qui le contient.

On a déjà parlé ici à plusieurs reprises des deux principales bibliothèques numé­riques comprenant des ouvrages en français, Google Books et Gallica (Europeana n’est pas à strictement parler une bibliothèque numérique : c’est un portail vers des contenus numérisés qui se trouvent ailleurs). On a récemment comparé leurs volumétries, leurs couvertures et leurs fonctionnalités respectives.

Aujourd’hui, on a comparé l’accès que fournissent ces deux services à un même ouvrage, l’édition de 1827 du Nouveau dictionnaire des origines, inventions et découvertes dans les arts, les sciences, la géographique, le commerce, l’agriculture, etc., indiquant les époques de l’établissement des peuples, des religions, des sectes et institutions religieuses, des lois, des dignités ; l’origine des différentes coutumes, des modes, des monnaies, etc., ainsi que les époques des inventions utiles et des découvertes importantes faites jusqu’à ce jour (on ne résiste pas au plaisir de donner le titre dans son intégralité) de Noël et Carpentier.

Pourquoi cet ouvrage ? Eh bien, précisément à cause de la conférence qui s’est tenue hier à l’auditorium du livre, dans la série consacrée à Umberto Eco autour du vertige de la liste, et qui avait réuni autour de lui l’artiste Claude Closky, le poète et romancier Nanni Balestrini et la chanteuse Donatienne Michel-Dansac (dont la façon de dire des listes – ou de ne répéter qu’un seul mot, OK, dans un dialogue désopilant – était particulièrement musicale, enjouée et intelligente). Le lendemain, on a cherché dans Google Books des ouvrages du XVIIe s. qui parleraient de listes, et on y a trouvé un livre (bilingue, en français et en latin) particulièrement intéressant : L’Univers en abrégé où sont contenus en diverses Listes, presque tous les Noms des Ouvrages de la Nature, de toutes les Sciences, & de tous les Arts, avec leurs principaux Termes, par le P. F[rançois] P[orney] de la Compagnie de Jesus, publié en 1684. L’amateur de listes ne peut qu’être comblé (temporairement : c’est une soif infinie). L’auteur a l’ambition de décrire tous les domaines de la connaissance, physique et métaphysique. Chaque chapitre commence par un dialogue :

— Qu’est ce que la Terre ?

— La terre est un Élément très-sec, très-pesant, & froid, qui est immobile en son tout & le centre du monde.

— Quelle est la figure de la Terre ?

— Elle est ronde.

— Comment peut-elle estre ronde avec tant & de si hautes montagnes ?

— Les montagnes n’estant que comme de petites verruës, à l’égard de la grandeur de son Globe, n’empéchent pas qu’elle ne soit ronde.

— Quelle est la grandeur du Globe de la Terre ?

— Elle a de circuit sept mille & cinq cens lieuës de France.1

— Quelle est la profondeur de la Terre ?

— Elle a de diamètre, c’est à dire, de profondeur, en la perçant de part en part en droite ligne ; elle a, dis-je, deux mille & quatre cents lieuës ; & jusqu’à son centre, qui est son demi-diamètre, elle en contient mille & deux cents.

— Quelles sont les productions de la Terre ?

— Les Animaux, les Arbres, les Plantes, les Pierres, les Métaux.

S’ensuivent les listes qui détaillent ces « productions ». On se délectera particulièrement en lisant les nombreuses entrées pour le terme cheval (autant, sans doute, que pour le terme neige chez les Inuits) :

Cheval hongre, chatré. Cheval étalon. Cheval nain. Petit Cheval. Cheval de course, coursier. Cheval de change. Cheval de main. Cheval de poste. Cheval de relais. Cheval de carrosse. Cheval de charette. Cheval de coche. Cheval de male, à porter male, malier. Cheval rétif. Cheval fort en bouche. Cheval qui ruë, qui regimbe. Cheval ombrageux. Cheval qui bronche. Cheval qui secoüe. Cheval qui se couche. Cheval poussif. Cheval amaigry. Cheval bondissant. Cheval indompté. Cheval bay, de couleur rouge obscur. Cheval bay chatin. Cheval bay-brun. Cheval bay-doré. Cheval pie, blanc & noir, ou blanc & de quelqu’autre couleur. Cheval gris pomelé. Cheval isabelle. Cheval alezan, ou roux. Cheval roux alezan, de couleur de feu. Cheval alezan-brûlé, alezan obscur. Cheval aubère, de couleur grisâtre, ayant de grandes taches noires. Cheval rubican, d’un poil meslé de blanc & de rouge pâle. Cheval baillet, de poil roux, tirant sur le blanc. Cheval savre, ou saur (le même qu’alezan).

Si vous ne comprenez pas quelque terme de cette liste, sa traduction en latin ne manquera pas d’illuminer votre esprit.

On ne pouvait que s’interroger sur l’auteur d’un tel ouvrage, François Porney. Internet, toi qui sais tout, dis-moi donc qui était-il ? Pas de réponse, ni dans Google Books, ni ailleurs. Google Books signale des dictionnaires plus tardifs qui en mentionnent le nom ou citent le titre de son dictionnaire, tandis que le catalogue de la bibliothèque nationale d’Australie fournit les dates auxquelles il a vécu (1618-1673) et une liste de ses œuvres traduites en anglais et publiées aux XVIIIe et XIXe siècles. C’est tout.

C’est en cherchant le titre de son dictionnaire, L’Univers en abrégé, qu’on a trouvé le Nouveau dictionnaire des origines – non pas qu’il en parle mais parce que ces premiers mots du titre font partie d’un poème de Dominique Ricard que les auteurs citent dans leur définition de sphère :

Je chante dans ces vers la sphère et son usage :

Du savoir et de l’art ingénieux ouvrage,

Son ensemble, formé par des cercles divers,

A nos yeux étonnés fait mouvoir l’univers.

Quels sublimes esprits, dans leurs savantes veilles,

De ce monde abrégé conçurent les merveilles,

Et des cieux, dans leur vol, atteignent la hauteur,

Surent en découvrir la forme et la grandeur. (…)

C’est donc cet ouvrage dont nous comparons maintenant une page dans les versions qu’en proposent Google Books et Gallica (voir ici les copies d’écran auxquelles nous nous référons).

Google Books affiche le texte original (en mode image) de façon à ce qu’il occupe environ 50% en largeur et 80% en hauteur de la fenêtre du navigateur ; il est parfaitement lisible2 (et Google propose la possibilité de zoomer pour l’agrandir selon que de besoin, un mode « plein écran » qui fait disparaître le menu de gauche et réduit encore plus la zone supérieure, et un mode double page, lui aussi lisible). Le titre (ou du moins ses dix premiers mots, il est fort long) et l’auteur sont affichés sur une seule ligne au-dessus du texte. Plus haut, une case permet de lancer une nouvelle recherche dans toute la bibliothèque numérique. À gauche, une case permet d’effectuer des recherches dans l’ouvrage affiché, et de revenir aux informations (métadonnées) le concernant.

Gallica affiche le texte de façon à ce qu’il occupe 16% de la largeur de la fenêtre et 36% de la hauteur. À cette échelle, il est illisible. 37% de la fenêtre (en largeur) est vide. Des zones – en haut, à gauche (c’est là qu’est affiché une partie du titre et le nom du premier auteur et le lien vers la notice complète) et à droite, offrent des fonctionnalités parfois redondantes (navigation par pagination à gauche, que l’on peut effectuer aussi à l’aide de la petite case indiquant le numéro de la page affichée – pour les pages numérotées) ou inutiles (navigation par vignettes, dans ce type d’ouvrage non illustré où elles se ressemblent toutes). Le mode « pleine page » (appelé ailleurs « plein écran » et équivalent à celui de Google Books) agrandit la zone – y compris le vide qui l’entoure – tout en faisant disparaître la plupart des fonctionnalités des zones qui entourent la page. Le résultat, meilleur, n’est toutefois pas comparable en qualité à celui du mode normal (non zoomé) de Google Books. Gallica propose des liens explicites (« permaliens ») vers l’ouvrage ou vers la page affichée (dans la zone de droite).

La comparaison des « modes texte » dans les deux versions est intéressante : Google Books propose, à chaque écran, le texte correspondant à cinq pages de l’original, et préserve la mise en page au niveau des paragraphes, tandis que Gallica propose le texte page par page, en préservant la mise en mage au niveau des lignes du texte. La qualité de la reconnaissance est aussi différente – si Google Books n’affiche pas le taux, on peut tout de même constater que le résultat est assez bon ; Gallica indique, en haut de page, que « le texte affiché peut comporter un certain nombre d’erreurs » – c’est le cas – et que « le taux de reconnaissance (…) est de 68,19%. »

Pour paraphraser le Sieur Le Gallois, on conclura qu’il n’importe pas d’avoir beaucoup de livres dans une bibliothèque numérique, mais il importe de les avoir bien numérisés.


1. La circonférence de la Terre était connue assez précisément depuis l’Antiquité : elle avait été déterminée par Ératosthène de Cyrène. La mesure qu’en donne Porney – sept mille cinq cent lieues de France – est curieuse, puisqu’il découlerait la lieue de France valait pour lui 40.000/7.500 = 5,3 km, ce qui se rapproche bien plus de la lieue marine (5,5 km) que de la lieue de France (unité variable, qui valait alors un peu moins de 4 km).

2. Google Books n’est pas parfait : on a cite ailleurs des cas de métadonnées particulièrement curieuses, et l’on peut voir ci-dessous deux pages de cet ouvrage dont la numérisation a échoué (avec pour preuve flagrante, pour celle de gauche, que le tourne-page était humain). Mais en général, la qualité est au rendez-vous. Ce genre de problème démontre, s’il le fallait, que le numérique ne doit pas être considéré comme l’unique moyen de conservation à long terme : la préservation de l’original est primordiale. Il démontre aussi le danger d’une stratégie de numérisation qui voudrait éviter, pour des raisons d’économie, de numériser un document qui l’aurait déjà été ailleurs : imaginez qu’un hapax se trouve dans la page d’un livre mal numérisé, mais dont il n’existerait qu’un seul et unique exemplaire numérique : il sera impossible de trouver ce mot. Raison de plus de l’importance de l’existence de bibliothèques numériques concurrentes…

4 novembre 2009

Du progrès, ou, quand le mieux est l’ennemi du bien

Classé dans : Livre, Sciences, techniques — Miklos @ 1:12

Il y a trois ans, j’avais découvert avec émerveillement un logiciel à usage domestique (voire professionnel, pour petites bibliothèques), Book Collector, qui m’avait permis de cataloguer en très peu de temps quelque 4.500 des livres de ma bibliothèque personnelle. Facile d’utilisation, rapide, il suffisait de lui fournir un minimum d’informations – le code ISBN, ou, à défaut, le titre et l’auteur de l’ouvrage – et il rapatriait tout aussi rapidement nombre d’informations en provenance de sources que je pouvais sélectionner dans une liste : bibliothèques nationales (BnF, Bibliothèque du Congrès…), librairies en ligne (Amazon, Barnes and Noble…)… Ces informations (nombre de pages, édition, langue, traducteur, éditeur, date de publication…, image de couverture, résumé) – parfois complémentaires, parfois contradictoires – pouvaient être retenues ou non, fusionnées, complétées à partir de mon exemplaire, pour être finalement enregistrées sur mon disque dur.

Las, ce logiciel s’est perfectionné, et en ce faisant, a perdu de sa souplesse, de sa rapidité, de sa précision et de son originalité – et donc, pour moi du moins, de son utilité.

Tout d’abord, la version actuelle ne permet plus de choisir les sources d’information : tout provient d’une seule et même base de données, celle de l’éditeur du logiciel. Hier, il s’est passé ce que j’avais prévu en apprenant cette « évolution » : un dysfonctionnement de cette base m’a empêché d’effectuer correctement le catalogage, certaines données n’étant plus rapatriées après un temps de latence insupportable. Ce phénomène ne pouvait se passer précédemment, lorsque de multiples sources distinctes étaient consultées indépendamment.

À long terme, cette nouvelle orientation consacre la dépendance absolue de la fonctionnalité de catalogage du logiciel sur l’existence de ce service centralisé fourni par l’éditeur : s’il décide de l’arrêter, ou si la société est rachetée ou disparaît, le logiciel ne permettra plus de cataloguer de nouveaux ouvrages. C’est contraire à un certain esprit du temps – celui des logiciels libres ou ouverts – mais bien dans la lignée de certains services qui forcent l’exclusivité (à l’instar de Google Books, qui ne permet pas l’indexation de ses contenus par d’autres moteurs de recherche que le sien).

Je ne sais d’où proviennent les contenus de la base de l’éditeur, mais elle est lacunaire (des six premiers ouvrages catalogués hier, deux n’ont pas été identifiés, et pourtant ce sont des ouvrages relativement récents). Pire, la qualité des informations y est médiocre : noms incomplets (par exemple, S. Zweig au lieu de Stephan Zweig), sous-titres non identifiés en tant que tels (mais accolés aux titres), graphie approximative (majuscules là où il n’en faut pas), nombre de pages de l’ouvrage et date de publication souvent incorrects ou correspondant à une autre édition, manque d’information à propos de la collection, des parties de l’ouvrage (titres des nouvelles le constituant, par exemple), des contributeurs (traducteur, éditeur scientifique, etc.). La correction de ces informations avant l’enregistrement dans mon catalogue s’en trouve donc singulièrement rallongée.

Un malheur n’arrivant jamais seul, j’ai constaté un ralentissement très significatif dans le fonctionnement du logiciel : lorsque l’on clique sur l’intitulé d’un livre dans le catalogue, il faut attendre plusieurs secondes jusqu’à ce que la notice correspondante s’affiche, tandis qu’auparavant cette ouverture était immédiate. Encore un facteur de ralentissement de la procédure de catalogage et de frustration.

Le support semble aussi quelque peu dépassé par les événements : auparavant, les réponses étaient quasi immédiates et pertinentes. Lorsque j’ai envoyé quelques remarques à propos de mes récents constats, les retours ont omis de répondre à certains points qui devaient les fâcher (par exemple : la baisse de qualité dans les informations rapatriées à partir de leur base). Pire, la réponse concernant le dysfonctionnement du nouveau lecteur de codes à barre que je venais d’acheter chez eux était erronée et aberrante : selon eux, il fallait changer les options régionales et linguistiques de l’ordinateur pour les fixer à « Anglais (US) » pour que ce lecteur fonctionne… M’étant adressé alors directement au constructeur du lecteur, j’ai reçu quelques heures plus tard la démarche à effectuer pour paramétrer le lecteur afin qu’il fonctionne correctement.

Si, alors, je conseillais bien volontiers l’utilisation de ce logiciel, ce n’est plus le cas  les récentes évolutions sont apparemment destinées à faciliter l’usage du logiciel pour le grand public – le moins de choix, de clicks et d’interventions manuelles possible – au dépens d’une certaine qualité (ou d’une qualité certaine) de l’information. Pour l’éditeur, ce qui compte surtout pour la majorité de sa clientèle, ce sont les rajouts d’image de couverture, de résumé, et tout autre choix n’est qu’une posture idéologique rétrograde. Pour ma part, je ne sais encore si je suis condamné à continuer à m’en servir au vu du volume de données que j’y ai déjà saisi, ou aurai-je la chance de trouver une alternative plus fonctionnelle vers laquelle je pourrai migrer. J’ai commencé à chercher.

27 août 2009

De quelques bibliothèques numériques

Classé dans : Actualité, Livre, Sciences, techniques — Miklos @ 12:58

Quelques grands projets visent à mettre en ligne le patrimoine culturel français, européen ou mondial. Un petit tableau tente de mettre en regard quelques-unes des caractéristiques de quatre d’entre eux (pour autant que l’on puisse comparer). Les chiffres, quand il y en a, sont ceux qui sont affichés ou annoncés sur leurs sites respectifs.

Ces quatre projets n’ont pas été choisis au hasard : ils concernent tous, directement ou non, le patrimoine écrit français et font l’objet de l’intérêt actuel (qui est en général passager…) des médias :

· Gallica, mis en œuvre par la Bibliothèque nationale de France, et qui comprend une partie croissante de ses fonds numérisés ;

· Culture.FR, portail des collections patrimoniales françaises, mis en place par le ministère de la culture et de la communication ; il permet de localiser des documents détenus par les bases qu’il indexe (et donc d’y accéder via ces bases directement), d’une part, et a vocation de fournir les informations qu’il a collectées à Europeana ;

· Europeana, portail de la culture en Europe, projet en cours soutenu par l’Union européenne ; à l’instar du portail français, il est destiné à permettre de localiser des documents détenus par les bases qu’il indexe ;

· Google Books, qui comprend des livres numérisés provenant de grands fonds internationaux (principalement : bibliothèques) ; ce n’est pas un portail : les documents numériques sont stockés dans leur système.

Ce ne sont pas les seuls projets de ce genre : la Bibliothèque numérique mondiale est un projet culturellement et techniquement ambitieux porté par la Bibliothèque du Congrès. Il qui ne semble pas viser, a contrario, une exhaustivité ou une volumétrie aussi importante que ces quatre projets. Il est intéressant de trouver parmi leurs donateurs Google et Microsoft…

On n’insistera jamais trop sur la différence fondamentale – même si elle n’est pas directement visible pour l’utilisateur – entre une bibliothèque numérique au sens strict du terme et un portail : la première détient les documents que son moteur référence : elle peut donc en assurer un référencement, une présentation et un contrôle d’accès uniformes, et, le cas échéant, en indexer aussi les contenus (textuels, mais pourquoi pas image, vidéo ou musique).

Un portail s’apparente à un moteur de recherche : il ne détient pas de documents, mais uniquement les informations concernant des documents – qui peuvent être très sommaires (titre et auteur, par exemple) ou détaillés, allant jusqu’à l’indexation du contenu de ces documents, ce qui nécessite de sa part de les récupérer temporairement pour en extraire ce type d’information (ou, ce qui est moins commun, que le détenteur la lui fournisse). Le contenu n’étant pas stocké « dans » le portail, le lecteur n’est pas assuré d’y avoir toujours accès, même s’il y a trouvé une mention (c’est le même cas pour un moteur de recherche, qui peut répondre à une requête en indiquant un site, mais que, lorsqu’on clique pour y accéder, on s’aperçoit que le site a disparu ou n’est pas accessible ou a changé).

Autre détail qui ne manque pas d’importance, dans le contexte actuel : le fait qu’une bibliothèque numérique (comme Gallica, Google ou la Bibliothèque numérique mondiale) soit accessible sur l’internet n’implique pas forcément que ses documents soient référencés (ou indexés) par tel ou tel moteur de recherche ; et, s’ils le sont, que leur contenu (le texte du livre, par exemple) y soit aussi indexé, en sus des informations les concernant (titre, auteur…). C’est ainsi que les contenus des livres de Google Books sont indexés dans le moteur de recherche de Google – mais pas ailleurs… Ceci a pour conséquence de « forcer » l’internaute qui recherche des ouvrages à aller interroger soit le moteur Google, soit Google Books.

18 août 2009

« Quand Google défie l’Europe »

Classé dans : Actualité, Livre, Sciences, techniques — Miklos @ 8:36

…il finit par gagner, contrairement à ce que souhaitait l’ex président de la Biblio­thèque nationale de France, Jean-Noël Jeanneney.

Ses prises de position, de principe (essentiellement : ne pas laisser s’instaurer une seule source – et d’autant plus commerciale –, donc forcément hégémonique, pour la diffusion du patrimoine culturel sur l’Internet) avaient amené à la mise en place du projet Europeana, qui vise à mettre en ligne un volume important du patrimoine culturel européen numérisé : livres, bien entendu, mais aussi images (tableaux, estampes…), musique et vidéo. Ce n’était pas une opposition absolue à Google, dont la BnF avait discrètement adopté le moteur de recherche, mais là c’est un revirement stratégique (résultant de considérations financières) et la BnF se rend à Canossa : selon La Tribune d’aujourd’hui (dixeunt Reuters et d’autres sources), la BnF serait en négociation avec Google pour numériser son patrimoine, suivant ainsi l’exemple – tant décrié à l’époque – de la bibliothèque municipale de Lyon.

Il sera intéressant de voir, si cette négociation aboutit, comment la bibliothèque numérique de la BnF, Gallica, évoluera : en volumétrie (qui n’avait pas beaucoup crû pendant longtemps) mais surtout en qualité (de la numérisation, des accès aux contenus – ergonomie et fonctionnalités). Et, par contrecoup, Collections, le portail des collections patrimoniales françaises mise en place par le ministère de la culture et de la communication, puis, de là, Europeana elle-même, que cette base est censée nourrir.

Le cercle est bouclé : Europeana, ayant émergé « contre » Google, sera consolidée par des contenus produits par ce qui se positionne comme « la » bibliothèque numérique mondiale. Finalement, Jeanneney avait raison…

Cette démarche s’inscrit dans la logique économique actuelle, celle de l’évolution vers une société de services : la BnF, n’ayant pas les moyens de s’offrir une numérisation maison, fait appel aux services (reconnus pour leur efficacité et pour leur qualité) de Google. Quant aux lecteurs, ils réduiront leurs achats de livres (qu’ils empruntaient déjà, pour certains), tout en augmentant leurs acquisitions du droit de les lire en ligne (triste cure d’amaigrissement pour les bibliothèques personnelles et publiques…), comme ça l’est déjà le cas pour la musique enregistrée ou les films. Résultat : les éditeurs réduiront d’autant plus leur production papier la demande baissant, cercle vicieux – ou plutôt spirale – dont on peut craindre les effets sur la disponibilité future de l’objet livre, dont la durée de vie sur les étagères de librairies se raccourcit, à l’instar de la présence de (bons) films sur nos écrans après leur sortie. On nous objectera que l’impression à la demande – à l’unité ! – s’y substituera. Le prix en sera sans doute plus élevé que celui d’un livre imprimé en série, mais surtout, la qualité de l’objet lui-même – du papier, de la couverture, de l’encre – ne sera plus au rendez-vous.

Il en est déjà ainsi aussi pour des usages plus matériels : si l’on pouvait louer quasiment de tout pour une certaine durée, il est de plus en plus possible de le faire à l’usage, pour les bicyclettes par exemple (les vélibs), et on nous le promet bientôt pour les voitures (les autolibs ?). Cette disparition annoncée de la propriété est un autre clin d’œil ironique à l’histoire et on ne peut résister au plaisir de faire appel à Google Books pour afficher l’origine de la célèbre phrase « Qu’est-ce que la propriété ? C’est le vol. »

Cette tendance à déléguer à plus compétent/capable que soi peut encou­rager non seulement les monopoles, mais la diminution de la créativité inhérente à la diversité. Érigée en principe, les effets pervers de cette démission (voire dé-mission) ne tarderont pas à se faire sentir : plus besoin d’apprendre à jouer du piano, de composer de la musique, d’écrire des poèmes, de photographier, de faire du théâtre en amateur – il y en a qui le font mieux ; l’amateur n’a plus de place face au professionnel, et le « petit » professionnel n’en a pas face au plus grand. C’est la place assurée à l’uniformisation et au nivellement. Et à la domination de tous par des « boîtes » hyperspécialisées. Brave New World.

The Blog of Miklos • Le blog de Miklos