Miklos
« Je donne mon avis non comme bon mais comme mien. » — Michel de Montaigne

This blog is © Miklos. Do not copy, download or mirror the site or portions thereof, or else your ISP will be blocked. 

11 novembre 2005

Le difficile passage à l’acte

Classé dans : Livre, Sciences, techniques — Miklos @ 19:02

La presse se fait écho de la décision de la British Library de faire affaire avec Microsoft, pour la numérisation de « 25 millions de pages de contenus courant 2006 ». Même si «  [l]a Grande-Bretagne offrira bientôt un nombre d’ouvrages numérisés équivalent à celui que propose dès à présent Gallica, la bibliothèque numérique de la BnF », comme le dit le communiqué de la BnF, il est probable que la technologie qui sera utilisée permettra d’y effectuer des recherches et de consulter les contenus de façon bien plus aisée et efficace que ne le permet Gallica (quand bien même cette belle entreprise ne date pas d’hier, déjà alors des critiques s’étaient élevées – dont la mienne – concernant certains choix).

Microsoft a des atouts certains, et pas uniquement financiers ou technologiques : du côté scientifique, Stephen Robertson, grand spécialiste de la recherche dans les contenus, dirige le groupe Information Retrieval and Analysis au laboratoire de recherche de Microsoft à Cambridge. L’entreprise a d’ailleurs décidé de rendre visible et plus européenne son activité de recherche (à l’heure où d’autres entreprises se « délocalisent » en quittant la France), puisqu’elle s’est accordée avec l’Inria pour ouvrir un centre de recherche commun dans un laboratoire près de Paris qui accueillera une trentaine de chercheurs.

L’ouverture de Microsoft vers des secteurs qui ne sont pas si marchands que ça vaut la peine d’être étudiée : son alliance, au sein de la Open Content Alliance, avec l’Internet Archive ne va-t-elle pas couper l’herbe sous le pied d’un autre projet national, celui de l’archivage du Web, qui risque de devenir caduc si une, ou des, archives fiables et efficaces du Web se constituent rapidement ?

On ne peut évacuer l’aspect temporel des projets de cette nature, en invoquant la nécessité de réfléchir et de choisir avant d’agir. Il est d’ailleurs peu probable que la British Library n’ait pas réfléchi (ni, d’ailleurs, les universités qui avaient choisi de faire l’affaire avec Google). Mais il semble que la France ait souvent une difficulté quasi organique de passer de la réflexion (qui est souvent fort brillante) à l’action (dans ce domaine comme dans d’autres), de traduire des principes théoriques en projets concrets et réalistes ; comme il n’y a pas de brevets sur les annonces et les idées, il ne faut pas s’étonner de se faire damer le pion dans de telles circonstances.

Dans un article publié en mai, j’analysais la démarche de Google et j’évoquais la nécessité de travailler en réseau plutôt que sous forme d’une organisation monolithique (pour toutes sortes de raisons – l’efficacité en étant une) – celle qui semblait émerger autour du projet d’une bibliothèque numérique européenne. Il n’est toujours pas clair, d’ailleurs, ce qui se fait en France et en Europe dans ce domaine, les signaux publics étant souvent contradictoires : comité français ? groupe[s] de bibliothèques nationales ? et la récente annonce, que j’avais relayée, des plans de la Commission européenne « pour créer des bibliothèques numériques européennes », critiquant les « efforts dispersés » d’initiatives dans les états membres ?

Si, en mai, je pouvais conclure en disant « Entre temps, Google avance », depuis, d’autres ont avancé au-delà des effets d’annonce. Il n’est pas étonnant que la British Library ait décidé de passer à l’acte.

3 octobre 2005

Numérisation du patrimoine culturel : la commission européenne s’en mêle

Classé dans : Livre, Sciences, techniques — Miklos @ 10:49

La Commission européenne a annoncé le vendredi 30 septembre 2005, « ses plans pour créer des bibliothèques numériques européennes » afin de « rendre le patrimoine écrit et audiovisuel de l’Europe accessible sur l’internet ». Trois domaines d’action sont identifiés : « la numérisation, l’accessibilité en ligne et la conservation numérique ». Une consultation en ligne est lancée jusqu’au 20 janvier 2006 pour « recueillir des commentaires sur une série de questions » dans le but de parvenir à « une proposition de recommandation relative à la numérisation et la conservation numérique » d’ici juin 2006. Les résultats de cette consultation seront notamment « exploités » dans le cadre de « l’examen des règles relatives aux droits d’auteur dans l’Union européenne », prévu en 2006, et de la « mise en œuvre des programmes communautaires de recherche et de développement », prévue pour 2007.

« Rendre les fonds des bibliothèques et des archives de l’Europe disponibles sur l’internet n’est pas une mince affaire », souligne la Commission. Il s’agit de numériser des documents « de natures très diverses » (supports écrit, photo, audio, vidéo – enfin ! on ne pense plus qu’au texte, il était temps) choisis parmi les quelque « 2,5 milliards de livres et de périodiques reliés dans les bibliothèques européennes » et les millions d’heures de films et de matériel vidéo « qui se trouvent dans les archives audiovisuelles des organismes de radiodiffusion » (et ailleurs, alors ?). La Commission note que « plusieurs initiatives ont déjà vu le jour dans les États membres (tiens, où ça ?), mais cela se fait en ordre dispersé ». Une politique commune, qui associerait le secteur privé, doit donc permettre d’« éviter de créer des systèmes incompatibles entre eux, et de faire deux fois le même travail ».

17 mai 2005

Quand sortira-t-on du virtuel pour entrer enfin dans le réel…

Classé dans : Livre, Progrès, Sciences, techniques — Miklos @ 9:20

Il existe un tableau de Klee qui s’intitule Angelus Novus. On y voit un ange qui a l’air de s’éloigner de quelque chose qu’il fixe du regard. Ses yeux sont écarquillés, sa bouche ouverte, ses ailes déployées. C’est à cela que doit ressembler l’Ange de l’Histoire. Son visage est tourné vers le passé. Là où nous apparaît une chaîne d’événements, il ne voit, lui, qu’une seule et unique catastrophe, qui sans cesse amoncelle ruines sur ruines et les précipite à ses pieds. Il voudrait bien s’attarder, réveiller les morts et rassembler ce qui a été démembré. Mais du paradis souffle une tempête qui s’est prise dans ses ailes, si violemment que l’ange ne peut plus les refermer. Cette tempête le pousse irrésistiblement vers l’avenir auquel il tourne le dos, tandis que le monceau de ruines devant lui s’élève jusqu’au ciel. Cette tempête est ce que nous appelons le progrès.

Walter Benjamin, Œuvres III,
Folio essais, 1991, p. 434.

La tempête de Google nous pousse tous ; dans quelle direction, ce n’est pas clair, mais un monceau de ruines menace de s’amasser sur les traces de ce tsunami annoncé. En effet, dans sa dernière lettre1 FYI France, Jack Kessler fait part des intentions avérés de cette société, annoncées lors de la réunion de ses actionnaires dont il fait partie, d’une façon très synthétique:

printed books GooglePrint
printed journals GoogleScholar
video, & movies (?) GoogleVideo
music (hints of « under development »)
mobile GoogleMobile
meetings GoogleGroups
shopping Froogle & GoogleLocal
personal communication Gmail & GoogleBlogger
& GoogleTranslate & GoogleGroups
& Orkut(?) & Dodgeball(?)…
digital social networking
reference librarians GoogleSearch
prints & photos GoogleImages & Picasa
maps GoogleMaps & Keyhole
the news GoogleNews
(others?) (many more…)

dans ce qui porte déjà le nom de The Onebox, la Case Universelle, qui représente ce qu’Eric Schmidt, PDG de Google, décrit comme l’objectif de sa société : « Organize the world’s [all of it] information [all of it] so it will be universally [to everyone] accessible [via all ‘devices’] and useful… » – y concentrer toute l’information du monde pour un accès universel. Et cela ne manquera pas de rapporter encore plus gros aux investisseurs qui pourraient s’inquiéter sur une possible orientation philanthropique de « leur » entreprise (comme le dit Jack : « investors always want to know whether they are funding a charity or a money-making enterprise ») : tous ces développements ne feront qu’accroître les revenus, et « If you do business with Google you will pay: the lunch will be delicious, but it will not be free » (si vous faites affaire avec Google, vous payerez; le repas sera délicieux, mais il ne sera pas gratuit).

Cela a le mérite d’être clair: après les ordinateurs (IBM), les logiciels (Microsoft), voici l’information (Google). Avec plus de 3000 employés et recrutant à tour de bras, Google est en passe de réussir encore mieux dans son entreprise. Ils veulent changer la face du monde (câblé) comme l’ont fait leurs prédécesseurs.

Et pourtant, le grand auditorium de la BnF était assez vide, lors de la table ronde professionnelle Les bibliothèques virtuelles européennes : état de l’art et stratégies qui s’est tenue vendredi dernier de 14h à 18h, malgré l’annonce qui en avait été faite ici et ailleurs. Manque d’intérêt ? Fatalisme ? Difficile à dire. Il se peut, comme le disait Chris Batt (du Conseil des musées, bibliothèques et archives du Royaume Uni) qu’il ne faille pas réagir – et surtout pas dans l’urgence. Mais il me semble que sa vision utopique de l’intégration du savoir dans la vie au quotidien risque d’être dépassée par les événements actuels, en l’occurrence le projet concret de Google, même si je ne critique en rien les objectifs qu’il propose, bien au contraire.

Outre la paucité de public, j’ai été frappé par la différence d’échelle qui existait entre les tailles – et les moyens – des bibliothèques nationales représentées et des projets qu’ils pouvaient mettre en œuvre, de Gallica (par exemple) à la collection de la photothèque de la bibliothèque nationale d’Irlande qui, par manque de personnel et de moyens technique, avait dû en sous-traiter la numérisation ; par la fragmentation et le manque de coordination nationale dans certains pays et a fortiori internationale, malgré des projets tels que Minerva, en ce qui concerne la réalisation d’une bibliothèque numérique virtuelle (et non pas uniquement d’un catalogue commun de contenus numérisés, comme l’est actuellement le projet The European Library) ; par l’inertie que la taille de certains organismes fait poser sur l’évolution de leur vision hégémonique du monde.

Jean-Noël Jeanneney, qui a ouvert cette table ronde, a bien posé les enjeux européens et multilatéraux de diffusion, de défense et d’illustration de la culture (pour lesquels nous avons tous besoin les uns des autres) ainsi que ceux de l’organisation du savoir (où le rôle des bibliothécaires est plus que jamais nécessaire), afin de dépasser une perspective uniquement anglo-saxone et profit-making, ce qui n’exclut en rien de s’accommoder et de tirer profit des technologies, ni d’articuler un tel projet sur un partenariat entre le public et le privé. Mais le projet qu’il évoque est encore flou : s’agit-il d’une sorte de bibliothèque nationale européenne, réunissant les fonds numériques des bibliothèques nationales de chacun des pays, ou la bibliothèque des européens, fédérant [toutes] ses bibliothèques, petites ou grandes ?

L’histoire se répète : dans les années 80, le réseau de communication informatique Bitnet (qui avait émergé d’un immense réseau interne à IBM) possédait une structure essentiellement pyramidale (ou arborescente) ; il finit par être détrôné par le réseau TCP/IP (l’internet actuel), qui possède un maillage bien plus libre. Aujourd’hui, toute personne ou organisme peut se raccorder à ce réseau, pour peu qu’elle ait les logiciels adéquats (et un fournisseur d’accès). Les ordinateurs qui s’y trouvent, même les plus petits, peuvent être utilisés dans leur temps libre pour des finalités collaboratives à l’échelle mondiale tels que les prédictions atmosphériques (le projet climateprediction.net), ou la recherche de pulsars par l’entremise de logiciels tels que BOINC.

Je verrai bien la bibliothèque européenne du futur sous forme d’un réseau dynamique permettant le raccordement de bibliothèques petites et grandes – certifiées, c’est essentiel (autant pour la « validité » des fonds que l’adéquation technique) –, avec leurs fonds numérisés (qu’ils auraient constitués selon leurs propres critères), s’intégrant facilement dans un maillage (utilisant probablement des protocoles de type OAI plutôt que Z39.50) qui offrirait, entre autres outils, recherche dans les contenus et accès réparti (DOI ?) à l’ensemble des fonds ainsi disponibles, de façon répartie.

Je préférerais bien évidemment ce modèle plus dynamique à celui dans lequel les petites institutions auraient à « déléguer » leurs fonds numériques à de plus grandes institutions, qui seraient les seules à décider du choix des documents qui feraient partie de « la » collection européenne – qui n’est pas sans rappeler le modèle que semble viser actuellement Google pour les fonds universitaires qu’il veut numériser et héberger. Un tel modèle ne réduit pas le rôle des bibliothèques nationales, plus à même d’établir un tel dispositif (ouvert, et qui ne se réduise pas uniquement à elles), et qui ont la charge et les moyens de conservation (physique et numérique) à long terme pour assurer la pérennité du patrimoine (en utilisant, pour le numérique, OAIS par exemple).

À l’inverse, je le préfère aussi à celui de Jacques Attali, qui débattait hier sur ce sujet avec Jean-Noël Jeanneney sur France Culture, et qui défendait essentiellement le modèle Google, dans une vision idyllique du livre numérique disponible partout, qu’on lit en payant à la carte et qu’on imprime chez soi (bonjour le prix du papier et la mort plus rapide des forêts), l’internet devenant la bibliothèque du futur hors toute autorité centralisée, et sur laquelle je m’étais déjà exprimé il y a plusieurs années.

Entre temps, Google avance.


1 Datée du 15 mai 2005 [note du 11 novembre 2005].

22 février 2005

À propos de la fusion des archives nationales du Canada et de la Bibliothèque nationale du Canada en 2004

Classé dans : Livre, Sciences, techniques — Miklos @ 16:15

J’ai retrouvé récemment – pas plus tard que ce weekend – un texte que j’avais envoyé à biblio-fr en 1999, et dans lequel j’écrivais :

[...] avec ces nouvelles technologies, qui permettent de mettre à disposition du public des archives numérisées, la distinction devient plus floue (entre « bibliothèque numérique » et « archives numériques »). [...] Sur la question des contenus, il faudrait parler alors non seulement des fonds mais des « archives » (mémoire, richesse patrimoniale), et se demander si un des apports intéressants des nouvelles technologies ne serait pas celui qui mènerait vers une plus grande convergence entre ces deux concepts [...] Seule cette convergence peut faire de cette mémoire une mémoire active, la rendant accessible et mise dans le contexte avec la création intellectuelle permanente.

Je ne peux me retenir de citer ici une des réactions que ce texte avait entraînée :

La notion de fonds est différente dans les archives et dans les bibliothèques et il n’y a pas lieu de les rapprocher, encore moins de les confondre. [...] Les archives sont d’abords établies pour des raisons d’authenticité, de preuve, de fonctionnement. Ce n’est pas l’archiviste qui les constitue : s’il le faisait celà, il serait un véritable faussaire : il fabriquerait des preuves, tout simplement. En celà, les métiers d’archivistes et de bibliothécaires sont irréductiblement opposés. [...] On n’est pas dans « Fondation » ou la confusion est partout présente au fil de chaque tome.

L’annonce venant du Canada marque bien l’évolution pragmatique d’une vision rigoriste (et idéaliste), et de la mutation des techniques, voire des métiers, qui permettent de dépasser une compartimentalisation parfois extrême, dont bien de bibliothèques font encore les frais (pour des raisons historiquement compréhensibles mais qui demandent à être revues) ; ainsi, faut-il classer enregistrements sonores et partitions musicales en des lieux distincts, qui empêchent l’écoute des uns en lisant les autres ? Et ne serait-il pas plus utile, pour le chercheur comme pour le lecteur, de réunir les archives d’un compositeur – les traces de sa vie – avec les traces de sa création ? Ce ne sont que des exemples, et bien d’autres domaines bénéficieraient de tels rapprochements, virtuels s’il le faut – et les archives ne se limitent pas à l’écrit, quid des archives sonores ?

[publié à l'origine dans Biblio-FR à la suite d’un article qui rapportait cette fusion]

30 janvier 2005

[Traçabilité]

Classé dans : Progrès, Sciences, techniques, Société — Miklos @ 20:05

Dès qu’il y a connexion, il y a possibilité de traçabilité entre le poste qui se connecte et le serveur, en interne comme en externe (via des logs TCP/IP, des logs de cache, etc., pour ceux qui connaissent la techique). Le numéro IP (qui apparaît aussi dans les mails) permet de remonter souvent à l’auteur…

Pour ceux qui étudient l’évolution de la technique (et plus généralement de systèmes formels), ce qui arrive est inévitable : le développement du numérique et de la massification imposent une traçabilité accrue, et à la clé l’identification de l’individu, comme mode de contrôle de « la machine » et de ses rouages. C’est aberrant quand on pense qu’il y a 60 ans on tatouait déjà des individus…

(Texte publié originalement dans un forum et recopié ici verbatim sans les commentaires outrés qu’il a suscités).

The Blog of Miklos • Le blog de Miklos