Miklos
« Je donne mon avis non comme bon mais comme mien. » — Michel de Montaigne

This blog is © Miklos. Do not copy, download or mirror the site or portions thereof, or else your ISP will be blocked. 

28 juin 2008

L’envers du miroir

Classé dans : Lieux, Peinture, dessin, Sciences, techniques — Miklos @ 4:39

« Inutile de dire que la correspondance avec ce Batave en est restée là. » — Léon Bloy, Journal, 1898 (cité par le Trésor de la langue française).

« … les noms communs ne collent jamais avec les noms propres ; il n’y a pas de (…) chinois à l’eau-de-vie en Chine, de chapeaux bangkoks à Bangkok, ni de panamas à Panama, ni de salade dit batavia à Batavia. » — Paul Morand, Le Voyageur et l’amour, 1932 (cité par le TLF).

La haute gastronomie n’est pas le trait le plus caractéristique des Pays-Bas : sa cuisine comprend surtout pain, fromage, soupe, saucisses, croquettes… une abondance de laitages et de féculents qui n’est pas pour surprendre dans une région couvertes de vaches et de moulins (dont la fonction n’est pas uniquement de diffuser dans l’atmosphère le méthane produit par ces augustes dames qui contribuent de façon significative non seulement à la table hollandaise mais à l’effet de serre). On connaît en France surtout la sauce hollandaise, mais il y a tout de même deux spécialités que nous n’hésiterons pas à qualifier de particulièrement savoureuses et dont on a abusé avec délice lors de notre dernier passage à La Haye.

La première s’achète dans des kiosques que l’on trouve partout : il s’agit du matje, « hareng vierge (sans œufs ni laitance) ayant une teneur en graisse élevée (…), produit purement naturel auquel il n’est ajouté que du sel après la mise en caque »1. Il est vendu débarrassé de sa tête, de sa peau et de son arrête centrale, ses deux filets ne tenant plus qu’à la queue. Pour le déguster – car c’est une réelle dégustation – on s’en saisit par l’appendice caudal, on rejette la tête en arrière la bouche grande ouverte tel Caruso avant le lancement d’un contre-ut et on y fait glisser graduellement le poisson jusqu’à ingestion complète (hormis la queue)2. Sa chair est tendre sans être molle, grasse mais pas huileuse, et très légèrement salée – juste assez pour en relever la saveur. Le procédé de préparation du hareng date, selon la tradition, de 1380 : lorsqu’on le vide, on y laisse le pancréas, dont les enzymes participent au « mûrissement » de la chair tout en conservant ses vertus (vitamine D, calcium, sels minéraux) et le rendent particulièrement digeste. La saison de la pêche du hareng s’ouvre annuellement, fin mai, par un festival, Vlaggetjesdag, au cours duquel les bateaux quittant le port de Scheveningen – banlieue de La Haye – sont décorés de drapeaux (d’où le nom, jour du drapeau).

Ceux qui hésiteraient à gober des poissons et se priveraient ainsi à leur insu d’une délicatesse à l’égal du gravlax peuvent se rabattre sur les Hopjes : ce sont des petits caramels durs au café en forme de cube aux arrêtes arrondies. On peut les sucer pour en savourer lentement le goût ou les croquer vaillamment et rapidement. Ils ne collent pas aux dents et ne ramollissent pas. Leur invention est attribuée au baron Hendrik Hop qui était accro au café. La légende raconte qu’un soir il oublia sa tasse de café sucré à la crème sur le four. Le lendemain, il y trouva un caramel au café fort bon. Quand son médecin lui ordonna de ne plus boire du café, il demanda à son voisin confiseur de lui fournir ces nouveaux bonbons. C’était à La Haye dans les années 1800. Leur succès ne se fit pas attendre, et ils s’exportèrent dans les cours royales d’Europe et chez le Tsar. Pour éviter qu’ils ne s’altèrent en route vers les Indes néerlandaises (l’actuelle Indonésie), on inventa une boîte en métal caractéristique. À ceux qui insisteraient à s’en priver pour conserver la ligne, on conseillera Hopjes et Hopjes, ballet-pantomime de François Ambrosiny sur une musique de Georges Lauweryns (Bruxelles, 1910)

La Haye se distingue aussi par plus d’un musée remarquable. On avait récemment été saisie par la magie du Panorama Mesdag qui nous avait transporté sur la plage de Scheveningen il y a cent ans ; cette fois-ci, on a été ravi par les mondes impossibles et pourtant si logiques de M. C. Escher : si l’on en connaissait les œuvres les plus renommés depuis fort longtemps, le musée qui lui est consacré, situé dans un palais qui avait été habité par la famille royale, regroupe l’essentiel de son œuvre. On peut y admirer les lithographies et les esquisses, explorer des scènes où plusieurs points de vue simultanés s’enchevêtrent avec une habilité magique, admirer la complexité des formes géométriques abstraites qui s’imbriquent à l’infini, s’émerveiller devant des êtres étranges qui marchent puis s’enroulent sur eux-mêmes pour progresser tels une roue (les curl-up) ou ces reptiles qui montent paresseusement sur un livre, s’arrêtent pour souffler sur un dodécaèdre, puis en redescendent et se fondent dans le papier posé sur la table pour en émerger plus loin dans une sorte de cycle perpétuel…

Son univers de contrastes – blanc et noir, jour et nuit, ange et démon – n’est pas manichéiste, bien au contraire : c’est aussi celui des compléments et du continu qui réunit ces extrêmes, à tel point qu’on ne sait plus vraiment quand l’un devient l’autre et inversement. Villes, maisons, animaux, hommes, objets – tout devient, sous son crayon, sujet à transformation et à transmutation : un vol d’oiseaux noirs sur un ciel clair se transforme sous nos yeux en celui de colombes dans la nuit, le tableau accroché dans une galerie de peinture englobe la galerie et la ville qui l’entoure… Le regard est porté par ce mouvement et ne peut s’arrêter et l’esprit est confronté à la représentation de l’improbable : on sait que cela ne peut être, et pourtant on le voit et cela se tient.

Tout s’explique mathématiquement – pavage, géométrie hyperbolique, rubans de Moebius ou bouteilles de Klein… – mais voilà, Escher n’avait quasiment aucune connaissance en mathématiques, et ses réalisations n’en sont que plus merveilleuses. C’est ce qu’avait constaté Donald Coxeter, l’un des plus grands géomètres du xxe siècle. Ce don extraordinaire rappelle, à certains égards, celui de Râmânujan, autodidacte indien qui produisit dans les années 1900 une somme impressionnante de résultats en théorie des nombres sans démonstration et, probablement, par une intuition quasi inhumaine. Il attira l’attention du grand mathématicien Hardy qui collabora avec lui. Certaines de ses découvertes n’ont trouvé que récemment des applications dans des domaines tels que la cristallographie et la théorie des cordes, bien longtemps après la disparition de leur inventeur.

Mais Escher ne donne pas que dans le merveilleux. Le musée expose des portraits (et des auto-portraits) et des paysages – notamment ceux qu’il a réalisés lors de son voyage en Italie et en Corse. Ainsi, cette très belle vue de Calvi aperçue au loin au travers d’une dentelle de branches d’arbres, ou la Mosquée-cathédrale à Cordoue, dont la colonnade infinie n’a probablement pas manqué de le fasciner. C’est d’ailleurs lors d’un voyage en Espagne qu’il découvre les arabesques de l’Alhambra de Grenade, qui inspireront ses dessins abstraits. Et il y a sans doute aussi les primitifs flamands dont on retrouve l’esprit de détail et de l’incongru dans ses œuvres fantastiques : Jan Veermeer était de Delft, si proche de La Haye…

Le musée ne se contente pas d’exposer les œuvres d’Escher : certaines salles proposent des outils interactifs destinés à faciliter le regard analytique et synthétique, ou des animations multimédia qui illustrent le mouvement perpétuel qui anime certaines de ses gravures. C’est un lieu dont on ne peut que recommander la visite.


L’illustration a fait usage d’un dessin de Jan Van Goyen (1596-1656) et d’une vache suisse.
1 In Nouvelles des produits de la mer, novembre 2007. La caque est « un récipient ressemblant à une barrique où l’on empile les harengs salés » (TLF).
2 Ceux qui seraient gênés de saisir ainsi un poisson entre les doigts peuvent l’acheter dans une sorte de petit pain spongieux ressemblant à ceux que l’on trouve dans les fast foods. C’est une grave erreur, le goût du poisson s’en trouve altéré ; le matje n’est pas un hamburger, tout de même.



23 mars 2008

Les faits et les méfaits du mail

Classé dans : Histoire, Littérature, Sciences, techniques — Miklos @ 16:31

« Courrier Le courrier désigne la cor­res­pon­dance écrite entre personnes, gé­né­ra­le­ment deux : un ex­pé­di­teur qui l’envoie et un des­ti­na­taire qui le reçoit. Ce sont des lettres ma­nus­crites mais aussi des cartes postales. On les envoie dans une en­ve­loppe, ou tel quel quand c’est une carte postale. » (Wikipedia)

La définition que donne la WP du mot « courrier » s’en tient à son accep­tion originale qui date du xive et qui est loin de refléter son sens actuel : « Ensemble des lettres, imprimés, paquets qui sont acheminés et distribués par les services de la poste » (TLF) ou par des services privés.

Elle ignore aussi les autres significations du terme : messager ou émissaire (et sa variante avant-courrier), rubrique d’un journal regroupant des communications (« courrier des lecteurs »), et par extension appellation de périodiques (Le Courrier picard, Le Courrier de l’Ouest, Le Courrier international…), etc. Ce dernier usage s’apparente à celui du mot « lettre » dans l’expression générique « lettre d’information » ou dans des titres de publications papier ou en ligne dont la diffusion est loin d’être limitée à une personne, telles que Les Lettres nouvelles de Maurice Nadeau, qui y aura publié pendant 25 ans des textes d’Antonin Artaud, Henri Michaux, Jacques Prévert, Raymond Queneau, Brassaï, Roland Barthes, Georges Bataille, Maurice Blanchot, Kateb Yacine, Arrabal, Claude Simon, Alain Robbe-Grillet, Michel Leiris, Boris Pasternak, Evtouchenko, Soljenitsine, Le Clézio, Alberto Moravia, John Cage ou Samuel Beckett (source : Le Magazine littéraire) – et pourtant, la WP française n’y consacre qu’une phrase.

La WP française n’établit pas non plus de lien entre la courte page qu’elle consacre à « Courrier » et ses contreparties en anglais ; le choix existe pourtant entre « Mail », qui désigne le transport d’objets de tous ordres, et « Courier » (un seul r) qui désigne la personne ou l’organisme chargé d’effectuer ce transport.

Signe des temps, l’entrée consacrée au courrier électronique est bien plus prolixe. Elle omet toutefois de mentionner le projet Uucp, développé au début des années 1980 dans le but de faciliter l’échange de courrier électroniques entre ordinateurs utilisant le système d’exploitation Unix et ce protocole de transport. C’est ainsi que nombre d’organismes français ont pu échanger des messages entre eux et à l’international avant l’arrivée de l’internet en France. Dans cet environnement, l’arobase n’était pas utilisée dans l’adresse ; Uucp utilisait le point d’exclamation (exemple : seismo!okstate!uokmax!uokucs!rcl – où « rcl » est l’identifiant du des­ti­na­taire, précédé de la liste des relais nécessaires pour le joindre à partir de l’ordi­nateur de l’expéditeur). Cette page ne rappelle pas non plus l’existence du réseau Bitnet (né aussi à la même période, mais pour des ordinateurs IBM, et plus tard pour d’autres environnements) qui permettait non seulement l’échange de courriers électroniques et la gestion de listes de diffusion (« Listserv »), mais aussi ce qui fut les premiers échanges directs en ligne (connus aujourd’hui sous le nom anglais de chat) et les tous premiers jeux de rôle (précurseurs des mondes virtuels apparus il y a quelque dix ans avec Active Worlds, donc bien avant Second Life) et notamment des Mud (« multi-user dungeon »), inventés en 1984 par deux étudiants de l’École des Mines de Paris, Bruno Chabrier et Vincent Lextrait.

Enfin, autre signe des temps, la WP française redirige « mail » vers « courrier électronique », ignorant tout de ses significations alternatives (et bien françaises, celles-là) de gros marteau en fer ou de maillet en bois et du jeu éponyme, ancêtre du croquet et du golf dont il possédait toutes les vertus qu’on attribue à son descendant british :

« Mais le jeu de lancer favori des élites dans la seconde modernité est sans nulle doute le pallemail ou mail, mêlant exercice et adresse, qui poursuit la carrière entamée au xvie siècle. Le jeu a envahi tout le royaume au milieu du xviie siècle, qui voit la création d’un corps de « palemardiers » ou maîtres de mail en 1668 à Montpellier. Les villes se dotent en périphérie de longues allées sablées, bordées de rangées d’arbres, dont l’appellation survit dans la toponymie contemporaine. On y emploie des boules de buis ou de néflier de cinq à six onces de diamètre et des mails de chêne vert – les plus réputés viennent d’Avignon –, dont le manche, proportionné à la taille du joueur, doit aller des pieds jusqu’à la ceinture. Le mail exige un parfait contrôle de l’attitude corporelle ; il faut jouer des reins, dit L’Encyclopédie, et pas seulement des bras, se mettre aisément sur la boule ni trop près ni trop loin, ne pas avancer un pied plus que l’autre, les genoux souples, les brase de même, “afin que le coup soit libre et aisé”. On joue au rouet – chacun pour soi –, ou en partie, c’est-à-dire par équipe. On peut aussi y jouer à la chicane, en pleine campagne, par les chemins. (…) Mais la version la mieux aimée aux xviie et xviiie siècles consiste à parcourir les allées uniformes des parcs aristocratiques, car “on peut en même temps jouer, causer et se promener en bonne compagnie”. Louis XIV s’y adonne depuis son enfance (…). Et la maison du roi compte parmi ses officiers plusieurs “porte-mail et billiard”, jusque sous le règne de Louis XV. C’est le meilleur des jeux pour la santé, affirme L’Encyclopédie (…), “il est propre à tous les âges, depuis l’enfance jusqu’à la vieillesse”. Il est également accessible aux femmes, ce qui contribue à son succès. » — Élisabeth Belmas : Jouer autrefois. Esssai sur le jeu dans la France moderne (xvie-xviiie siècle). Éd. Champ Vallon, 2006.

De là à ce que les nouvelles générations supposent que la rue du Mail à Paris, à Angers, à Nîmes, en Avignon et ailleurs doit son nom à quelque cybercafé plutôt qu’à un lieu où se réunissait les joueurs de mail, il n’y a plus qu’un pas à faire. Voici ce que dit Albin Michel de l’origine du nom de cette voie dans son Nîmes et ses rues en 1876 :

Le jeu de mail ou de pallemalhe était autrefois en grande faveur à Nimes, et l’on avait pris l’habitude d’y jouer sur tous les chemins qui aboutissaient à la ville, ce qui occasionnait souvent des accidents et des plaintes des propriétaires dont on détruisait les clôtures et dont on violait les propriétés, pour aller chercher les boules égarées. Aussi, en 1636, le sieur Jean Guirauden, lieutenant du prévôt des maréchaux au diocèse de Nimes, adressa-t-il aux consuls et au gouverneur de la ville une pétition pour être autorisé à établir un jeu de mail sur une terre par lui acquise du sieur Escudier, au quartier appelé Saint-Vincens. »

Le terme alternatif employé dans la pétition a donné en anglais « Pall Mall », qui, à l’instar du terme en français, a donné son nom à diverses rues et à une célèbre artère londonienne et pour des raisons similaires. Dans l’extrait de la pétition dont parle Albin Michel, on peut lire ce savoureux passage :

…en considération de ce que l’exercisse est honneste et permis, néansmoyns en la présente ville de Nismes (…) il n’y a aulcung lieu destiné pour led. exercisse, en telle sorte, que les plus grans et fréquans chemins abordans lad.ville comme celluy d’Abvignon, de Montpellier, Beaucaire, Arles et autres infinis chemins sont occupés par lesd. Joueurs aud. Pallemalhe ou pour mieux dire à la chicquane, dont le public et particuliers reçoivent une notable injeure et prejudice ; car, en premier lieu, pandan qu’on s’exerce en ses grands chemins, les passans, qu’elle hoste et affaires importans qu’ils aient, sont contrainctz s’arrester, voire mesme, qui pui est, s’ils s’opiniatrent à continuer leur chemin, courent fourtune d’estre offancés, ce quy es. Grandement préjudiciable au négosse et commerce de la dite ville ; d’alheurs ont fait pleuzieurs desgats et dommages aux maisons, bleds, vignes et jardins qui confrontent et abottissent lesd. Chemins, dont ordinairement les particuliers en font plaintes, pour les quelles faire cesser et autre incommoditez quy en arrivent et malheurs qui peuvent ensuivre, vouldrait ledit suppliant qu’il feust votre bon plaizir lui permettre faire faire ung jeu de pallemalhe en une etter qu’il a acquise jougnant les vieilles mazures de l’ancienne muralhe, cartier appelé Saint-Vincens, et icelluy approuver, sous les modifications, pactes et conditions cy apprès escriptes et les ordonnances et les réglemans au folhet cy attaché, et moyennant ce led. suppliant priera Dieu pour vos santés et prospérités.

À ces méfaits du mail d’alors, qui empêchaient les braves citoyens de vaquer à leurs occupations, succèdent ceux du mail d’aujourd’hui, où la vague croissante des spams (pourriels), des hoax (canulars) et des tentatives de phishing (hameçonnages frauduleux), qui atteint quelque 98% de tous les échanges électroniques, menacent de noyer les braves cybercitoyens qui prieraient bien quelque dieu pour qu’on les en débarrasse d’une façon ou d’une autre. À ceux qui se trouveraient du temps libre du fait d’avoir renoncé à utiliser le courrier électronique et qui souhaiteraient se perfectionner à ce jeu (ce qui ne manquera pas de calmer leur ire, aussi justifiée soit-elle), on ne saurait trop conseiller la lecture préliminaire de l’Académie Universelle des Jeux, Contenant les Règles des Jeux de Cartes permis ; celle du Billard, du Mail, du Trictrac, du Revertier, etc. etc. Avec des Instructions faciles pour apprendre à les bien jouer dans sa nouvelle édition de 1806, Augmentée du Jeu des Echecs, par Philidor ; du Jeu de Whist, par Edmond Hoyle, traduit de l’Anglais ; du Jeu de Tre-sette, du Jeu de Domino, de l’Homme de Brou, etc. etc.. Les règles concernant le jeu du mail se trouvent dans le second des trois tomes, p. 254-284 (cf. ci-contre). Son style ne manque pas de saveur pour le lecteur contemporain, jugez-en : « Il ne sera pas inutile de remarquer combien il est avantageux à ce jeu d’avoir de bonnes boules ; c’est le pur hasard de la nature qui les forme, et, s’il faut ainsi dire, qui les pétrit ; mais c’est l’adresse du Joueur habile, qui achève de les faire en les bien jouant, de les connaître pour s’en servir à propos. » L’ouvrage était disponible chez Amable Costes à Paris et Amable Leroy à Lyon, et dorénavant chez Gallica (quand ça marche et ne répond pas, poliment bien qu’en anglais, « Server temporary unavailable. The server is temporarily unable to service your request due to maintenance downtime or capacity problems. Please try again later. »).

Encycl. Antiq. On appelait un courrier public ou privé, chez les Romains, angarius ou angarus. Ce nom leur venait des Grecs, mais il était d’origine barbare. Bochart le dit arabe ; d’autres le croient persan. Les relations qui s’établirent par la guerre et le commerce entre les Grecs et les Perses firent adopter aux premiers les meilleurs usages des seconds, entre autres ce que nous appelons la poste. Les Grecs, en instituant des courriers publics à l’imitation des Perses, transportèrent dans leur langue un terme dont ils avaient besoin et reçurent ainsi de la Perse le nom et la chose. Ce fut de la Grèce que ce nom passa aux Latins, quand ils adoptèrent l’usage des courriers à l’imitation des Grecs. La politique des rois de Perse leur avait fait imaginer ces sortes d’officiers à cheval, messagers de leurs ordres, par lesquels ils étaient promptement informés de ce qui se passait dans les provinces les plus éloignées de leur vaste empire. Le besoin de communiquer entre eux a naturellement suggéré aux hommes des moyens de transmission très-divers. Cyrus, ou Xerxès, selon Hérodote, établit des courriers et des chevaux de distance en distance, et fut le premier instituteur de ce mode de communication. Ce serait donc au plus tôt vers l’an 536, et au plus tard vers l’an 485 avant notre ère, qu’on aurait commencé à avoir des courriers régulièrement établis, seulement toutefois pour le service particulier des rois. L’usage était de faire courir ces messagers à cheval durant toute une journée ; le premier courrier remettait ses dépêches à un autre, qui courait le jour suivant, et ainsi de suite jusqu’à destination. C’est ce qui leur fit aussi donner par les Grecs le nom d’hémérodromes, coureurs d’un jour. Suidas dit qu’ils parcouraient d’un trait 1,500 stades. On voit là, à l’état rudimentaire, l’origine et la première idée des postes.

La difficulté de charger un homme et un cheval de tablettes quelquefois assez lourdes suggéra au Romains l’idée d’atteler le cheval à un léger véhicule. Les courriers du temps de l’empire avaient le droit de forcer 1es particuliers ou les villes à leur fournir des chevaux ou des bêtes de somme, quelquefois des voitures, comme on l’apprend par le jurisconsulte Paulus, au mot Angaria. Cette obligation excita des plaintes réitérées de la part des provinces, et l’on dut à l’empereur Adrien l’abolition de cette servitude. La poste, si l’on peut ainsi parler, fut dès lors entretenue aux frais de l’Etat. Louis XI est le premier, dans les temps modernes, qui ait établi, par un édit de 1464, l’usage des postes, jusqu’alors inconnu en France. Il y ordonna le changement des chevaux de deux en deux lieues, à la différence des anciens qui n’en plaçaient qu’au bout de l’espace de chemin qu’un cheval pouvait faire par jour, et il fut ainsi le véritable inventeur des relais à court intervalle.

Pierre Larousse, extrait de l’article « courrier »
in Grand dictionnaire universel du XIXe siècle,
tome cinquième. Paris, 1869.

13 mai 2007

« Une horreur subalterne : la vaste Bibliothèque contradictoire »

Classé dans : Littérature, Livre, Sciences, techniques — Miklos @ 1:58

« Bientôt, les écrivains ne se demanderont plus “Quel livre écrirai-je ?” mais “lequel ?” » – Kurd Lasswitz (cité par J. L. Bórges)

Jorge Luis Bórges ne s’est pas attribué l’invention de la bibliothèque universelle. Bien au contraire : il détaille la longue histoire de ce « caprice, ou imagination, ou utopie », dont on doit la préfiguration à Démocrite, et dont le « tardif inventeur est Gustav Theodor Fechner et Kurd Lasswitz est le premier à l’exposer ». Fechner (1801-1881) est considéré comme le père de la psychologie expérimentale contemporaine, où il a introduit des méthodes quantifiables et mathématiques. Lasswitz (1848-1910) était mathématicien et physicien ; non traduit et quasi inconnu en France1, on lui attribue la paternité de la littérature de science fiction allemande. Bórges écrit :

« Lasswitz, encouragé par Fechner, imagine la Bibliothèque Totale. Il publie son invention dans le volume de récits fantastiques Traumkristalle.

Lasswitz presse les hommes de produire mécaniquement cette Bibliothèque inhumaine qui organiserait le hasard et éliminerait l’intelligence (…). Tout sera contenu dans ces volumes aveugles. Tout, l’histoire minutieuse de l’avenir, Les Égyptiens d’Eschyle, le nombre précis de fois que les eaux du Gange ont reflété le vol d’un faucon, l’authentique et secret nom de Rome, l’Encyclopédie qu’aurait édifiée Novalis, mes rêves et mes demi-sommeils de l’aube du 14 août 1934, la démonstration du théorème de Pierre Fermat, les chapitres non écrits d’Edwin Drood, ces mêmes chapitres traduits dans la langue que parlèrent les garamantes, les paradoxes que conçut Berkeley sur le temps et qu’il ne publia pas, les livres de fer de Urizen, les épiphanies anticipées de Stephen Dedalus qui avant un cycle de mille ans ne voudraient rien dire, l’évangile gnostique de Basilide, la chanson que chantaient les sirènes, le catalogue fidèle de la Bibliothèque, la démonstration de la fausseté de ce catalogue. Tout, mais pour une ligne raisonnable ou une indication exacte, il y aura des millions de cacophonies insensées, de fatras verbaux et d’incohérences. Tout, mais les générations des hommes peuvent passer sans que les rayons vertigineux – les rayons qui oblitèrent le jour et dans lesquels habitent le chaos – leur aient accordé une page tolérable.

L’une des habitudes de l’esprit est d’inventer des imaginations horribles. Il a inventé l’Enfer, il a inventé la prédestination à l’Enfer, il a imaginé les idées platoniciennes, la chimère, la sphynge, les anormaux nombres transfinis (dans lesquels la partie n’est pas moins abondante que le tout), les masques, les miroirs, les opéras, la tératologique Trinité : le Père, le Fils et le Spectre insoluble, articulés en un seul organisme… J’ai tenté, moi, de sauver de l’oubli une horreur subalterne : la vaste Bibliothèque contradictoire, dont les déserts verticaux de livres courent le risque incessant de se changer en d’autres et qui affirment tout, nient tout et confondent tout comme une divinité qui délire.

Jorge Luis Bórges, « La bibliothèque totale », Sur n° 59, août 1939, traduit par Alain Calame

Selon Lasswitz, il n’y aurait pas assez de place dans tout l’Univers pour une telle bibliothèque. Mais l’homme ne s’arrête pas d’écrire : il l’a fait bien avant l’invention de la machine à écrire (et a fortiori de l’ordinateur) : l’écrivain le plus prolifique à ce jour est réputé être l’espagnol Lope de Vega (1562-1635), dont on avait mentionné les « plus de 1800 pièces de théâtre dont il ne nous reste que quelque 400… et (…) nombreuses autres œuvres (poésie, romans, critique, lettres…) ». Il est suivi (selon le Quid) par un auteur anglais de feuilletons, Charles Hamilton (1876-1961), qu’on ne peut soupçonner d’avoir fait usage de générateurs automatiques de textes, de poèmes et d’acrostiches, puisqu’il est décédé en 1961, année où Raymond Queneau publie son Cent mille milliard de poèmes, qui ne sera réalisé en informatique2 que bien plus tard. On constate avec un plaisir teinté de souvenirs évanescents3 que la romancière Enid Blyton (1898-1968), dont les aventures du Club des cinq avaient passionné une partie de notre enfance, s’y trouve en bonne position. Nostalgie, quand tu nous tiens… « Quand je tenais un Club des cinq nouveau, je fermais ma porte, redressais mon traversin, m’installais confortablement, en espérant ne plus bouger avant la fin du livre. Tout le monde savait qu’il ne fallait pas me déranger (…). J’aimais son épaisseur, le contact glacé de sa couverture. Un de mes plaisirs était de sentir la reliure intacte, la bonne odeur de papier entre les pages. » (Serge).

« Concevons qu’on ait dressé un million de singes à frapper au hasard sur les touches d’une machine à écrire et que, sous la surveillance de contre­maîtres illettrés, ces singes dacty­lo­graphes tra­vail­lent avec ardeur dix heures par jour avec un million de machines à écrire de types variés. Les contre­maîtres illettrés rassem­bleraient les feuilles noircies et les relie­raient en volumes. Et au bout d’un an, ces volumes se trouveraient renfermer la copie exacte des livres de toute nature et de toutes langues conservés dans les plus riches biblio­thèques du monde. » – Émile Borel, « Mécanique Statistique et Irréversibilité », J. Phys. 5e série, vol. 3, 1913, pp.189-196. Cité par Infinite Monkeys.L’auteur qui s’y trouve en quatrième position(après l’Indien Baburao4 Arnalkar) est le Brésilien Ryoki Inoué ; médecin de formation, il est l’auteur de 1 075 livres5 et mérite bien son surnom d’« homme-machine à écrire » attribué par le Courrier international (26 avril 2007). Mais selon l’article, il est largement battu par Corín Tellado, auteure de « quelque 5 000 romans à l’eau de rose » (et inconnue du Quid). À force, et grâce aux lois de statistique citées par le grand mathématicien Émile Borel (cf. encadré), il devra bien s’y trouver finalement un chef-d’œuvre ou du moins un paragraphe d’anthologie, indé­pen­damment des dons de l’auteur. Mais il n’est pas donné à tout le monde d’être un Lope de Vega (ni de vivre assez longtemps pour suppléer à ce million de singes), sinon cela se saurait.

Les grands écrivains n’ont pas attendu l’invention de l’ordinateur pour imaginer des machines à générer du texte6. Ainsi, le génial Jonathan Swift décrit en 1726 une machine de ce type se trouvant dans un des ateliers de l’Académie de Laputa, que visite Gulliver :

« Ce métier avait vingt pieds carrés, et sa superficie se composait de petits morceaux de bois à peu près de la grosseur d’un dé, mais dont quelques-uns étaient un peu plus gros. Ils étaient liés ensemble par des fils d’archal très-minces. Sur chaque face des dés étaient collés des papiers, et sur ces papiers on avait écrit tous les mots de la langue dans leurs différents modes, temps ou déclinaisons, mais sans ordre. Le maître m’invita à regarder, parce qu’il allait mettre la machine en mouvement. A son commandement, les élèves prirent chacun une des manivelles de fer, au nombre de quarante, qui étaient fixées le long du métier, et, faisant tourner ces manivelles, ils changèrent totalement la disposition des mots. Le professeur commanda alors à trente-six de ses élèves de lire tout bas les lignes à mesure qu’elles paraissaient sur le métier, et quand il se trouvait trois ou quatre mots de suite qui pouvaient faire partie d’une phrase, il la dictait aux quatre autres jeunes gens qui servaient de secrétaires. Ce travail fut recommencé trois ou quatre fois, et à chaque tour les mots changeaient de place, les petits cubes étant renversés du haut en bas.

Les élèves étaient occupés six heures par jour à cette besogne, et le professeur me montra plusieurs volumes grand in-folio de phrases décousues qu’il avait déjà recueillies et qu’il avait l’intention d’assortir, espérant tirer de ces riches matériaux un corps complet d’études sur toutes les sciences et tous les arts. »

Jonathan Swift , Voyages de Gulliver dans des contrées lointaines, Troisième partie (Voyage à Laputa), chap. 5, pp 270-271. Traduction nouvelle précédée d’une notice par Walter Scott. Illustrations par J.-J. Grandville. Garnier Frères, Paris, m dccc lvi.

Quoi qu’il en soit, Arnalkar écrit ses livres à l’ordinateur (et doit changer de clavier tous les six mois), contribuant ainsi au volume astronomique des contenus numériques produits annuellement, qui ne fait que croître. Y contribuent aussi les grands chantiers de numérisation rétrospective du patrimoine littéraire. L’excellente chaîne de radio publique américaine NPR a réuni avant-hier lors de son émission-phare Talk of the Nation trois acteurs majeurs représentant des approches très diverses concernant cette « utopie », pour reprendre le terme de Bórges.

Michael Hart en est certainement le précurseur (et n’a rien d’un canular, à l’opposé d’un autre précurseur, Hégésippe Simon) : c’est en 1971 qu’il saisit au clavier le tout premier ouvrage (la Déclaration de l’indépendance américaine) de ce qui deviendra le Projet Gutenberg. Celui-ci propose aujourd’hui plus de 20 000 ouvrages, fournis par un travail entièrement bénévole de volontaires aux quatre coins du monde, auxquels se rajoute un nombre bien plus important de contenus contribués par des filiales et des partenaires. Selon Hart, plus le temps passe et plus la part des livres hors copyright baisse, non seulement à cause des volumes croissants de la production, mais des prolongations périodiques des durées de protection pour éviter que des œuvres juteuses ne tombent dans le domaine public (on connaît à ce propos le sort d’une certaine souris). Dans Gutenberg, les textes sont saisis (ou numérisés, puis reconnus) en texte intégral, qui ne préserve pas le format et la mise en page d’origine. Ils passent ensuite plusieurs étapes de relecture. Ceci assure leur haute qualité, mais explique aussi le nombre relativement peu élevé d’ouvrages dans cette collection7. L’utopie selon Hart c’est que chacun puisse posséder, en 2021, une bibliothèque personnelle comprenant un milliard d’ouvrages numériques. Pour cela, il faut continuer à numériser, et à traduire les ouvrages en un grand nombre de langues.

Brewster Kahle établit, en 1996, l’Internet Archive, afin de préserver les contenus changeants et éphémères8 du Web, de tout le Web, ou en tout cas d’une bonne partie. Plus récemment, s’y sont rajoutés des enregistrements sonores et des images animées, ainsi que quelque 200 000 livres (qu’ils numérisent à raison de 12 000 par mois) « hors copyright ou orphelins » (curieuse affirmation, puisqu’on y a trouvé un ouvrage publié par Gallimard en 1960 ; il ne doit pas être le seul). L’objectif est de fournir la possibilité de télécharger tous les contenus qu’ils proposent, contrairement à ce que fait Google qui ne l’autorise pas même pour les ouvrages hors copyright. Selon Kahle, il en coûterait 300 millions de dollars pour numériser un million de livres, chiffre qu’il met en regard des 12 milliards de dollars de l’industrie du livre aux USA. Mais il faut comparer ce qui est comparable : il ne parle pas du coût du maintien de l’infrastructure technologique et de celui de sa migration périodique pour en assurer la compatibilité avec les évolutions technologiques (matériels, logiciels). L’interface servant à consulter les livres est particulièrement bien pensée : la qualité de la numérisation semble uniformément excellente ; les livres s’affichent ouverts à plat, et il suffit de cliquer sur la page de droite ou de gauche pour que celle-ci se tourne. La tranche du livre est représentée, ce qui permet de passer rapidement à une autre partie de l’ouvrage sans avoir à le feuilleter page à page ou à indiquer un numéro de page. Quant à la recherche en texte intégral, elle ouvre le livre à la première occurrence de la réponse, marquée au stabilo, et place des Post-it® annotés aux autres pages. Tout simplement génial. Enfin, tout est prêt pour rajouter un enregistrement sonore du texte lu.

Si Michael Keller est le directeur des bibliothèques de l’université de Stanford, il représentait surtout le « projet Google », avec qui son institution a fait affaire (ce n’est pas un appel aux armes, citoyens) : ils leur fournissent de 1500 à 3000 livres par jour à numériser et à indexer, et reçoivent en retour (en plus de l’ouvrage d’origine…) une copie du fichier informatique. Selon lui, ceci permettra d’assurer une meilleure sauvegarde de ce fonds numérique. Les deux autres participants étaient du même avis, Brewster Kahle allant jusqu’à citer Linus Torvalds (l’inventeur du système Linux) qui aurait dit : « Real Men don’t make backups. They upload it via ftp and let the world mirror it. » (« les mecs qui sont des mecs ne font pas de sauvegardes : ils mettent leurs fichiers sur un serveur ftp, et laissent le reste du monde en faire des copies »). Il en existe de nombreuses variantes, probablement plus apocryphes les unes que les autres, mais y en a-t-il une d’originale ? Et surtout, est-ce si vrai que cela ? Le problème avec cette approche est qu’il n’aborde que le clonage de l’objet, et non pas son évolution nécessaire au fil des évolutions techniques. Sa démultiplication aura d’ailleurs pour effet l’existence d’un nombre incalculable de versions plus incompatibles les unes que les autres, chacun transformant (ou non) la sienne à sa façon. Curieuse « évolution » dans le monde virtuel du texte numérique…

L’approche que l’Internet Archive a adopté pour présenter ses livres numériques participe de leur réincarnation dans ce qui n’est, pour le moment, qu’un (bon) simulacre du physique. On peut imaginer (comme on n’a pas manqué de le faire) que cette tendance pourra se poursuivre jusqu’à la maté­ria­lisation dans un objet physique ressemblant au livre. Mais il existerait une autre approche. Walker Reading Tech­nologies, pépinière américaine qui étudie depuis une dizaine d’années nos capacités de lecture, vient de présenter le résultat de ses recherches ; selon elle, au regard (si l’on peut dire) de la physiologie de l’œil, le livre n’offre pas la meilleure disposition du texte pour une lecture efficace : notre champ de vision et de perception active serait équivalent à ce qu’on voit au travers d’une paille : ainsi, en lisant, notre cerveau doit faire l’effort d’éliminer ce qu’on voit au-dessus et au-dessous des mots que l’on est en train de lire et qui n’a pas de rapport immédiat avec eux (puisque les lignes s’étendent à droite et à gauche hors du champ de vision). Ils proposent donc un produit, Live Ink qui analyse le texte et le redispose à l’écran sous forme de lignes très courtes ; ainsi, ce qui entre dans le champ de vision immédiat a un rapport direct avec ce qu’on lit. La fragmentation est effectuée aussi de façon à rendre plus manifeste la syntaxe du texte – elle ne se fait pas seulement en fonction de la longueur des fragments, mais de la position des parties de la phrase. Les chercheurs indiquent que cette méthode de présentation du texte a des racines très anciennes, en citant Alberto Manguel :

« Afin de venir en aide à ceux qui n’avaient guère de talents de lecture, les moines copistes utilisaient une méthode d’écriture dite per cola et commata, dans laquelle le texte était divisé en lignes d’après le sens – forme primitive de ponctuation, qui permettait à un lecteur peu sur de lui de baisser ou d’élever la voix à la fin d’un segment de pensée. (Cette présentation permettait également à un érudit en quête d’un certain passage de le trouver plus facilement.) C’est saint Jérôme qui, à la fin du ive siècle, ayant découvert cette méthode dans des copies de Démosthène et de Cicéron, la décrivit le premier dans son introduction à sa traduction du Livre d’Ezéchiel, en expliquant que “ce qui est écrit per cola et commata communique au lecteur un sens plus évident”. » – Alberto Manguel, Une histoire de la lecture, p. 68.

Des études destinées à mesurer l’efficacité de cette approche ont été effectuées dans des écoles américaines – et non pas avec des lecteurs chevronnés – et ont donné des résultats positifs. Il serait intéressant de savoir si elle est utile pour des textes savants et des lecteurs compétents.

Lewis Carroll y avait-il déjà pensé, lorsqu’il écrivit la forme du texte qu’Alice se représente, en écoutant la narration des malheurs qu’en fait la Souris ? Cette dernière la prévient que son histoire « est bien longue et bien triste », en soupirant et en regardant sa queue. Alice, confondant « narration » (tale, en anglais) et « queue » (tail), se demande ce que cette queue, effectivement longue, a de triste. Mais il est vrai que ce texte se lit aisément, quand on y pense… Plus sérieusement, l’excellent Trésor de la langue française infor­matisée (TLFi) l’a fait à sa façon : le lecteur peut faire ressortir automatiquement au stabilo les diverses parties du texte : auteur, code grammatical, construction, date, définition, exemple, indicateur, source, syno­nyme/anto­nyme, syntagme… Ce qui permet de parcourir rapidement les entrées les plus longues et les plus riches, d’en identifier d’un coup d’œil la structure, bref de l’utiliser d’une façon plus efficace encore. Un must. Ne faudrait-il pas envisager le développement d’interfaces de lecture adaptables plutôt que figées selon un parti-pris particulier, offrant bien plus qu’un simple contrôle sur la mise en page (de ceux généralement disponibles actuellement tels que la taille des polices, le codage, la réorganisation des contrôles, etc.) permettant de faire ressortir la structure profonde du texte à l’aide de couleurs (à l’instar du TLFi), de remise en forme des lignes (comme le propose Walker Reading) ou tout autre moyen pour aider à appréhender la forme et le contenu et à se l’approprier ?9

À lire 
• Terry Butler : Monkeying Around with Text


1 Il fait toutefois l’objet de travaux de recherche de Françoise Willman à l’Université de Nancy 2, ainsi que d’un article de Denis Bousch, « Image de soi et image de l’autre dans Sur deux planètes, un roman d’anticipation de Kurd Laßwitz (1897) », in Françoise Dupeyron Laffay (ed.) : Le livre et l’image dans la littérature fantastique et les œuvres de fiction, Presses de l’Université de Provence, 2004.

2 Elle est disponible sur l’internet, en dépit de la décision de justice qui l’interdit : « En tant que de besoin, faisons interdiction aux défendeurs de mettre l’œuvre de Raymond Queneau à la disposition des utilisateurs du réseau Internet ce sous astreinte de 10.000 francs par infraction constatée » (Ordonnance de référé, Tribunal de grande instance de Paris, 5 mai 1997). Nous n’en fournirons donc pas l’adresse.

3 À tel point que j’étais persuadé qu’ils avaient été publiés dans la série Bibliothèque verte. Que nenni, c’était la Bibliothèque rose, où ils entrèrent en 1958, après avoir paru initialement dans la Collection Ségur-Fleuriot (selon François Lebrun).

4 Et non « Baboorao », comme l’écrit le Quid. Mais il ne serait pas à une inexactitude près : il y est indiqué que cet auteur est né en 1907, tandis qu’il est né en 1906 et décédé en 1996 (source : ambassade de l’Inde à Manille). Dans la même page, il est fait mention de « Julien Greene » au Julien Green (qu’ils doivent savoureusement confondre, au moins depuis 2003, avec Graham Greene…). Plus bas, on peut lire : « D’après le professeur E. Gaede, il y aurait eu en France, depuis l’invention de l’imprimerie, de 30 000 à 70 000 écrivains qui ont écrit en tout 500 000 livres. » Il s’agit sans doute d’Édouard Gaède, qui a publié en 1972 L’Écrivain et la société : dossier d’une enquête (publié par le Centre d’études de la civilisation du 20e). Il est curieux que le Quid de 2007 ne mentionne pas de références plus récentes, s’il s’agit bien de celle-ci. Mais c’est ce dernier chiffre qui est curieux : selon les chiffres clés du secteur du livre publiés par le ministère de la culture (la version intégrale est aussi disponible en ligne), 340 269 nouveaux titres ont été édités entre 1985 et 2005 (donc hors réimpressions). En comparant ces deux sources, il en ressortirait que le nombre de nouveaux titres publiés au cours des vingt dernières années s’élève à 68% du nombre de titres écrits durant les quelque 550 années précédentes. S’agit-il vraiment des mêmes catégories, et si oui, comment s’explique cette explosion ? Ah, si Paul Otlet avait fini son travail, on aurait la réponse. Le Quid s’est d’ailleurs commis dans des déformations autrement plus graves, que ce soit à propos du négationnisme de la Shoah ou de celui du génocide des Arméniens.

5 Selon son site (on ne trouve que huit de ses titres au catalogue de la Bibliothèque nationale du Brésil – mais comme il a publié sous une quarantaine de pseudonymes, ce n’est pas si surprenant). Le Quid de 2007 n’en annonce que 1 046, même chiffre que celui de l’édition de 2003. À se demander pourquoi ils en sortent un chaque année…

6 Ni d’ailleurs pour la musique : le célèbre Musikalische Wurfelspiele (jeu de dés musical) en do majeur K 516f de Mozart n’était pas unique en son temps, et consistait à produire un morceau de musique à l’aide d’un assemblage aléatoire d’éléments (chez Mozart : composés de deux mesures).

7 C’est ce qui distingue ce projet des grands projets contemporains, qui numérisent automatiquement en « mode image » les ouvrages, puis effectuent, toujours automatiquement, une reconnaissance du texte, qui ne sera pas présenté au lecteur (vu sa qualité parfois inégale, surtout pour les ouvrages plus anciens, ce n’est pas forcément critiquable), mais qui servira à la recherche dans les contenus. Le lecteur, lui, verra à l’écran l’image (et ne pourra donc effectuer de copier-coller du texte).

8 On estimait, à la fin des années 1990, la durée de vie moyenne d’une page Web à quelques dizaines d’heures – sa disparition pouvant être due à des causes variées : changement d’adresse, suppression de la page, suspension d’un site, faillite de l’hébergeur… D’autre part, les contenus de l’Archive sont eux-mêmes soumis parfois à l’obsolescence : on a pu constater que certains sites Web – disparus depuis longtemps du Web mais préalablement archivés dans ce système – en avaient aussi disparu quelques années plus tard. Ainsi va le monde.

9 Ceci nécessite évidemment de la part du logiciel d’avoir la capacité à identifier cette structure, ce qui peut être accompli de façon automatisée (du moins partiellement, mais mieux qu’avant) plutôt qu’uniquement manuelle.

23 mars 2007

Quand la BnF défie Google

Classé dans : Littérature, Livre, Sciences, techniques — Miklos @ 8:32

Mais ce pont d’Arcole, par sa situation, résistait à toutes nos attaques. Napoléon essaya un dernier effort de sa personne: il saisit un drapeau, s’élança vers le pont, et l’y plaça. La colonne qu’il conduisait l’avait à moitié franchi, lorsque le feu de flanc fit manquer l’attaque. Les grenadiers de la tête abandonnés par la queue hésitent ; ils sont entraînés dans la fuite, mais ils ne veulent pas se dessaisir de leur général ; ils le prennent par les bras, les cheveux, les habits, et l’entraînent dans leur fuite, au milieu des morts, des mourants et de la fumée. Le général en chef est précipité dans un marais ; il y enfonce jusqu’à la moitié du corps : il est au milieu des ennemis ; mais les Français s’aperçoivent que leur général n’est point avec eux. Un cri se fait entendre : « Soldats, en avant pour sauver le général ! ». Les braves reviennent au pas de course sur l’ennemi, et Napoléon est sauvé. Cette journée fut celle du dévouement militaire. — Las Cases, Le Mémorial de Saint-Héléne, tome II, p. 217. Garnier 1955.

En 1796, l’armée française remporte une victoire au pont d’Arcole, après qu’elle se soit enlisée – littéralement – dans un bourbier. En juin 1997, la Bibliothèque nationale de France attaque Arcole, opération visant à « communiquer sur internet un corpus francophone du XIXe siècle de 2400 œuvres, monographies ou périodiques et d’environ 6500 images, libres de droit (…) qui préfigurera les accès futurs aux 90 000 textes déjà numérisés depuis 6 ans par la Bibliothèque nationale de France. » Arcole deviendra Gallica qui, dix ans plus tard, contient toujours (ces) 90 000 volumes imprimés en mode image. Ce mode image avait soulevé à l’époque des débats concernant l’accessibilité des contenus : débits des réseaux, accès au texte pour malvoyants et pour ceux souhaitant travailler sur les textes, voire pour la recherche en texte intégral.

En mars 2007, la Bibliothèque nationale de France ouvre Europeana β, « prototype de bibliothèque en ligne développé dans le cadre du projet de Bibliothèque numérique européenne » et comprenant 12 000 documents en plusieurs langues, consultables en mode image ou texte (les déficients visuels ont heureusement été entendus). Le projet d’une bibliothèque numérique européenne avait pris corps au début de 2005, avec l’appel de Jean-Noël Jeanneney pour un sursaut culturel et politique de l’Europe face à l’hégémonie de Google qui avait déjà mis en place sa bibliothèque numérique. Il suggérait un grand projet européen, à l’instar de certaines entreprises du continent qui s’imposent mondialement, tels Airbus (face à Boeing). On sait les récents avatars du moteur franco-allemand dans ce dernier projet, on a vu le retrait fin 2006 de l’Allemagne du projet d’un autre moteur – de recherche, celui-ci –, Quaero (Europeana utilise Lucene), et l’on notera qu’Europeana propose, dans sa toute première version, des ouvrages provenant de ses fonds et de ceux de bibliothèques nationales de Hongrie et du Portugal. Pas d’Allemagne, ni d’ailleurs de Grande Bretagne, qui avait annoncé son intention de faire l’affaire avec Microsoft plutôt qu’avec l’Europe continentale. Un bourbier dans lequel le projet européen menace de s’enfoncer.

Europeana se présente simplement : une case pour la recherche simple dans les titres et dans les sommaires du fonds – ainsi que dans le texte intégral d’une partie des ouvrages1 – ou le choix de se balader dans les fonds selon l’époque (16e au 20e siècles), la langue, la provenance (France, Hongrie, Portugal) ou la discipline (sciences, philosophie, arts…). Une fois que l’on a effectué son choix, une liste d’ouvrages s’affiche à l’écran. Lorsque cette liste est longue – cherchez par exemple « amour » – les possibilités offertes pour réorganiser (trier) la liste voire la réduire (à l’aide des options dans le pavé Affiner) sont encore trop limitées, et des méthodes de recherche multilingues et sémantiques ne sont pas encore proposées. On se retrouve, finalement, là comme dans les moteurs traditionnels basés sur une recherche purement lexicale, devant une présentation linéaire de réponses.

Le premier livre que j’ai voulu consulter était curieusement signalé ainsi : « Amant+ rendu cordelier a :lobservance damours: +l’observance d’amour+ ». Lorsqu’on l’ouvre, on passe à une interface permettant de consulter les pages une à une, bien plus aisément et rapidement que dans Gallica ; on notera la possibilité de feuilleter le livre par table des matières (si elle existe), par vignettes (ce qui est utile surtout pour un livre illustré), ou simplement par la pagination (ce qui est inutile quand elle est inexistante, comme dans ce premier ouvrage consulté). On remarquera que chaque page possède une adresse distincte, ce qui permet de la référencer directement.

Le contenu – la page affichée – est bordé de pavés proposant des fonctionnalités que l’on connaissait auparavant, mais utilisant des techniques plus modernes connues sous le nom d’Ajax : on peut déplacer ces pavés sur la page, ce qui, pour le moment, tient plus du gadget que de la fonctionnalité essentielle ; d’autre part, ces pavés se redessinent lorsqu’on passe d’une page à l’autre dans un ouvrage, ce qui est assez gênant : imaginez que, lorsque vous feuilletez un livre posé sur une table, d’autres objets sur la table se mettent à danser… Parmi ces pavés : la recherche en texte intégral dans le document – difficile à réaliser pour ce texte à l’écriture gothique, qui n’a pas permis de fournir un mode texte cohérent ; voici ce qui s’affiche lorsqu’on passe à ce mode :

jbng &ce rc&gictiç çonitcre
Dint donner atout (eau 6miftt
buit que (a $tant mcfjc fut bute
3?e %te fa %ror bamppwcuttut
V>oitant ^ttgîtfaigc Ô0rrm«c
£>«î ftfta (amant gt ant gonneur
CI:î1D1. ta btff if tap parte

qui est supposé retranscrire l’original « De la nef et a loposite / Ung des religieux convers / Vint donner a tous leau benite / Puis que la grant messe fut dicte / Je veis la venir damp procureur / Portant ung visaige dhermite / Qui fist a lamant grant honneur ». Pour des ouvrages plus récents, cette recherche fonctionne correctement, en surlignant les occurrences retrouvées dans le texte (mode image ou intégral), et l’affichage en texte intégral est très majoritairement bon.2 Il est à noter que les contenus numérisés de la partie française d’Europeana ont été pris dans Gallica, et ne sont pas le résultat d’une renumérisation : leur qualité reflète donc celle de ce fonds numérique qui commence à dater.

La personnalisation est encore très limitée dans ce prototype : on peut se créer un « panier » de documents – mais, comme on le verra tout de suite, uniquement pour les fonds particuliers à la BnF et pas ceux fournis par ses partenaires. Il est possible de télécharger les ouvrages (ainsi que de les imprimer ou de les envoyer par courriel), qui s’affichent alors en PDF, ce qui est bien plus commode que le système qui était proposé dans Gallica. On aimerait voir la possibilité d’annoter ou de surligner les pages, de glisser des marque-pages3, de partager des annotations du texte (voire des métadonnées) avec d’autres lecteurs…4

En voulant consulter un ouvrage en portugais, j’ai été surpris de me voir « transporté » sur un autre site, celui de la Bibliothèque nationale numérique du Portugal5 : l’interface est donc tout à fait différente, ne s’intègre pas dans la personnalisation offert dans Europeana, et les contenus sont présentés dans d’autres formats (PDF). C’est aussi le cas pour les ouvrages fournis par la Hongrie.6

Le prototype que nous propose aujourd’hui la Bibliothèque nationale de France ne doit pas se bouder, s’il est destiné à se développer – et l’État a donné à la Bibliothèque nationale les moyens financiers de le faire – autant sur les fonds nationaux et européens que sur l’outil lui-même7. On devrait voir le volume augmenter de 130 000 documents en 2007, et de 100 000 documents par an « pour plusieurs années ». On souhaite, on espère et on attend la réussite de cette grande entreprise culturelle – défi que Jean-Noël Jeanneney a lancé avant tout à la BnF, tel Bonaparte à ses troupes devant Arcole.

(Ce texte a été corrigé et complété de notes après la présentation d’Europeana au Salon du livre ce matin.)


Notes :

1 La recherche globale dans l’ensemble des fonds présentés n’est pas (encore) proposée : ces fonds, comme on le verra, ne se trouvent pas tous dans le « système » de la BnF, mais dans ceux de chacune des bibliothèques participant au projet. On aurait toutefois pu mutualiser les index comme on l’avait proposé il y a deux ans. Il semblerait que ce sera envisagé dans le futur.
2 Catherine Lupovici, interrogée à ce sujet, a indiqué que cela devait avoir échappé à la vigilance du processus de reconnaissance du texte, qui évite d’afficher des contenus textuels reconnus à moins de 96% de fiabilité. On rappelle qu’il s’agit d’une version bêta.
3 Comme on l’a vu plus tard lors de la démonstration au Salon du livre, il est possible de « marquer » des pages pour les retrouver plus tard ; ces marques entrent dans un dossier propre à l’utilisateur, qui peut ainsi retrouver plus tard l’ouvrage et les pages qu’il s’est ainsi signalés. Il serait intéressant d’avoir aussi des marque-pages graphiques, s’affichant sous forme d’onglets du livre qu’on est en train de lire et de marquer ainsi.
4 Lors de la présentation qu’en a faite la BnF aujourd’hui au Salon du livre, il a été indiqué que des évolutions de ce type étaient envisagées. Il serait même question d’encourager la participation des lecteurs pour améliorer la qualité de la reconnaissance textuelle. C’est le principe selon lequel fonctionne le beau projet Gutenberg de bibliothèque numérique (créé en 1971). On se doute aussi que la BnF essaie d’éviter certaines dérives du numérique et des réseaux sociaux informatisés.
5 Qui utilise des adresses électroniques permanentes (« permanent URL »), excellente idée.
6 La BnF a précisé aujourd’hui que l’interopérabilité de ces bibliothèques – qui, aujourd’hui, ne concerne que la signalisation des ouvrages (partage des métadonnées à l’aide du protocole OAI – ce que j’avais envisagé en 2005) – a vocation à s’étendre aux interfaces et aux (index des) contenus. En d’autres termes, ce changement n’aura plus lieu d’être, même si le contenu se trouve réparti dans des fonds numériques distincts – cf. proposition signalée dans la note 1.
7 Ce développement bénéficiera tout d’abord à Gallica, qui évoluera dans ce sens, avec – éventuellement – une renumérisation et/ou reconnaissance renouvelée du texte selon que de besoin. Quant à l’intégration des bibliothèques nationales européennes entre elles, c’est une affaire loin d’être résolue : certaines font bande à part, d’autres n’ont pas encore les moyens de se joindre entièrement à un tel dispositif.

11 novembre 2005

Le difficile passage à l’acte

Classé dans : Livre, Sciences, techniques — Miklos @ 19:02

La presse se fait écho de la décision de la British Library de faire affaire avec Microsoft, pour la numérisation de « 25 millions de pages de contenus courant 2006 ». Même si «  [l]a Grande-Bretagne offrira bientôt un nombre d’ouvrages numérisés équivalent à celui que propose dès à présent Gallica, la bibliothèque numérique de la BnF », comme le dit le communiqué de la BnF, il est probable que la technologie qui sera utilisée permettra d’y effectuer des recherches et de consulter les contenus de façon bien plus aisée et efficace que ne le permet Gallica (quand bien même cette belle entreprise ne date pas d’hier, déjà alors des critiques s’étaient élevées – dont la mienne – concernant certains choix).

Microsoft a des atouts certains, et pas uniquement financiers ou technologiques : du côté scientifique, Stephen Robertson, grand spécialiste de la recherche dans les contenus, dirige le groupe Information Retrieval and Analysis au laboratoire de recherche de Microsoft à Cambridge. L’entreprise a d’ailleurs décidé de rendre visible et plus européenne son activité de recherche (à l’heure où d’autres entreprises se « délocalisent » en quittant la France), puisqu’elle s’est accordée avec l’Inria pour ouvrir un centre de recherche commun dans un laboratoire près de Paris qui accueillera une trentaine de chercheurs.

L’ouverture de Microsoft vers des secteurs qui ne sont pas si marchands que ça vaut la peine d’être étudiée : son alliance, au sein de la Open Content Alliance, avec l’Internet Archive ne va-t-elle pas couper l’herbe sous le pied d’un autre projet national, celui de l’archivage du Web, qui risque de devenir caduc si une, ou des, archives fiables et efficaces du Web se constituent rapidement ?

On ne peut évacuer l’aspect temporel des projets de cette nature, en invoquant la nécessité de réfléchir et de choisir avant d’agir. Il est d’ailleurs peu probable que la British Library n’ait pas réfléchi (ni, d’ailleurs, les universités qui avaient choisi de faire l’affaire avec Google). Mais il semble que la France ait souvent une difficulté quasi organique de passer de la réflexion (qui est souvent fort brillante) à l’action (dans ce domaine comme dans d’autres), de traduire des principes théoriques en projets concrets et réalistes ; comme il n’y a pas de brevets sur les annonces et les idées, il ne faut pas s’étonner de se faire damer le pion dans de telles circonstances.

Dans un article publié en mai, j’analysais la démarche de Google et j’évoquais la nécessité de travailler en réseau plutôt que sous forme d’une organisation monolithique (pour toutes sortes de raisons – l’efficacité en étant une) – celle qui semblait émerger autour du projet d’une bibliothèque numérique européenne. Il n’est toujours pas clair, d’ailleurs, ce qui se fait en France et en Europe dans ce domaine, les signaux publics étant souvent contradictoires : comité français ? groupe[s] de bibliothèques nationales ? et la récente annonce, que j’avais relayée, des plans de la Commission européenne « pour créer des bibliothèques numériques européennes », critiquant les « efforts dispersés » d’initiatives dans les états membres ?

Si, en mai, je pouvais conclure en disant « Entre temps, Google avance », depuis, d’autres ont avancé au-delà des effets d’annonce. Il n’est pas étonnant que la British Library ait décidé de passer à l’acte.

The Blog of Miklos • Le blog de Miklos