Miklos
« Je donne mon avis non comme bon mais comme mien. » — Michel de Montaigne

This blog is © Miklos. Do not copy, download or mirror the site or portions thereof, or else your ISP will be blocked. 

25 mai 2007

De la servitude volontaire, ou : voulez-vous jouer avec moâ ?

Classé dans : Progrès, Sciences, techniques — Miklos @ 18:19

« Chose vraiment étonnante — et pourtant si com­mune qu’il faut plutôt en gémir que s’en ébahir —, de voir un million d’hommes misé­ra­blement asservis, la tête sous le joug, non qu’ils y soient contraints par une force majeure, mais parce qu’ils sont fascinés et pour ainsi dire ensor­celés par le seul nom d’un, qu’ils ne devraient pas redouter — puisqu’il est seul — ni aimer — puisqu’il est envers eux tous inhu­main et cruel. » — Étienne de La Boétie, Discours de la servitude volontaire.

Les ordinateurs sont considérés comme une aide (ou une prothèse) de plus en plus indispensable à l’homme. Du fait de la démultiplication de leur puissance de calcul, de la baisse de leurs coûts et des capacités accrues des réseaux, ils sont attelés en multitude d’un bout du monde à l’autre, pour effectuer, tels une immense foule d’esclaves, des tâches d’une complexité inouïe, sur Terre comme au Ciel. Or il s’avère qu’il y a des problèmes qu’ils sont encore incapables de résoudre aussi bien que leur Créateur leurs créateurs, et donc de s’y substituer finalement.

C’est là qu’intervient un jeune chercheur génial1 de la grande université Carnegie Mellon, Luis von Ahn. À la base de ses travaux extraordinaires le constat suivant : l’humanité vivant en symbiose croissante avec l’ordinateur, pourquoi ne pas l’atteler elle pour contribuer à la résolution des problèmes qu’elle pose à ce qui est en passe de devenir son futur maître – l’avatar du aide-toi toi-même, mais par ordinateur interposé ? Et comme le jeu est une nécessité, voire une drogue, pour l’homme, si on rend cette activité ludique, il trouvera plaisir à cette servitude volontaire et en redemandera. Surtout si elle est informatique : le nombre de participants à des jeux informatiques en réseau, leur dépendance à cette activité et le temps qu’ils y passent, le démontrent bien.

L’un de ce genre de problèmes auquel von Ahn s’est attaché est celui de l’indexation d’images : les principaux moteurs de recherche identifient des images (pour permettre de les retrouver) en se basant non pas sur leur contenu2 mais sur le texte qui se trouve dans son voisinage (titre de la photo, mots de l’adresse, etc.), et donc avec une mesure de succès inégale ; or l’homme le fait rapidement et bien3. Von Ahn a inventé un jeu en ligne, appelé The ESP Game (« jeu de la perception extrasensorielle », qui ne voudrait pas y jouer ?) qui fonctionne de la façon suivante : les participants sont appairés par le système et ne peuvent communiquer directement ; une image identique, choisie aléatoirement sur le Web par le dispositif, s’affiche sur leurs écrans ; l’un et l’autre saisissent des mots ou des expressions qui décrivent, selon eux, l’image. S’ils trouvent le même mot, ils gagnent des points (ce défi – présenté comme celui de deviner ce que l’autre pense – participe de l’effet ludique, ) et le mot est retenu par le système – qui empêchera sa réutilisation par d’autres joueurs amenés à décrire éventuellement cette même image ; plus la liste de mots interdits (appelés « tabous », ce que l’on veut toujours dépasser…) est longue, plus le nombre d’images que le couple choisit au départ d’identifier est élevé, plus le score pour une identification simultanée est élevé. Ainsi, le vocabulaire servant à décrire chaque image s’enrichit, au fil des jeux. Selon von Ahn, il suffirait de deux mois à 5 000 joueurs pour identifier de façon satisfaisante4 toutes les images qu’indexe Google – ce qui ne devrait pas être trop difficile : certains joueurs y passent déjà plus de 40 heures par semaine. Un autre jeu qu’il a conçu est destiné à aider l’ordinateur à reconnaitre des composantes d’images et de les localiser dans l’image : ceci permettra aux moteurs de recherche d’images de fournir des réponses en détourant dans celles-ci la partie qui correspond à la requête, de même que la plupart le font déjà pour la recherche de texte.

Von Ahn n’en est pas à son premier coup de maître : il est l’inventeur des « captcha »5, dispositif qui affiche à l’écran de l’utilisateur potentiel d’un service un texte déformé de telle façon que les ordinateurs ne peuvent l’identifier, contrairement à un être humain ; l’utilisateur devra le saisir au clavier afin de passer à l’étape suivante. Ceci permet d’éliminer les abus croissants de ces services destinés à l’origine à des personnes, mais faisant l’objet d’utilisation par des « robots » à des fins diverses et variées ; par exemple, la possibilité de commenter des blogs est la cible de ce type d’attaques, qui rajoutent, automatiquement, des « commen­taires » n’ayant aucun rapport avec l’article d’origine, et promouvant des services commerciaux.

Un autre exemple, bien plus intéressant dans ses déve­lop­pements à rebonds, est celui du pourriel (« spam », en anglais) qui menace de nous engloutir tous, à l’instar de ce personnage du film Brazil qui disparait dans une tornade de papier : ceux-ci sont souvent envoyés, en un nombre astronomique, à partir de comptes gratuits que tout un chacun peut ouvrir chez des fournisseurs d’accès ; avec le temps, ceux-ci ont limité le nombre de courriers qu’un utilisateur peut envoyer (par jour ou par semaine), pour tenter de réduire ce genre d’abus. En réaction, les spammeurs ont développé des logiciels, qui, se faisant passer pour des humains, « remplissent » automatiquement les formulaires d’ouverture de comptes gratuits, et leur permettent ainsi de se créer des milliers de boîtes à lettre, chacune d’elle devenant une source de spams – le nombre de comptes palliant la limite d’émission de chacun d’eux. En retour, les fournisseurs d’accès ont mis en place ces captchas (proposé à l’origine pour Yahoo), qui nécessitent une intervention humaine pour passer à l’étape suivante.

S’ils ont ainsi gagné la bataille, les spammeurs n’ont pas perdu la guerre, car l’histoire ne s’arrête pas là ; ces derniers ont réagi de la façon suivante : lorsque leur logiciel de création automatique de boîte à lettres se trouve confronté à un captcha qu’il ne peut résoudre, il l’affiche – par exemple – dans un site porno­graphique gratuit comme condi­tion pour passer voir le contenu ; le « client » du site le saisira au clavier, ce qui aura pour double effet de lui permettre de passer à la partie juteuse du site, et de créer, chez le fournisseur de boîtes à lettre, un compte supplémentaire pour le spammeur. Certains d’entre eux, non contents d’avoir ainsi surmonté cet obstacle, ont aussi utilisé une sorte de captcha afin de contourner les filtres destinés à identifier les pourriels : ils codent le texte de leur publicité (concernant majo­ri­tai­rement l’achat d’un certain type d’actions en bourse) sous forme d’image qui serait illisible pour l’ordinateur chargé de les filtrer, et y rajoutent parfois un texte sans rapport avec la publicité dans le corps du courrier, hors de l’image. Ainsi, leur courrier (appelé « image spam », en anglais) n’est pas éliminé ni par l’identification du texte publicitaire (impossible pour l’ordinateur), ni au prétexte qu’il ne contiendrait qu’une image. Or les ordinateurs s’améliorant dans leur capacité à identifier ce genre de pourriel, les spammeurs les ont rendu de plus en plus complexes (pixélisation du fond, utilisation de couleurs différentes, ondulation des lettres…) à tel point que leurs victimes humaines n’arrivent plus à les lire : au moins, là, ils se sont tiré une balle dans le pied – c’est l’une des raisons de la décroissance actuelle de ce genre de pourriel.

De son côté, von Ahn vient de trouver une application extrê­mement utile des captchas : l’assistance à la numé­ri­sation et à la recon­nais­sance optique de caractères (Ocr). Les grands projets actuels de création de bibliothèques numériques se voient ainsi confrontés aux limites de ces logiciels, qui sont d’autant plus grandes que les documents numérisés sont plus anciens (« V>oitant ^ttgîtfaigc Ô0rrm«c » correspondant à « Portant ung visaige dhermite »). Son nouveau jeu, reCaptcha, présente deux mots déformés de façon semblable à l’écran : l’un connu de l’ordinateur, l’autre résultant d’une numérisation d’un texte dont l’ordinateur n’a pu déterminer le sens. Le lecteur doit saisir les deux mots au clavier. L’ordinateur vérifie que le mot qui lui est connu a été correctement identifié par le lecteur, et en conclut que ce dernier a sans doute bien identifié l’autre mot. Ce mot sera proposé à d’autres lecteurs dans un contexte similaire, et si les réponses concordent, on pourra supposer que l’identification est correcte. Non seulement ce service sert à éviter des abus, il contribue aux entreprises de numérisation du patrimoine culturel. Simple, génial5.

À moins que les spammeurs… Entre temps, ce sont les ordinateurs qui nous font trimer pour eux de façon accrue, satisfaisant ainsi aux récentes injonctions de « travaillez plus » adressées à nos frères humains qui après nous vivront.

À lire, à voir :
• Joseph O’Neill : Land Under England
• A. E. Van Vogt : Le monde des à (trad. Boris Vian)
• Stephen Shankland : New tool screens spam, digitizes books (article de CNET, 24 mai 2007)
• La fascinante vidéo de la présentation que von Ahn a fait de ses divers « jeux »(juillet 2006).


1Il a été l’un des lauréats, en 2006, du prix de la fondation MacArthur, destiné à récompenser les individus ayant fait preuve d’une créativité exceptionnelle et susceptibles de continuer sur cette voie.
2Ce que l’ordinateur ne fait que difficilement et pour certains types d’images uniquement. Certains secteurs d’activité bénéficient de budgets conséquents pour ce genre d’application (spatial, militaire, télésurveillance…).
3Le service de recherche d’images Live Search de Microsoft permet d’annoter des images, mais je doute que beaucoup se plient à cette démarche.
4Les résultats fournis ainsi sont parfois curieux, et vont certainement bien au-delà des capacités des ordinateurs : von Ahn rapporte qu’une photo du président G. W. Bush s’est vue indexée non seulement par des termes tels que homme, président, Bush…, mais aussi beurk…
5Acronyme de « Completely automated public Turing test to tell computers and humans apart », ou « test de Turing complètement automatisé destiné à distinguer l’homme de l’ordinateur ». Ce test, proposé à l’origine par le mathématicien Alan Turing, était destiné à répondre à la question « est-ce qu’une machine peut penser ? ». Il s’effectue de la façon suivante : une personne pose une série de questions à deux interlocuteurs invisibles, l’un humain, l’autre non, qui doivent lui répondre dans la mesure de leurs capacités respectives. Cette personne doit décider lequel de ses interlocuteurs est l’homme, et lequel la machine. L’échange s’effectue par l’entremise d’une machine à écrire – ainsi l’interrogateur n’a, pour se déterminer, que le texte des réponses qui lui sont fournies. S’il est incapable de le faire, on en conclut que la machine a passé l’examen.
6Il faut tout de même signaler que l’usage des captchas est exclus pour les personnes à visibilité réduite (ou daltoniennes), soit parce qu’elles ne peuvent distinguer le mot à identifier, soit parce que leur outil d’aide vocal à la navigation ne peut le faire (et pour cause : les captchas sont conçus pour ne pouvoir être lus par un ordinateur).

4 commentaires »

  1. ESP Game : expérience faite, c’est un instrument intéressant, amusant, mais pas efficace. Le principe semble parfait : si deux personnes décrivent l’image de la même façon, alors la description est bonne. Pourtant, le jeu, avec ses bonus et son temps limité, incite à la facilité.
    - Une statue de la Venus de Milo, conservée au Louvre, va, au mieux, se retrouver avec les tags « white » et « statue », au mieux, un jour avec « marble ». Les mots et expression « Venus », « Venus of Milo » et « Louvre » n’étant pas reconnus par le dictionnaire donnent peu d’espoir que deux personnes simultanément donnent le titre complet.
    - La gestion des couleurs est très problématique : un homme noir au t-shirt blanc sera décrit par « man », « t-shirt » et « white » (ou « black »), mais pas les deux car une seule couleur est autorisée, sans relation entre les termes.
    - Les paysages et photos descriptives sont analysées, mais pas décrites : « sky », « tree », « green » (ou « blue ») ne permettront jamais d’ordonner la photo sous « landscape », car il y a du ciel et des arbres aussi dans la ville.
    En revanche, tous ces inconvénients n’existent pas pour la lecture des mots.
    Donc : vivement que ce jeu soit implémenté sur Europeana !!!

    Commentaire par mango — 29 mai 2007 @ 11:11

  2. Merci pour le commentaire. Il est clair que l’ESP Game a des limites – à certains égards comme ceux d’un autre outil collaboratif sans direction éditoriale forte (ou sans aucune direction éditoriale), Wikipedia : la compétence, l’opinion et autres dimensions ne sont pas clairement distinguées (c’est le moins qu’on puisse dire). Le choix de la langue implique aussi des orientations (une photo d’un paysage neigeux aurait été décrite autrement par des Inuits).

    Quant à la description des contenus, von Ahn a inventé d’autres « jeux » collaboratifs destinés à identifier et à localiser des parties d’images.

    Je ne crois pas que ce soit la solution miracle, et les dérives existeront forcément, malgré la bonne intention et les filtres qu’ils établissent contre les abus du système. L’effet de masse créera sans doute une base de données assez importante (volume) avec un certain taux de plausibilité des contenus – probablement bien plus bas que celui que l’on trouve dans les bases de données alimentées par des professionnels. On rétorquera que, vu le prix… C’est toujours le fond du débat (même si on ne veut pas y toucher) : la qualité se paie ; les gens ne sont pas prêts à payer, et surtout pas pour les autres (qui ne peuvent payer).

    Quant à Europeana, évidemment ; on pourrait aussi s’inspirer, comme je l’ai écrit ailleurs, de l’interface pour la lecture des livres numérisés que l’on trouve sur l’Internet Archive (base avec laquelle travaille von Ahn ; il n’y a pas de hasards).

    Commentaire par Miklos — 29 mai 2007 @ 12:51

  3. [...] ses bras (électroniques), c’est si facile de rester aveuglé devant l’évidence – celle de cette servitude volontaire dans laquelle chacun se livre par facilité ou par commodité, d’autant plus qu’elle n’est [...]

    Ping par Miklos » Des nouvelles de notre AMI à tous, ou, Big Brother is Watching Your WiFi — 16 mai 2010 @ 8:11

  4. [...] se rendent indispensables. De là à ce que nous devenions « leurs » serviteurs, il n’y a plus qu’un petit pas, comme aurait dit Mao, le grand bond en avant ayant pris place quelque part durant le Moyen [...]

    Ping par Miklos » De l’Androïde et de ses congénères, ou, du futur antérieur de l’Homme — 21 janvier 2013 @ 2:38

Flux RSS des commentaires de cet article. TrackBack URI

Laisser un commentaire

XHTML: Vous pouvez utiliser ces balises : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

The Blog of Miklos • Le blog de Miklos