Copie conforme ? Le curieux cas des scanners de Xerox
Un chercheur allemand, David Kriesel, a récemment découvert que certains scanners et copieurs de Xerox remplaçaient aléatoirement des chiffres présents dans le document source par d’autres chiffres dans l’image numérique qui résulte de la numérisation. Cette modification est parfois radicale et peut aller bien au-delà d’une certaine ressemblance de la source et du résultat : par exemple « 21.11m2 » se voit transformé en « 14.13m2 ». Il précise bien qu’il ne s’agit pas d’une erreur dans une quelconque reconnaissance de texte, mais dans la reproduction de l’image originale.
Ainsi, lorsque l’on scanne ou photocopie un document comprenant des chiffres – dans son cas il s’agissait d’un plan architectural mais pensez à votre fiche de salaire, à des résultats médicaux, à des dates d’anniversaires ou à des recettes de cuisine, à des plans de systèmes de sécurité… –, le résultat peut être différent de la source d’une façon parfois si subtilement discrète (à l’instar de l’exemple ci-dessus qu’il donne dans son article) qu’il est difficile de le remarquer à première vue.
Après avoir découvert ce phénomène incroyable, il en a prévenu Xerox avant d’en parler sur son blog. Il s’avère que :
– Xerox était au courant de ce problème qui existe depuis plusieurs années, et le manuel utilisateur de ce matériel (qui le lit ?) y ferait allusion ; toutefois, selon Kriesel, les recommandations d’usage qui y sont données pour éviter ce phénomène ne sont pas efficaces à son encontre ;
– ce dysfonctionnement semble être essentiellement dû à une « optimisation » du processus de production de l’image numérique compressée.
David Kriesel soulève la question de la valeur juridique d’une photocopie (même certifiée : vérifie-t-on chaque pixel avant de le faire ?) et se demande maintenant si d’autres marques de scanners peuvent exhiber ce comportement inquiétant dont l’ampleur des implications futures comme passées est impossible à évaluer. Une autre question, qu’il ne soulève pas, peut venir à l’esprit : est-ce que ce dysfonctionnement peut aussi affecter du texte, en y remplaçant une lettre par une autre ?
On trouvera dans son blog des exemples illustrés, le détail des événements et une explication technique de ce qu’il pense être la cause de ce phénomène.
Ce n’est pas un canular : Xerox a publié déjà au moins deux communiqués à ce sujet, l’un d’eux fournissant la liste des modèles affectés et annonçant un correctif futur.
Pour finir, on ne peut que resoulever la problématique du « numériser pour conserver ».