Pour lutter contre la concurrence numérique, le livre papier joue de plus en plus la carte du “bel objet”. Dans ce contexte, la couverture joue un rôle central dans la séduction du lecteur et livre beaucoup d’information sur ce qui va se trouver à l’intérieur. Forts de ce constat, Brian Kenji Iwana et Seiichi Uchida, de l’université de Kyushu au Japon ont voulu savoir si un ordinateur pouvait – à l’image d’un humain – juger un livre à sa couverture.
Pour cela, les chercheurs ont mis un “deep neural network” au travail. Comprendre une intelligence artificielle capable d’apprendre à identifier des règles générales à partir d’exemples. Concrètement, ils ont utilisé 137 788 couvertures de livres classées en 20 catégories. 80% des ces couvertures ont servi d’exemples, pour entraîner le neural network. 10% des couvertures ont servi à valider le modèle d’analyse et les 10% restantes ont été soumises à la sagacité de la machine.
Résultats ? La machine est encore loin du niveau d’un humain mais elle progresse. Dans 20% des cas, le premier choix de l’ordinateur est le bon. Dans 40% des cas, un des 3 premiers choix est juste. Des résultats qui s’expliquent par la relative indistinction des couvertures dans certaines catégories. Ainsi, les biographies sont souvent confondues avec les livres d’histoire, les comics sont interprétés comme des livres pour enfants et les ouvrages de médecine comme des livres de science. Comme on peut s’y attendre, le neural network s’en sort beaucoup mieux avec les livres de voyage, de cuisine ou de technologie, dont les couvertures sont très normalisées.
Les chercheurs travaillent déjà sur une version améliorée qui devrait apprendre à lire le texte en plus des images…
Judging a book by its cover
Image : fox-and-fern, flickr