Posts Tagged ‘logiciel détecteur’

Pour laver plus blanc que blanc

mercredi, octobre 10th, 2018

Si la détection de la fraude scientifique a pris une importance considérable on ne peut pourtant pas, en théorie, s’en offusquer. Un récent article soulève pourtant plusieurs questions à son propos (Fourberie des cookies, c’est pas du gâteau !, https://www.jim.fr/medecin/jimplus/e-docs/fourberie_des_cookies_cest_pas_du_gateau__174041/document_jim_plus.phtml). En ce qui concerne les publications dans le domaine scientifique on reconnaît aujourd’hui plusieurs types d’inconduites. Il peut s’agir  de falsification,  de fabrication ou de plagiat de données mais en aucun cas de ce que l’on qualifie d’erreurs scientifiques car si ces dernières sont légions elles sont aussi indispensables à la culture de la science et sont largement prises en compte dans l’épistémologie scientifique. Les demandes et obtentions de rétractation sont devenues une épreuve sportive très courue, donnant lieu à leur tour à publications comme en témoignent quelques exemples  parmi les plus récents : The Top 10 Retractions of 2015 (https://www.the-scientist.com/news-opinion/the-top-10-retractions-of-2015-34319), Top 10 Retractions of 2016 (https://www.the-scientist.com/news-opinion/top-10-retractions-of-2016-32329) Top 10 Retractions of 2017 (https://www.the-scientist.com/research-round-up/top-10-retractions-of-2017-29834), le Top 10 2018 étant très vraisemblablement en cours de rédaction. Quand on reprend les falsifications stricto sensu, une revue systématique de 2009 et une méta-analyse des données d’enquêtes ont révélé qu’environ 2% des scientifiques avaient admis avoir falsifié, fabriqué ou modifié des données au moins une fois. Le cas de l’auteur du blog Perruche met en cause le logiciel de détection du plagiat. Depuis une petite dizaine d’années, ces outils se multiplient et leur comparaison devient dès lors possible. Qu’ils soient anglophones ou francophones selon leurs zones d’exploitation il sont basés sur un processus de comparaison d’une (de) référence(s) stockée(s) parmi les bases de données des développeurs, ce qui constitue déjà une certaine limitation. Si la connaissance par l’intéressé de son utilisation a entrainé des améliorations, elle lui a aussi donné envie de contourner l’obstacle. Mais ce qui courrouce particulièrement ce responsable du travail censuré et rejeté c’est l’emploi d’une intelligence artificielle, IA,  manifestement non intelligente, IANI. Pourquoi alors, ne pas imaginer opérer en deux temps : en première ligne une IA en deuxième ligne une IH (intelligence humaine) qui vient nuancer la première pour la valider, une IAA (intelligence artificielle augmentée) en quelque sorte ! Comme l’a écrit si bien Le Monde de l’Education (https://www.lemonde.fr/education/article/2014/03/12/universites-les-limites-des-logiciels-contre-la-fraude_4381590_1473685.html), le logiciel ne doit être considéré que comme un surligneur.