Un outil anti-plagiat d'une startup israélienne utilise l'AI pour détecter les paraphrases

Actualités, Alyah Story, Culture, High-Tech, Israël - le - par .
Transférer à un amiImprimerCommenterAgrandir le texteRéduire le texte
FacebookTwitterGoogle+LinkedInPinterest
Un outil anti-plagiat d'une startup israélienne utilise l'AI pour détecter les paraphrases

Voler l'écriture d'autres personnes devient plus difficile grâce à cette startup israélienne

Une startup israélienne utilise l'AI,pour détecter le plagiat et la violation du droit d'auteur pour des clients tels que Macmillan Publishers, l'Université de Stanford, la BBC et l'ONU.

Le plagiat a explosé à l'ère du Covid-19. 
Alors que de plus en plus de personnes travaillaient à domicile et suivaient des cours via Zoom, sans supervision directe, la tentation de coopter le travail de quelqu'un d'autre a augmenté de façon exponentielle, tout comme des moyens de plus en plus sophistiqués de copier le travail d'une autre personne.

Des astuces telles que le remplacement d'une lettre comme "o" par un caractère similaire dans un alphabet non latin ou l'utilisation de texte "invisible" surligné en blanc pour déjouer les programmes actuels de détection des droits d'auteur sont devenues monnaie courante.

Le pourcentage moyen de plagiat avant et après Covid est passé de 26% à 45% aux Pays-Bas, de 37% à 49% en France et de 42% à 53% en Inde, selon une enquête menée auprès de 51 000 collégiens et lycéens. par le fabricant de logiciels anti-plagiat CopyLeaks .

La solution où un logiciel vérifiait dans une base de données des groupes de mots et les paragraphes copiés n'est plus d'actualité. Avec l'intégration de l'utilisation de l'intelligence artificielle (AI) qui ne se contente pas de comparer les mots aux mots mais aussi "le sens pour le sens nous arrivons à une solution aboutie", explique Alon Yamin, PDG de CopyLeaks.

La startup israélienne est utilisée par des écoles et des organisations du monde entier, notamment Macmillan Publishers, l'Université de Stanford, la BBC, Medium, la National Space Society, les Nations Unies, Cisco et Accenture, ainsi que par des étudiants, des blogueurs et des journalistes.

La longue liste de clients de CopyLeaks révèle non seulement à quel point son logiciel peut être utilisé, mais aussi à quel point le problème du plagiat est devenu omniprésent.

Les écoles peuvent être le principal cas d'utilisation des outils anti-plagiat, mais les publications et les éditeurs de livres peuvent également utiliser CopyLeaks pour s'assurer que leurs auteurs n'ont pas détourné - même accidentellement le travail de quelqu'un d'autre (les journalistes, par exemple, paraphraseront souvent le texte d'un autre article , en supposant qu'ils ont apporté suffisamment de modifications pour se l'approprier ; sinon, la publication pourrait faire l'objet de poursuites judiciaires).

Utilisation abusive du contenu

Les entreprises développant des sites Web d'entreprise sont une autre source de clients potentiels pour des entreprises comme CopyLeaks.

C'est ainsi que le cofondateur et directeur technique de CopyLeaks, Yehonatan Bitton, a trouvé sa vocation dans l'espace anti-plagiat.

En 2013, Yehonatan Bitton développait du contenu pour un site Web familial lorsqu'il a découvert qu'il était copié par des sites concurrents. Le vol était frustrant, mais pire encore, ces multiples sources de contenu identique faisaient chuter les classements de recherche du site, SEO ce qui avait un impact négatif sur les ventes.

Il a cherché une solution logicielle pour détecter une telle utilisation abusive du contenu, mais n'en a pas trouvé. Il a ensuite lancé l'idée développer quelque chose qui pourrait résoudre son problème avec Yamin, son collègue de travail de l'époque et diplômé de l'unité de renseignement sur les signaux 8200 de Tsahal.

Yamin a joué un rôle déterminant dans le développement d'algorithmes basés sur l'IA et l'apprentissage automatique pour le renseignement de l'armée israélienne ; c'est cette technologie qui est devenue la base de CopyLeaks.

Promouvoir l'authenticité

Quelque 70 millions de cas de violation du droit d'auteur ont été découverts par la technologie de CopyLeaks à partir de 75 millions de pages numérisées et de 58 millions de documents comparés.

CopyLeaks utilise l'IA pour comprendre la "patte" d'un écrivain. Cela va au-delà des mots, où les outils automatisés "peuvent jouer avec le texte, changer les mots et leur ordre, ce qui permet de masquer facilement le plagiat", a déclaré Yamin.

"Même si aucun mot n'est identique, nous pouvons détecter si le sens ou la structure de la phrase est similaire."

Ce n'est pas au-delà de la capacité des lecteurs humains, "mais nous pouvons le faire de manière automatisée à un volume très élevé".

Et dans un nombre croissant de langues : CopyLeaks prend actuellement en charge plus de 100 langues, dont l'hébreu et l'hindi.

CopyLeaks peut aider les écoles et les publications à prévenir la violation intentionnelle ou accidentelle du droit d'auteur, mais c'est aussi un moyen « de s'authentifier, de s'assurer que vous avez suffisamment paraphrasé, que vous avez correctement attribué toutes vos citations. Notre objectif est de promouvoir l'authenticité », déclare Yamin.

"Une analyse CopyLeaks peut prendre de quelques secondes à quelques minutes en fonction de facteurs tels que la taille du document ou le nombre de résultats", explique Yamin.

Vous cherchez à communiquer efficacement sur vos services ?
Communiquez sur Alliancefr.com, le premier magazine juif sur le net 
Plus qu’un magazine, Alliance est une plateforme à destination de la communauté juive francophone concernée par Israël et le monde juif
Son ADN  : offrir  une information dans tous les domaines sur Israël 
contactez-nouspour découvrir la formule de communication qui vous convient.
tel : 01 70 00 75 75

Vos réactions

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

A voir aussi