D-ID révolutionne la traduction vidéo : créer du contenu multilingue n’a jamais été aussi simple
La start-up israélienne D-ID repousse les limites de la traduction vidéo avec son nouvel outil Video Translate.
Ce logiciel utilise l’IA générative pour permettre à tout créateur de contenu de traduire ses vidéos dans d’autres langues tout en conservant une synchronisation labiale précise et un clonage vocal authentique.
Concrètement, en téléchargeant simplement une vidéo depuis un téléphone, il est possible en quelques minutes de produire des versions en plusieurs langues, avec une voix fidèle à l’original et une animation réaliste.
D-ID, à l'origine spécialisée dans la désidentification des visages pour contourner la reconnaissance faciale, propose aujourd'hui un outil qui ouvre de nouvelles perspectives dans le monde du marketing, des réseaux sociaux et même de la formation en ligne.
Le responsable du contenu et du marketing chez D-ID, Ron Friedman, explique : « L’idée est de permettre à chacun de créer des vidéos dans des langues qu’il ne parle pas », tout en préservant une interaction visuelle naturelle.
Une technologie simple et performante
Video Translate permet à la fois aux utilisateurs particuliers et aux entreprises de toucher un public international en brisant les barrières linguistiques. Que ce soit pour envoyer un message personnel dans une langue étrangère ou pour lancer une campagne publicitaire multilingue, cette technologie offre une solution plus engageante que les sous-titres ou le doublage.
Le logiciel propose actuellement 30 langues pour le rendu, et chaque version de la vidéo reproduit la voix d’origine en la modifiant subtilement pour qu’elle corresponde à la langue cible. Pour Tal Ron-Pereg, directeur produit chez D-ID, « la plupart des spectateurs ne se rendent pas compte qu’ils regardent une vidéo générée par IA », même si les plus attentifs pourront parfois deviner l’astuce.
La précision encore en développement
Bien que la traduction soit en grande partie fidèle, il reste quelques imprécisions. Par exemple, dans une vidéo où l’utilisateur déclarait « Je ne parle ni français, ni arabe, ni japonais », l’IA a parfois ajouté des mots aléatoires. D-ID travaille sur une mise à jour qui permettra aux utilisateurs de relire et de corriger la traduction avant le rendu final, une fonctionnalité essentielle pour les professionnels qui souhaitent garantir la précision de leurs messages.
Avantages pour les professionnels et les créateurs de contenu
En proposant une alternative au sous-titrage et au doublage traditionnels, Video Translate représente un atout majeur pour les entreprises désireuses de s’étendre sur des marchés internationaux. Selon Friedman, l'outil de D-ID offre un rapport coût-efficacité imbattable : un seul enregistrement permet désormais de produire de nombreuses versions adaptées à différentes audiences, sans avoir recours à des enregistrements séparés coûteux.
L’avocate Shirley Katzir de Fisher (FBC), spécialisée dans l’aviation, tourisme et hôtellerie, souligne que « le plus grand défi pour les entreprises consiste à proposer des versions multilingues cohérentes ». Avec Video Translate, les créateurs de contenu bénéficient d’un processus rapide, précis et accessible, qui leur ouvre de nouvelles perspectives sans altérer leur voix originale ni leur message.
L'avenir de la technologie de D-ID
D-ID prévoit d’élargir les fonctionnalités de Video Translate, en permettant par exemple aux utilisateurs de fournir des instructions spécifiques pour la prononciation ou le ton souhaité. Au fil du temps, le logiciel devrait également pouvoir gérer plusieurs locuteurs dans une même vidéo et s'adapter à des langues supplémentaires, comme l’hébreu, pour l’instant uniquement disponible en langue d'entrée.
L’évolution de D-ID depuis ses débuts en 2017 démontre sa capacité à innover.
L’entreprise, fondée par Gil Perry, Sela Blundheim et Eliran Kota, s'est d'abord illustrée par son expertise en désidentification, modifiant des visages pour contourner les systèmes de reconnaissance faciale. Aujourd’hui, avec des avatars photoréalistes capables d’interagir de manière naturelle, D-ID continue d’innover et de repousser les limites de l’interaction numérique.
Un avenir tourné vers les interactions naturelles
Selon D-ID, l’avenir réside dans une interface utilisateur naturelle qui permettra de converser directement avec un avatar sur un site web ou une application. « Au lieu de naviguer sur un site web, vous pourrez poser des questions et obtenir des réponses instantanées d’un avatar », explique Friedman. Que ce soit pour ouvrir un compte bancaire, prendre un rendez-vous ou résoudre un problème, l’interface sera conçue pour reconnaître le ton de votre voix et réagir de manière appropriée.
Grâce à son investissement dans l’IA et l’interaction humaine virtuelle, D-ID façonne l’avenir de la technologie vidéo multilingue et de la communication en face-à-face avec des avatars. Avec 90 employés et un financement de 48 millions de dollars, l’entreprise de Tel Aviv poursuit sa croissance et son développement pour offrir des outils innovants à des utilisateurs du monde entier.
Vos réactions