Des scientifiques ont découvert que la majorité des gens sont incapables de dire si une voix qui leur parle est celle d’une personne réelle ou d’un clone d’IA. Le clonage audio de l’IA est aujourd’hui si avancé qu’il est capable de créer des paragraphes entiers à partir de petites bribes d’enregistrements et de produire une voix indiscernable d’un véritable être humain.
Les experts craignent que des voix d’ordinateur réalistes puissent être utilisées par des escrocs imitant des banques et diffusant des fausses nouvelles (écouter ici sur The Telegraph)
Des chercheurs de l’University College London ont fait écouter des clips audio à 100 personnes et ont constaté qu’elles ne pouvaient pas distinguer la voix humaine de celle créée à l’aide de l’intelligence artificielle (IA). Une phrase a été jouée deux fois – lue par une personne réelle et par un clone d’IA de cette personne – et il a été demandé aux personnes de dire laquelle était authentique. Les participants n’ont répondu correctement que dans 48 % des cas.
Les gens reconnaissaient mieux l’IA lorsqu’elle se faisait passer pour une personne qu’ils connaissaient, et l’identifiaient correctement dans 88 % des cas lorsqu’il s’agissait de la voix d’un ami.
Le professeur Carolyn McGettigan, auteur de l’étude et directeur du département des sciences de la parole et de l’audition à l’UCL, a présenté ses conclusions au British Science Festival avant leur publication dans une revue scientifique.
« Ce que nous avons découvert, c’est que les personnes qui connaissent la voix originale sont très sensibles au fait de savoir si ce qu’elles entendent est un clone ou un enregistrement authentique. En revanche, lorsqu’il s’agit de la voix d’un inconnu, ils ne font que deviner », a déclaré le professeur McGettigan.
« Ce que nous constatons aujourd’hui, c’est que la technologie est suffisamment performante pour que les auditeurs soient incapables de dire si ce qu’ils écoutent est la voix d’une personne réelle ou non ».
Expérience ad hoc
Un enregistrement de la fable d’Ésope, Le vent du nord et le soleil, a été diffusé à haute voix à des journalistes présents au festival. Il leur a été demandé de dire si le clip audio était vrai ou faux. Tous les participants à l’expérience ad hoc ont cru à l’authenticité de l’enregistrement, mais le professeur McGettigan a révélé qu’il s’agissait d’une chimère, avec des voix humaines et des voix d’IA imbriquées dans un même clip.
« Il est difficile de penser qu’il s’agit d’une voix générée par un ordinateur, et vous n’auriez probablement pas pensé qu’il y avait deux sources différentes de parole », a déclaré le professeur McGettigan.
« Les voix synthétiques peuvent avoir un son très, très humain. Vous étiez tous convaincus qu’il s’agissait d’une voix humaine tout au long du processus ».
La technologie est aujourd’hui si facilement disponible et si avancée que des personnes et des entreprises envisagent de permettre aux gens d’utiliser des clones IA d’une voix spécifique pour des assistants intelligents tels que Siri et Alexa, ou de lire des livres audio à des particuliers.
Questions éthiques
Le professeur McGettigan ajoute que de sérieuses questions éthiques se posent sur la manière de déployer et de réglementer cette technologie, ainsi que sur la manière de protéger les personnes contre la tromperie. Il est également possible que la technologie soit utilisée pour recréer la voix d’un être cher décédé, dans le style de la série télévisée de science-fiction Black Mirror.
« La technologie existe déjà, c’est donc à nous de décider comment l’utiliser au mieux », a déclaré le professeur McGettigan.
« Je pense qu’il est réaliste de dire que tout type de technologie sera toujours susceptible de faire l’objet d’abus, quels que soient ses avantages. Il semble qu’il y ait probablement des moyens par lesquels, en tant que société, nous devons réfléchir à la manière dont nous évaluons l’information. Je pense qu’il existe de nombreuses possibilités de préjudice dans ce type de technologies qui pourraient chercher à reproduire l’identité d’une personne si elles étaient utilisées à des fins malveillantes, mais je suppose que la question est de savoir dans quelle mesure la minimisation des préjudices interromprait également les avantages potentiels »
Le « Meilleur » des mondes est-il devant nous ?
Crédit photo : Pixabay (cc)
[cc] Breizh-info.com, 2024, dépêches libres de copie et de diffusion sous réserve de mention et de lien vers la source d’origine