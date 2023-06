INTOX

Publiée le 6 juin par un compte Facebook basé au Burkina Faso, une vidéo prétend révéler une conversation secrète enregistrée à l’insu du président français Emmanuel Macron, dans laquelle il révélerait la stratégie de la France au Mali. La vidéo est un montage audio, composé de vrais discours prononcés par le président français et disponibles en ligne, mélangés avec des phrases d’origine inconnue attribuées au président. Selon des experts qui ont analysé le contenu, ces phrases d’origine inconnue contiennent de nombreuses incohérences, indiquant une probable manipulation. Ils n’excluent pas la possibilité d’une reconstitution par intelligence artificielle de la voix d’Emmanuel Macron, lui faisant tenir des propos qu’il n’a en réalité jamais tenu.

La vérification en bref

Une vidéo affirme dévoiler un enregistrement sonore pris secrètement révélant des propos d'Emmanuel Macron sur le Mali visant à "trouver une solution" contre les autorités maliennes.

Une analyse de la vidéo montre qu'elle est composée de vraies phrases prononcées lors de plusieurs discours par le président français et d'autres phrases présentant des erreurs de syntaxe et de français.

Des experts en voix créée par intelligence artificielle ont estimé que la vidéo comprenait plusieurs incohérences sonores et de nombreuses tentatives de dissimuler un montage.

La rédaction des Observateurs de France 24 a pu générer une voix similaire d'Emmanuel Macron grâce à un logiciel en ligne lui faisant prononcer les mêmes phrases.

Le détail de la vérification

La vidéo publiée le 6 juin sur la page Facebook burkinabè "Citoyen burkim-biiya " (archive ici ) avec plus de 200 000 abonnés commence avec une voix robotique et des images prétextes, lançant le ton du contenu : "Aujourd'hui, vous allez être très fiers de nous. Il y a de cela quelques mois, nous nous sommes donné le droit de pirater les réunions secrètes du président français Emmanuel Macron, ainsi que les décisions qu'il prend contre le Mali. Grâce à notre infiltration, voici ce que nous avons pu entendre."

La voix robotique est suivie d'une image fixe d'Emmanuel Macron accompagnée de la voix du président français qui révèlerait la stratégie française au Mali pendant un peu plus de 2 minutes : "Le Mali appartient à la France et non à la Russie. [...] du Mali. On va réfléchir ensemble de comment [sic] trouver une solution contre ces criminels militaires au Mali. Votre mission sera donc d'infiltrer le cœur de leur pouvoir. Prenez les moyens qu'il faut. [...] On continue comme ça on va perdre le Mali et si on perd le Mali, on perd notre rang économique."

La voix est difficilement audible, avec un bruit de fond, et parfois des coupes ou des changements de tonalité entre les phrases. Quelques phrases semblent être coupées à la fin, ou commencer au milieu d'une phrase.

03:01 Un faux enregistrement attribué à Emmanuel Macron lui prêtant des déclarations sur le Mali circule. © Observateurs

La vidéo se termine de nouveau sur une voix robotique qui conclut : "Avez vous écouté ? Et bien c'est ça l'idée des occidentaux. Emmanuel Macron a ordonné de tuer les militaires au pouvoir. Il a donné les moyens nécessaires de les éliminer. [...] Il traite le pouvoir malien de délinquants parce qu'ils ont voulu prendre leur indépendance et développer leur pays."

Le contenu a été visionné plus de 340 000 fois sur Facebook , plus de 250 000 fois sur TikTok et est également visible sur YouTube où elle cumule environ 8000 vues au 15 juin 2023.

Il a également fait l'objet de commentaires en bambara comme ici sur YouTube , où les propos sont présentés comme authentiques.

Quatre phrases issues de discours du président français

Dans la vidéo, quatre des phrases prononcées sont tout à fait authentiques et prononcées lors de vrais discours.

Trois sont issues d'une déclaration d'Emmanuel Macron sur les relations franco-africaines, à Paris le 27 février 2023.

Il prononce ainsi durant le discours, dont la transcription est disponible ici , ces trois phrases qui figurent dans la vidéo sur Facebook entre 00 :41 et 00 :52 puis entre 1 :30 et 1 :36 :

"Nous sommes dans un moment de transition sans avoir pleinement réalisé, je vais y revenir, le début de la transition commencée. Au fond, beaucoup voudraient nous inciter à rentrer dans une compétition." ( séquence audible ici )

"On vient défendre nos intérêts et on le fait de manière respectueuse avec les intérêts des pays africains où on se déploie." ( séquence audible ici )

Ces trois phrases correspondent à des moments du discours où le président français ne parle pas en particulier du Mali, mais des relations de façon générale entre la France et plusieurs pays francophones d'Afrique de l'Ouest.

Enfin, une dernière phrase présente entre 00:52 et 00:58 a été prononcée dans un discours sur les relations franco-camerounaises, à Yaoundé le 26 juillet 2022 dont la transcription est disponible ici . Emmanuel Macron avait dit "On les a chassés, on a régulé, on a mis des règles" en parlant de projets économiques reposant sur "la corruption et le surendettement", expliquant que ces entreprises avaient été écartées des discussions avec les autorités publiques en France et en Europe ( séquence audible ici ).

Contacté et interrogé au sujet de la vidéo le 14 juin, le service de presse de l'Élysée a simplement commenté la vidéo en expliquant qu'il s'agissait d'"un faux", sans rentrer dans les détails.

00:43 Comparaison entre la vidéo "secrète" et les vrais phrases prononcées lors de discours d'Emmanuel Macron. © Observateurs

Des phrases inconnues dont certaines incorrectes en français

Tout le reste des phrases prétendument prononcées par Emmanuel Macron dans la vidéo sur Facebook sont des phrases dont on ne trouve trace dans aucun discours du président français sur Internet.

Plusieurs anomalies sonores sont toutefois discernables dans les extraits, suggérant un montage : on entend notamment des sautes de phrases comme à la 56e seconde où le mot "règles" semble prononcé deux fois, comme saccadé, tout comme le mot "argent" à 1:03.

La rédaction des Observateurs France 24 a fait écouter cette vidéo à Nicolas Obin, maître de conférences à Sorbonne Université et chercheur dans le laboratoire des Sciences et Technologies de la Musique et du Son à l'Ircam, spécialisé en voix par intelligence artificielle. Ce dernier remarque plusieurs incohérences :

Il y a des différences de conditions d'enregistrement très claires et abruptes entre les passages de la vidéo, ce qui laisse penser à un montage. Il y a d'abord une première partie [entre 00:30 et 00:57, NDLR] avec un débit assez soutenu et expressif, des inspirations et expirations difficiles à reproduire artificiellement, ressemblant à la voix du vrai Macron [correspondant à de vrais enregistrements de discours du président français, NDLR]. Dans le second passage [de 00:58 à 1:30, NDLR], on a une voix très présente et moins brute, avec de faux artefacts [une altération sonore du résultat, NDLR], comme par exemple une voix qui dérape comme quand un vinyle saute. C'est encore pour laisser l'impression que les artefacts sont naturels, liés à l'enregistrement et non à la voix. Enfin, un troisième passage avec une voix toujours claire, mais qui est, pour moi, une mauvaise imitation par un humain." On note aussi des conditions d'enregistrement mauvaises, bruitées et réverbérées. Ce bruit peut permettre à la fois de cacher les artefacts, mais aussi de créer un ancrage de crédibilité, pour faire croire que toute la séquence est réelle.

La rédaction des Observateurs de France 24 a également noté des formulations de français erronées dans ces phrases. Par exemple, à 1:10, on entend : "On va réfléchir ensemble de comment trouver une solution" (sic), phrase grammaticalement incorrecte, se formulant plutôt : "On va réfléchir ensemble comment on peut trouver une solution". Pas plus que la phrase à 01:56 : "Ils ont pu convaincre leur peuple à leur faire confiance" (sic) qui devrait se prononcer : "Ils ont pu convaincre leur peuple de leur faire confiance".

00:20 Plusieurs incohérences sonores et erreurs de français sont audibles dans cet enregistrement. © Observateurs

"Dès que des bruits sont ajoutés dans un audio, il est de plus en plus difficile de détecter les artefacts"

Reconnaître si une voix humaine est réelle ou pas est assez complexe, ont expliqué différents experts contactés par la rédaction des Observateurs de France 24. Ces analyses doivent se faire à partir d'échantillons de la voix d'une personnalité renseignés dans un ordinateur, qui évalue ensuite si la voix cible ressemble à la voix source. Il n'existe pas, à ce jour, de projets grand public librement disponibles permettant de détecter si une voix est un clone d'une voix réelle, ou pas.

Contacté à ce sujet, Nicholas Evans, professeur associé sur les traitements de la parole et de l'audio à l'Eurecom à Biot, Sophia Antipolis, école d'ingénieur spécialisée dans les technologies numériques. Il explique qu'il est très difficile de se prononcer sur la fiabilité du contenu de la vidéo :

Aujourd'hui, pour identifier si une voix est générée par intelligence artificielle ou pas, l'état de la recherche concerne les sons principalement sans bruit sur des scénarios d'authentification biométrique. Nous travaillons beaucoup sur des potentiels faux contenus de type "deepfake" [ou deepvoice, avec des manipulations audio, NDLR], mais dans des scénarios précis d'authentification biométrique. Ainsi, nous travaillons peu dans des scénarios médiatiques où la qualité de l'audio est inférieure à ce qu'elle est généralement pour les scénarios biométriques. La difficulté, c'est que dès que des bruits sont ajoutés dans un audio, il est de plus en plus difficile de détecter ces artefacts. Sans ces bruits parasites, nos systèmes seraient peut-être fiables. Nous devons être très prudents sur la façon dont nous interprétons les résultats.

"On peut raisonnablement penser que l'audio est manipulé"

Les chercheurs de l'Eurecom, à qui la rédaction des Observateurs de France 24 a transmis ce son, ont procédé à une analyse. Bien qu'il ne soit pas possible avec certitude d'affirmer que le contenu est un faux, Nicholas Evans explique :

Les propriétés spectrales dans les intervalles concernant les vraies parties de discours sont assez différents de ceux des intervalles des autres séquences. Nous avons passé l'audio à travers un détecteur de deepfake. Il est difficile de se fier à ces résultats, mais le segment entre 0:58 et 1:30 [supposément manipulé, NDLR] produit des scores inférieurs aux segments à 0:41 et 0:58 [vraies parties de discours] et de 1:36 à 2:10 [supposément manipulé, NDLR]. Des scores inférieurs indiquent que le segment est faux, des scores plus élevés qu'il est authentique. Le [dernier] segment à 1.36 et 2:10 est curieux. Dans les 7 premières secondes, le segment a un profil spectral similaire au segment entre 0:58 et 1:30 [supposément manipulé, NDLR] , mais le profil du segment est différent par la suite. On entend facilement cette différence."

Les phrases inconnues d'Emmanuel Macron sont-elles créées de toute pièce ?

Pour savoir si la voix d'Emmanuel Macron pouvait être une fabrication, la rédaction des Observateurs de France 24 s'est intéressée à plusieurs sites internet publiquement disponibles permettant de cloner la voix d'un individu, et de leur faire prononcer un texte via une intelligence artificielle. La plupart de ces logiciels en ligne ne prennent pas en compte le français, et donnent donc des résultats peu probants, souvent avec un accent anglophone.

Cependant, un de ces logiciels, dont la rédaction des Observateurs de France 24 ne donnera pas le nom pour éviter la diffusion de fausses informations, a permis de cloner la voix d'Emmanuel Macron à partir d'un de ses discours.

En reprenant les phrases d'origine inconnue prononcées dans la vidéo diffusée par la page Facebook "Citoyen burkim-biiya", la rédaction des Observateurs de France 24 a pu parvenir à un résultat proche de celui de la vidéo, audible ci-dessous.

01:24 Simulation par intelligence artificielle d'un texte clonant la voix d'Emmanuel Macron. Ce contenu n'est pas réel. © Observateurs

S'il est impossible d'affirmer que ce logiciel en ligne a été utilisé pour créer ces propos, la démonstration permet de montrer qu'il est possible via ce type d'outil d'obtenir un résultat proche, ressemblant à la voix du président français.

"Les personnalités publiques sont plus sujettes à ces attaques"

Comme le note le site Les Numériques, les progrès effectués dans le domaine de la voix sont effectivement impressionnants. Le YouTubeur Defend Intelligence, dans une récente vidéo, a par exemple fait chanter du Aznavour à Emmanuel Macron .

Nicolas Obin, de l'Ircam, conclut ainsi :

Avec les récentes avancées liées à l'IA, il devient de plus en plus difficile de discerner à l'oreille une voix artificielle d'une voix humaine, en particulier dans le cas d'attaques malveillantes d'usurpation d'identité de personnalités publiques. Les personnalités publiques sont plus sujettes à ces attaques, dans la mesure où il existe une grande quantité de données disponibles librement sur Internet. Néanmoins, toute synthèse ou manipulation laisse nécessairement des traces dans le signal, perceptibles ou imperceptibles.

La rédaction des Observateurs de France 24 a déjà repéré ces derniers mois des contenus générés par intelligence artificielle pour diffuser de fausses informations dans des pays d'Afrique de l'Ouest. Retrouvez quelques exemples ci-dessous :

