Whispeak lutte contre les fraudes vocales
#news Dernière mise à jour : 08/06/2026 à 21:35, publié le : 08/06/2026+475 % de fraudes vocales par IA en un an : Whispeak présente sa technologie de détection en moins d'une seconde
Les fraudes vocales exploitant l’intelligence artificielle connaissent une explosion en France et en Europe. Whispeak, qui a été couronné comme le meilleur au niveau mondial par Hugging Face en 2025 et qui a remporté le DGA Cyber Challenge en 2024, participera à VivaTech 2026 sur le stand de Bouygues, les mercredi 17 et vendredi 19 juin 2026, pour présenter ses solutions dédiées à la sécurisation des communications vocales.
Le défi de la décennie : rétablir la confiance dans les interactions vocales
La voix s’est imposée comme une des nouvelles zones de vulnérabilité dans l’économie numérique. Avec des cas d’usurpation d’identité par téléphone, de contournement des systèmes d’authentification et de désinformation, les deepfakes vocaux atteignent un niveau de crédibilité qui complique leur détection, bien que celle-ci ne soit pas impossible.
En 2025, les fraudes impliquant des voix générées par des algorithmes dans les services financiers européens ont crû de +475 %. Désormais, quelques secondes d’enregistrement audio suffisent pour reproduire une voix humaine avec un réalisme suffisant pour induire en erreur un interlocuteur ou un système automatisé. La fraude vocale via synthèse n’est pas un risque imaginaire : elle est courante dans les centres d’appels, sur les messageries vocales et à divers niveaux d’authentification.
Face à cette situation, les solutions de détection représentent une première barrière de défense. Toutefois, elles doivent être capables de fonctionner dans des conditions réelles, sur des audio dégradés, en temps réel et à une échelle industrielle.
Deux technologies, un but commun : sécuriser toutes les interactions vocales
Basée à Lille, la startup Whispeak a mis au point deux types de solutions :
La première est un système de détection de voix générées par l’IA. Ce moteur analyse les fichiers audio à l’aide d’un modèle d’apprentissage profond qui élabore une représentation du signal, optimisée pour différencier une voix humaine d’une voix synthétique, y compris les modèles générés après l’entraînement. Le retour d’information est effectué en moins d’une seconde, avec un score de confiance. Avec 98,9 millions de paramètres, le modèle est conçu pour traiter tout type de contenu audio, y compris le canal téléphonique, tel qu’il est utilisé dans les appels en temps réel.
La seconde solution est l’authentification par empreinte vocale biométrique. Lors de la première utilisation, l’utilisateur fournit quelques secondes de sa voix pour générer une empreinte vocale unique via un modèle de deep learning. À chaque interaction ultérieure, la voix est comparée en temps réel avec l’empreinte de l’utilisateur supposé : le résultat, qu’il soit vérifié ou non, est fourni en moins d’une seconde. Le système est aussi capable de détecter les tentatives de fraude : il identifie si une voix est synthétique ou si elle provient d’un enregistrement, et non d’une personne en direct.
Les deux technologies sont accessibles par API, en mode SaaS, installation sur site ou déploiement en réseau isolé, ce qui est essentiel pour les environnements les plus sensibles.
Des applications dans les secteurs les plus à risque
Les solutions de Whispeak sont actuellement utilisées dans des environnements où l’authenticité de la voix est primordiale : dans le secteur financier (banques, assurances) pour protéger les centres d’appels et lutter contre la fraude ; dans les centres de contact pour authentifier les appelants sans friction ; dans le domaine de la défense et pour des institutions publiques afin de sécuriser les communications sensibles ; dans les médias et rédactions pour vérifier le contenu audio avant diffusion.
“Nous ne pouvons plus faire confiance aux voix que nous percevons à distance, que ce soit au téléphone, en visio ou dans des contenus audio. C’est exactement le motif qui nous a poussés à fonder Whispeak : garantir que ce que nous entendons est authentique, et que cela émane réellement de la personne que nous pensons reconnaître.” commente Florent Van Calster, PDG et cofondateur de Whispeak.
Des performances reconnues par les benchmarks
Les solutions de Whispeak ont été testées sur des benchmarks ouverts :
N°1 mondial sur le Speech Deepfake Arena de Hugging Face (octobre 2025), une référence internationale pour l’évaluation des systèmes de détection de voix synthétiques, avec un taux de précision de 96,9 % ;
N°1 au Défi Cyber AMIAD, organisé par la DGA / COMCYBER en 2024, en conditions opérationnelles ouvertes ;
Top 4 mondial au concours ASVspoof – Interspeech 2024, avec un taux d’erreur égal de 4,16 % sur la version Beta ;
Certification ISO/IEC 27001:2022 pour les processus de collecte, stockage et traitement des données vocales.
