← Retour au blog

La relation entre les banques et leurs clients au téléphone n'a pas fondamentalement changé depuis 30 ans. Un client appelle, s'authentifie avec son code client et sa date de naissance, attend 8 à 12 minutes en musique d'attente, puis explique son problème à un agent qui le transfère éventuellement au bon service. En 2026, cette expérience est en cours de disparition — remplacée par une authentification vocale biométrique instantanée et des agents IA capables de gérer 80 % des opérations sans intervention humaine.

L'authentification vocale biométrique

La voix est un identifiant biométrique unique : les caractéristiques acoustiques de chaque voix humaine (formants, fondamentaux, timbre, rythme respiratoire) forment une "empreinte vocale" aussi distinctive que les empreintes digitales. Les systèmes de Voice Authentication modernes comparent la voix du client à son empreinte stockée (créée lors de l'enrôlement) avec une précision de 99,8 % sur les populations adultes.

L'avantage par rapport au code PIN ou au mot de passe : la voix ne peut pas être transmise par SMS intercepté (attaque SIM swapping), ne s'oublie pas, et peut être combinée avec d'autres facteurs pour satisfaire aux exigences DSP2 (Directive sur les Services de Paiement 2) sur l'authentification forte à deux facteurs.

Conformité DSP2 : L'authentification vocale biométrique satisfait le facteur "inhérence" (quelque chose que vous êtes) de l'authentification forte à deux facteurs DSP2, à condition que le système soit certifié et auditable. Vocalis utilise une architecture conforme PCI-DSS et FIDO2 pour les déploiements bancaires.

Les opérations courantes en libre-service vocal

Une fois authentifié, le client peut effectuer sans agent humain un ensemble croissant d'opérations :

Ces 7 opérations représentent en moyenne 72 % du volume d'appels d'une banque de détail. Les automatiser libère les conseillers pour les opérations à valeur ajoutée : gestion de patrimoine, crédit, situations complexes.

La détection de fraude vocale en temps réel

Au-delà de l'authentification, l'IA analyse en continu les signaux de fraude pendant la conversation. Un appel où la voix est synthétique (deepfake vocal) est détecté par des marqueurs spectraux spécifiques aux voix générées par IA. Un scénario d'ingénierie sociale (le client qui répète des informations comme s'il les lisait, ou qui répond avec des délais inhabituels à des questions de contrôle) déclenche une alerte discrète vers l'équipe fraude.

Cette détection en temps réel a permis de réduire les fraudes abouties de 23 % sur les périmètres déployés en 2025, selon les données consolidées de Vocalis sur ses clients du secteur bancaire.

Le cas des néobanques

Les néobanques (Revolut, Lydia, Qonto, Shine) ont bâti leur succès sur des interfaces mobiles fluides mais souffrent d'un talon d'Achille : l'absence de support vocal crédible. "Pas de téléphone, que du chat" est acceptable pour les opérations courantes, mais génère des crises lorsqu'un client bloqué face à un problème urgent (opposition urgente, fraude détectée, accès verrouillé) ne peut pas joindre un humain.

L'agent vocal IA permet aux néobanques d'offrir un support vocal 24/7 sans les coûts d'un centre d'appels humain. Le flux est clair : le client appelle, l'IA authentifie, traite 70 % des cas de manière autonome, et transfère vers un agent humain pour les 30 % restants — avec un résumé de l'interaction pour éviter toute répétition.

"Notre taux d'appels traités sans intervention humaine est passé de 12 % à 71 % en 8 mois. Les clients qui ont expérimenté l'agent IA ont un NPS de +8 points par rapport à ceux qui passent uniquement par notre app." — Head of Customer Experience, néobanque B2B

Les résultats moyens sur le secteur bancaire