
OpenAI vient de déployer une mise à jour majeure de son mode vocal avancé dans ChatGPT, exclusivement pour les utilisateurs payants. Présentée comme une évolution significative, cette version affine considérablement la qualité d’interaction en rendant la voix plus fluide, plus expressive et surtout plus naturelle. L’objectif : rendre les échanges avec l’intelligence artificielle plus humains, qu’il s’agisse d’obtenir une réponse rapide ou de converser dans une autre langue.
Ce qui distingue cette nouvelle version, c’est sa capacité à reproduire des nuances émotionnelles comme l’empathie ou même le sarcasme, grâce à des ajustements subtils d’intonation, de cadence et de pauses. ChatGPT ne se contente plus de parler : il « interprète », en adaptant le ton de sa voix en fonction du contexte. Un pas de plus vers une expérience conversationnelle qui s’éloigne du ton robotisé qu’on associait jusqu’à récemment aux assistants vocaux.
L’autre ajout marquant concerne la traduction vocale continue. Il suffit désormais de demander à ChatGPT de traduire un échange entre deux langues, et il poursuivra automatiquement l’exercice durant toute la conversation, jusqu’à ce qu’on lui indique d’arrêter. Ce service est particulièrement utile pour les voyageurs ou dans les environnements de travail internationaux. Par exemple, à un restaurant au Brésil, on peut interagir avec le serveur en anglais, pendant que ChatGPT traduit en portugais et inversement.
Cette fonctionnalité s’ajoute à des améliorations déjà apportées en début d’année sur la stabilité vocale et les accents, rendant l’utilisation plus fluide sur les différentes plateformes. L’interface vocale est accessible en appuyant sur l’icône micro dans le composeur de message, que ce soit sur mobile ou sur ordinateur. OpenAI continue ainsi d’intégrer des fonctions multimodales dans son assistant pour en faire un outil polyvalent.
Cela dit, la technologie n’est pas encore parfaite. OpenAI reconnaît que certains utilisateurs peuvent constater une qualité audio variable selon les voix choisies, notamment des fluctuations inattendues dans le ton ou la hauteur de la voix. Ces écarts restent rares, mais font partie des ajustements en cours de développement.
Autre phénomène encore observé : des hallucinations vocales. Dans certains cas, la voix de ChatGPT pourrait produire des sons parasites, comme des bruits ressemblant à de la publicité, à de la musique de fond ou à du charabia. OpenAI indique être en train d’enquêter pour corriger ces incidents, qui restent sporadiques, mais gênants dans des contextes d’usage prolongé.
Cette mise à jour marque une nouvelle étape dans l’évolution des interfaces vocales alimentées par l’IA. ChatGPT devient un interprète numérique aussi bien qu’un assistant conversationnel, capable de franchir la barrière des langues en temps réel tout en continuant à affiner sa voix. Une avancée prometteuse pour les utilisateurs nomades, les professionnels multilingues, ou simplement ceux qui recherchent une interaction plus naturelle avec leur robot conversationnel.
Source : OpenAI
+++
Tous les jours de la semaine, du lundi au vendredi, Bruno Guglielminetti vous propose un regard sur l’essentiel de l’actualité numérique avec 120 secondes de tech.
En savoir plus sur Mon Carnet
Subscribe to get the latest posts sent to your email.

