
La dernière mise à jour vocale de ChatGPT change sensiblement la manière d’interagir avec l’outil, une évolution qui pourrait bien préfigurer ce que prépare Apple avec la nouvelle version de Siri. L’amélioration semble modeste, mais son impact sur l’usage du robot conversationnel est notable selon plusieurs utilisateurs.
À l’origine, ChatGPT reposait uniquement sur l’écrit. L’ajout de la voix avait apporté deux transformations. D’une part, il renforçait l’impression d’interagir avec un interlocuteur humain et d’autre part, l’arrivée de la voix facilitait de nombreuses tâches, même si l’utilisateur devait souvent revenir au texte pour demander une image ou consulter des résultats visuels.
Le changement majeur apporté par OpenAI est l’intégration complète des deux modes. Il n’est plus nécessaire de passer d’un écran à l’autre. On peut parler à ChatGPT, voir les réponses s’afficher, consulter des images ou revenir à l’historique, le tout au sein d’une seule interface. Cette fusion n’est pas parfaite, comme le montrent des tests où l’outil affirme avoir affiché une carte sans l’avoir réellement fait, mais elle marque une étape technique importante.
Cet ensemble de fonctions illustre ce que la prochaine génération de Siri devra maîtriser. Apple a, en quelque sorte, l’équation inverse à résoudre. L’assistant vocal est né voix-d’abord et s’est enrichi récemment, via Apple Intelligence, de fonctions textuelles comme le résumé d’emails. L’enjeu est désormais de marier fluidement ces approches, afin qu’un ordre vocal puisse déclencher non seulement une réponse parlée, mais aussi des manipulations de textes, de cartes ou d’images.
Au-delà de ces interactions, la promesse faite par Apple implique aussi que Siri devienne un véritable agent capable d’agir dans les applications installées. Demander de réserver un vol ou d’exécuter une tâche complexe doit conduire l’assistant à orchestrer plusieurs outils automatiquement.
Reste la question du comment. Apple pourrait devoir s’appuyer sur des partenaires comme OpenAI ou Google pour combler l’écart qui s’est creusé avec les modèles les plus avancés du secteur. Deux impératifs subsisteraient malgré tout. Le premier : préserver la confidentialité en s’appuyant sur des interfaces qui empêchent l’utilisation des données pour entraîner des modèles externes, comme c’est déjà le cas lorsque Siri fait appel à ChatGPT. Le second : livrer ces nouveaux outils rapidement, l’année prochaine étant présentée comme la limite acceptable pour ce virage technologique.
Peu importe la provenance du moteur d’intelligence artificielle. C’est sa capacité réelle à protéger la vie privée et à offrir une expérience fluide qui déterminera le succès de la nouvelle génération de Siri.
En savoir plus sur Mon Carnet
Subscribe to get the latest posts sent to your email.

