Gemini : Google dévoile ses recettes pour composer avec Lyria 3

Depuis la semaine dernière, la génération musicale fait son entrée dans Gemini grâce à Lyria 3, le nouveau modèle audio développé par DeepMind chez Google. L’outil permet de créer des morceaux de 30 secondes à partir d’un simple prompt textuel, d’une image ou même d’une vidéo. Pour guider les utilisateurs, Google publie six conseils destinés à affiner les résultats.

Premier levier : les paramètres créatifs. Lyria 3 s’appuie sur cinq dimensions principales. Le genre et l’époque structurent immédiatement l’ambiance, qu’il s’agisse d’un jazz des années 50, d’un hip-hop des années 90 ou d’un mélange inattendu entre K-pop et Motown. Le tempo et la dynamique permettent de préciser l’évolution du morceau, par exemple une introduction douce suivie d’un refrain plus énergique.

Les instruments constituent un autre axe de personnalisation. En l’absence d’indication, le modèle choisit automatiquement une orchestration cohérente avec le style demandé. Mais l’utilisateur peut imposer des choix plus audacieux, comme intégrer un synthétiseur typé années 80 dans une base funk ou jazz. La voix peut également être décrite finement : timbre, tessiture, harmonies ou progression au fil du morceau.

Les paroles représentent l’une des nouveautés marquantes de cette version. Deux approches sont proposées : laisser Lyria écrire à partir d’un thème ou fournir ses propres textes en les précédant de la balise « Lyrics: ». Les sections peuvent être structurées avec des indications comme [Couplet] ou [Refrain], ce qui rapproche l’expérience d’un véritable travail de composition.

Côté méthode, Google recommande d’abord de partir d’un texte descriptif clair. Un souvenir personnel, une blague interne ou une ambiance précise peuvent suffire à générer un morceau cohérent. Autre option : utiliser une image ou une vidéo comme source d’inspiration. Le modèle analyse les éléments visuels pour en traduire l’atmosphère en musique.

La précision reste déterminante. Plus le prompt détaille les instruments, la dynamique ou la texture vocale, plus le résultat est maîtrisé. Lyria 3 interprète des descriptions relativement fines, ce qui permet d’obtenir des rendus variés malgré la limite de durée.

Et une fois les chefs-d’œuvre créés, les morceaux générés peuvent être exportés en MP3 ou MP4 et partagés directement. Chaque titre est accompagné d’une pochette créée automatiquement par Nano Banana, le modèle d’images de Google. Avec Lyria 3, Gemini ne se contente plus de générer du texte ou des images : il ambitionne désormais de devenir un véritable atelier créatif multimédia.

Source : Google

******

Du lundi au vendredi, Bruno Guglielminetti vous propose un regard sur l’essentiel de l’actualité numérique avec 120 secondes de Tech.

Ou encore…

Écoutez la plus récente édition de Mon Carnet,
le magazine hebdomadaire de l’actualité numérique.


En savoir plus sur Mon Carnet

Subscribe to get the latest posts sent to your email.

Laisser un commentaire