Google a développé un nouveau modèle de l’IA qui génère de la musique à partir d’une description textuelle

0
133

OpenAI a connu beaucoup de succès avec les capacités étonnantes de ChatGPT, allant de la génération des résumés académiques et des contenus médiatiques à l’écriture des chansons de différents styles.

Il n’est donc pas surprenant que Google s’aventure dans un autre territoire inexploré: la musique générée par l’IA. En effet, il a développé un réseau neuronal qui génère de la musique haute-fidélité et qualité dans n’importe quel genre à partir d’une description textuelle. Le géant se réfère à ce système d’IA comme « MusicLM ».

MusicLM: la musique générée par l’IA

MusicLM est formé sur un ensemble de données de 280 000 heures de musique. Le réseau neuronal est capable de créer une composition audio de 24 kHz et dans n’importe quel genre, capturant les nuances décrites dans l’annotation. Par exemple: « une bande sonore dynamique et optimiste d’un jeu d’arcade avec un riff mémorable d’une guitare électrique ».

De plus, MusicLM peut combiner plusieurs annotations consécutives et créer une « histoire musicale ». Et vous pouvez également définir le niveau du musicien, par exemple: pour les requêtes « pianiste débutant » et « pianiste virtuose », MusicLM donnera des résultats complètement différents.

Cependant, dans certains des exemples présentés, une qualité déformée est perceptible.

Pour que cet outil puisse créer de la musique, une invite très détaillée indiquant les styles ou les genres doit d’abord être écrit. L’IA peut produire des bandes sonores plus longues avec de court textes, telles que « techno mélodique » ou « jazz relaxant », qui durent jusqu’à cinq minutes. Par exemple, il a créé une mélodie fascinante basée sur « Napoléon traversant les Alpes » de Jacques-Louis David et « Le Cri » d’Edvard Munch.

  • Cet ensemble de données, connu sous le nom de « MusicCaps », est maintenant disponible sur la page Github de Google et affiche les invites de texte et l’audio résultant côte à côte.

En conséquence, Google ne prévoit pas de publier ce modèle au public de sitôt. Cela dit, la société a mis 5 500 paires musique-texte à la disposition de tous ceux qui veulent voir – et entendre – comment MusicLM fait son affaire.

ARTICLES RECOMMANDÉS:

ChatSonic – La meilleure alternative à Chatgpt ! (anispartage.com)

Première vidéo téléchargée sur YouTube : voici ce que c’était (anispartage.com)

Google Chrome va bientôt rendre encore plus facile la traduction de texte dans les images (anispartage.com)