Le nouvel outil de Google DeepMind révolutionne les films générés par l’IA
Google DeepMind a révélé dans un article le plein potentiel de son nouvel outil vidéo-audio ou « V2A » dans la création de scènes de film entièrement automatisées. La technologie pourrait corriger la seule faiblesse que les autres générateurs vidéo d’IA partagent tous : Le manque d’audio d’accompagnement. En effet, le nouvel outil vidéo-audio utilise une combinaison de pixels et d’invites textuelles pour générer automatiquement des bandes sonores et des paysages sonores pour les vidéos générées par l’IA.
En quoi le nouvel outil de Google DeepMind se démarque-t-il des autres générateurs vidéo d’IA ?
Selon Google DeepMind, V2A se démarque de ses concurrents par sa capacité à produire de l’audio uniquement à partir de pixels. La technologie peut se combiner avec des générateurs vidéo IA pour créer une partition atmosphérique, des effets sonores opportuns et même un dialogue.
Le nouvel outil V2A de DeepMind peut aussi générer un nombre illimité de bandes sonores pour n’importe quelle entrée vidéo et scène. Avec quelques invites de textes simples, les créateurs peuvent l’orienter vers le résultat souhaité.
Toutefois, DeepMind est conscient du risque d’utilisation abusive et de deepfake de certains utilisateurs. Par conséquent, l’outil V2A constituera un projet de recherche pour le moment. La société déclare néanmoins que la technologie fera l’objet d’évaluations et des tests de sécurité strictes avant un éventuel déploiement public.
Une technologie à double tranchant
Pour information, OpenAI a déjà annoncé son intention d’ajouter de l’audio à son générateur vidéo Sora. Ce dernier devrait être lancé plus tard cette année. Néanmoins, le nouvel outil V2A de DeepMind montre aujourd’hui que la technologie se trouve déjà à un stade avancé. Il peut créer de l’audio basé uniquement sur des vidéos, plutôt que de nécessiter des requêtes interminables.
Pour le moment, la technologie a encore certaines limites en matière de dialogue et ne peut pas encore produire un article fini. Néanmoins, V2A s’annonce comme un outil potentiellement puissant pour le storyboard et les cinéastes amateurs. Il pourrait encore s’améliorer davantage, surtout avec OpenAI comme rival.