Google vient de dévoiler sa nouvelle gamme d’outils pour l’intelligence artificielle, composée de Veo 2 pour la vidéo, Imagen 3 pour l’image et Whisk pour la création interactive. Cette annonce intervient au moment où OpenAI multiplie les annonces, notamment avec Sora, son dernier produit phare.
Veo 2 se concentre sur la génération de vidéos en qualité 4K sur plusieurs minutes, surpassant ainsi les capacités actuelles de Sora. Ce nouveau modèle met l’accent sur la physique du monde réel et la finesse des mouvements humains, témoignant d’une approche plus mature de la génération de vidéos par Google par rapport à OpenAI.
Une avancée majeure de Veo 2 réside dans sa capacité à réduire les « hallucinations », ces erreurs typiques des IA génératives telles que l’apparition de doigts supplémentaires. De plus, Google a mis en place des mesures de sécurité et de marquage pour identifier les contenus générés par ce modèle.
Imagen 3, équivalent de DALL-E chez OpenAI, se consacre à la génération d’images. Ce modèle offre désormais une reproduction précise de styles artistiques variés, du photoréalisme à l’anime, tout en améliorant sa fidélité aux instructions fournies. Par ailleurs, Imagen 3 est disponible dans plus de 100 pays via ImageFX dans Google Labs, nécessitant l’utilisation d’un VPN pour les utilisateurs en France.
Whisk, la nouvelle expérience de Google, combine de manière astucieuse Imagen 3 avec les capacités de Gemini pour la compréhension visuelle. Cette intégration verticale permet de créer automatiquement des légendes avec Gemini, puis utilisées par Imagen 3 pour générer des images uniques, mêlant motifs, scènes et styles de manière inédite.
En somme, Google renforce sa position dans le domaine de l’IA générative avec ces nouveaux outils, offrant aux utilisateurs une gamme complète de fonctionnalités innovantes. Cette avancée technologique promet de révolutionner la création de contenus visuels dans les années à venir.
Source : www.frandroid.com