GenGenAI : le générateur d’images IA qui entraîne les voitures à voir mieux que nous – Interview CES 2025
L’entraînement des modèles d’intelligence artificielle repose sur un élément crucial : les données. Or, dans des domaines comme l’automobile, la défense ou la surveillance, collecter ces données peut s’avérer complexe, coûteux et chronophage. C’est ici que GenGenAI, une startup sud-coréenne, intervient avec une approche novatrice. Grâce à ses solutions de génération de données synthétiques, elle offre une alternative rapide, économique et ultra-spécialisée pour les entreprises ayant des besoins pointus en données d’entraînement. Fondée par HoJin Cho, un ingénieur visionnaire ayant travaillé sur des systèmes avancés de conduite autonome, la startup s’apprête à présenter ses innovations au CES 2025. Nous avons eu l’opportunité d’échanger avec son CEO dans les bureaux d’Aving News à Séoul. HoJin Cho nous livre sa vision, les défis de l’industrie et les ambitions futures de GenGenAI.
GenGenAI : une solution à la pénurie de données dans l’IA
GenGenAI répond à un problème central pour l’intelligence artificielle : la rareté des données. Les entreprises, en particulier dans l’automobile et la défense, manquent souvent de données adaptées pour entraîner leurs modèles. Collecter ces informations dans le monde réel est difficile, long et coûteux. HoJin Cho, CEO de GenGenAI, résume le défi : « Nous avons besoin de millions de données variées, mais les collecter est presque impossible. »
Pour résoudre ce problème, GenGenAI propose des données synthétiques générées par des algorithmes avancés. Ces données, créées sur mesure, imitent parfaitement les données réelles. Elles permettent aux entreprises de gagner du temps et de réduire leurs coûts tout en augmentant la précision de leurs modèles. « Avec nos solutions, nous offrons des données diversifiées en un mois, là où il faut parfois un an sur le terrain, » explique HoJin Cho.
La startup se concentre sur les besoins spécifiques des industries. Dans l’automobile, par exemple, les données doivent refléter des conditions variées : animaux sauvages, panneaux de signalisation locaux ou encore conditions climatiques. « Même Tesla ne peut collecter tous ces cas spécifiques, » précise-t-il.
Des innovations qui redéfinissent l’entraînement des IA
GenGenAI développe des solutions uniques pour produire des données synthétiques de haute qualité. Parmi leurs produits phares, on trouve GenGenData™, un outil qui permet de générer des ensembles de données personnalisés. GenGenVision™ offre des données adaptées pour les systèmes de vision par IA, tandis que GenGenStudio™ est une plateforme intuitive pour créer et transformer ces données avec peu d’efforts.
Ces outils répondent à des besoins précis, comme le montre un exemple dans l’automobile. Les constructeurs doivent entraîner leurs systèmes de conduite autonome pour reconnaître des éléments rares ou spécifiques : animaux sauvages, panneaux de signalisation étrangers, ou conditions climatiques extrêmes. « Nous pouvons créer des scènes variées, comme des routes enneigées, des animaux ou des situations nocturnes, en un temps record, » détaille HoJin Cho.
Contrairement aux données issues de simulations 3D classiques, les données de GenGenAI se rapprochent au maximum de la réalité. Elles incluent des détails comme la texture, les effets de lumière et les imperfections des capteurs. « Nos données synthétiques surpassent parfois les données réelles, » affirme-t-il.
GenGenAI ne se contente pas de créer de nouvelles données. Ils transforment également des données existantes. Par exemple, ils peuvent modifier une scène pour ajouter des objets, changer la météo ou adapter l’image aux capteurs des véhicules.
Applications réelles et collaborations stratégiques
GenGenAI collabore déjà avec des entreprises prestigieuses dans plusieurs secteurs. Dans l’automobile, des géants comme Hyundai et Phantom AI utilisent leurs données synthétiques. Par exemple, GenGenAI a fourni des panneaux de signalisation chinois à Phantom AI pour entraîner leurs modèles, un type de données difficile à collecter. « Les entreprises américaines ne peuvent pas collecter ces données directement en Chine. Nous leur offrons une solution rapide et précise, » explique HoJin Cho.
Dans la défense, GenGenAI travaille avec des partenaires comme Hanwha et des laboratoires de recherche gouvernementaux en Corée. Ces collaborations visent à créer des données spécifiques pour les systèmes de surveillance et les véhicules autonomes militaires. « Nous générons des données pour détecter des menaces sur terre, en mer ou dans les airs, là où il est impossible de collecter des informations réelles, » ajoute-t-il.
Le modèle de GenGenAI repose sur une personnalisation totale des données pour chaque client. Que ce soit pour des besoins en reconnaissance de panneaux, d’animaux ou de conditions climatiques particulières, la startup adapte ses outils à chaque projet. Ces collaborations renforcent leur expertise et ouvrent la voie à de nouvelles opportunités, notamment à l’international.
GenGenAI – Un socle technique solide et unique
GenGenAI se distingue par une infrastructure technique propriétaire. Contrairement à la plupart des entreprises qui s’appuient sur des services cloud, la startup possède son propre data center, équipé de GPUs performants. Cette indépendance garantit une confidentialité totale, un critère essentiel pour des clients comme l’armée sud-coréenne. « Nos données ne passent pas par des services cloud comme AWS, ce qui rassure nos clients sur la sécurité, » souligne HoJin Cho.
L’entreprise a également développé plus de 30 modèles d’IA générative en interne. Chaque modèle est adapté aux besoins spécifiques des clients, qu’il s’agisse de créer des scènes complexes ou de transformer des données existantes. « Nous n’utilisons pas de modèles universels comme ceux de Google ou OpenAI. Nous personnalisons nos algorithmes pour répondre aux demandes précises de chaque projet, » précise-t-il.
La méthode de GenGenAI repose sur une chaîne de traitement en plusieurs étapes. Elle commence par une simulation physique pour poser les bases des données, suivie d’une génération visuelle réaliste et d’un ajustement final pour reproduire les imperfections des capteurs réels. Cette approche garantit un réalisme sans égal, tout en respectant les exigences des industries les plus pointues.
Questions / Réponses : L’humain derrière GenGenAI
Léo THEVENET : Pourquoi avoir fondé GenGenAI ?
HoJin Cho : « Avant de lancer cette entreprise, j’étais ingénieur dans une startup d’autonomie automobile en Corée. Je travaillais sur l’ADAS pour Daimler, notamment sur la Mercedes Classe C avec LG. À l’époque, on nous demandait souvent des données spécifiques comme les animaux sauvages en Europe. Cela m’a montré à quel point la collecte de données était un frein. Avec mon expertise en traitement d’images, j’ai vu un potentiel énorme dans les données synthétiques. »
Pourquoi vos clients ne créent-ils pas leurs propres générateurs ?
« Des entreprises comme Tesla ont les moyens de le faire, mais la plupart des entreprises n’ont pas les ressources nécessaires. Il faut d’énormes capacités de calcul et des compétences spécifiques. Nous possédons nos propres GPUs et une infrastructure dédiée, ce qui réduit les coûts pour nos clients. »
Quelle est votre vision technique ?
« Nous avons basé nos modèles sur Stable Diffusion, mais nous avons modifié l’architecture pour générer des données encore plus réalistes. Chaque client a des besoins différents, donc nous adaptons nos modèles en conséquence. Par exemple, pour les vidéos, nous travaillons sur des méthodes qui éliminent les incohérences temporelles entre les images. »
Comment vous positionnez-vous sur le marché international ?
« Nous avons déjà des collaborations avec des entreprises américaines comme Phantom AI, mais nous voulons aller plus loin. Nous espérons que le CES nous aidera à nouer des relations avec des clients internationaux. Nous prévoyons d’ouvrir des bureaux aux États-Unis et en Europe dans les prochaines années. »
Comment voyez-vous votre entreprise dans cinq ans ?
« Mon objectif est d’aider les entreprises à adopter l’IA plus rapidement et à moindre coût. Grâce aux données synthétiques, elles pourront réutiliser des jeux de données existants et intégrer de nouveaux capteurs plus facilement. Nous voulons être reconnus comme un leader mondial des données synthétiques. »
Conclusion : Un avenir façonné par les données synthétiques
L’essor de l’intelligence artificielle dépend d’une ressource souvent sous-estimée : les données. GenGenAI, sous la direction visionnaire de HoJin Cho, propose une solution révolutionnaire à ce défi. Grâce à ses technologies avancées et son approche personnalisée, la startup aide les entreprises à surmonter les obstacles liés à la collecte de données. Que ce soit pour l’automobile, la défense ou la surveillance, ses solutions permettent de gagner du temps, de réduire les coûts et d’augmenter la précision des modèles IA.
En participant au CES 2025, GenGenAI espère ouvrir de nouvelles perspectives sur la scène internationale. Et surtout en ayant gagné un CES Innovation Awards (voir la page). Avec des ambitions claires, comme l’expansion aux États-Unis et en Europe, l’entreprise se positionne comme un acteur incontournable dans le domaine des données synthétiques. Comme l’explique HoJin Cho : « Nous voulons accélérer l’adoption de l’IA et créer de nouvelles opportunités grâce à nos données. »
L’avenir de GenGenAI semble aussi prometteur que les technologies qu’elle développe. Si les défis de l’IA sont complexes, cette startup prouve que l’innovation et la spécialisation peuvent transformer ces obstacles en opportunités.