À l’ère numérique, où l’intelligence artificielle redéfinit les contours de notre quotidien, l’innovation dans le domaine de la spatial intelligence prend une ampleur sans précédent. Imaginez un monde où la création de réalités immersives devient aussi accessible que la rédaction d’un simple texte. C’est exactement la vision que World Labs s’efforce de concrétiser avec ses solutions révolutionnaires. En lançant Marble 1.1 et Spark 2.0, l’entreprise ne se contente pas de proposer des outils performants ; elle transforme radicalement notre manière d’interagir avec des environnements 3D générés par intelligence artificielle.

La capacité de générer des mondes virtuels enrichis d’une interactivité sans précédent ouvre des perspectives fascinantes, non seulement dans le secteur du divertissement, mais également dans des domaines tels que l’architecture, la formation professionnelle et la robotique. Ces outils, en facilitant le prototypage et la visualisation d’espaces complexes, permettent des économies de temps et de ressources, tout en stimulant la créativité des utilisateurs. À l’instar des avancées significatives observées dans le secteur du jeu vidéo, où des environnements dynamiques et modulables permettent des expériences de jeu inégalées, Marble et Spark proposent une approche qui pourrait révolutionner les processus de conception et d’édition dans divers secteurs.

En parallèle, cette évolution technologique suscite de nombreuses interrogations sur les implications éthiques et sociétales de la spatial intelligence. Comment ces nouvelles capacités influenceront-elles notre rapport à la réalité ? Quelles seront les conséquences de la virtualisation croissante de nos interactions quotidiennes ? En plaçant la barre toujours plus haut, World Labs ouvre la voie à des réflexions profondes sur l’avenir de la création numérique et son impact sur l’humanité.

Loin de se limiter à de simples mises à jour de produits, Marble 1.1 et Spark 2.0 incarnent un tournant décisif dans la façon dont nous concevons et expérimentons le monde numérique. En dévoilant ces innovations, World Labs invite les créateurs, les professionnels et les passionnés à explorer un nouvel horizon où la frontière entre le réel et le virtuel s’estompe, offrant ainsi des possibilités infinies pour le développement de la spatial intelligence.

Marble 1.1: La Maturation d’une Technologie de Rupture

Le 2 avril 2026, World Labs a annoncé la sortie de Marble 1.1 et Marble 1.1 Plus. À première vue, il s’agissait d’une simple mise à jour d’un modèle de génération 3D lancé cinq mois auparavant. Cependant, une analyse approfondie révèle une stratégie beaucoup plus vaste. World Labs ne se limite pas à “générer des mondes” ; son ambition est de devenir la plateforme de référence pour la création et la diffusion de mondes 3D générés par intelligence artificielle.

L’annonce des nouveaux modèles n’était que le premier acte d’une pièce complexe. Une semaine plus tard, presque jour pour jour, World Labs dévoilait Spark 2.0, un moteur de rendu open source capable de streamer des mondes 3D composés de plus de 100 millions de points sur n’importe quel navigateur. Ces deux annonces dessinent une thèse claire: World Labs aspire à devenir un acteur incontournable dans l’écosystème de la spatial intelligence, allant bien au-delà du simple rôle de fournisseur de modèles.

Cet article se penche sur la portée réelle de cette double annonce, ses implications tant techniques que stratégiques, et ce qu’elle révèle des ambitions de cette entreprise fondée par Fei-Fei Li, une figure emblématique de l’intelligence artificielle moderne.

Rappel: Qu’est-ce que Marble ?

Pour saisir l’importance de cette mise à jour, il est essentiel de revenir sur la proposition de valeur initiale de World Labs. Contrairement à des modèles comme Sora d’OpenAI ou Veo de Google, qui se concentrent sur la génération de vidéos en 2D, Marble se distingue par sa capacité à créer des mondes 3D entièrement explorables. Cette distinction est fondamentale: alors qu’une vidéo est un contenu que l’on regarde, un monde Marble est un environnement dans lequel il est possible d’évoluer.

Techniquement, Marble repose sur une architecture propriétaire qui combine des modèles de diffusion pour la génération de contenu et la technologie 3D Gaussian Splatting (3DGS) pour la représentation spatiale. Les “splats”, ou points gaussiens, sont des primitives de rendu permettant de représenter des scènes 3D complexes avec une fidélité visuelle impressionnante tout en conservant un coût de calcul raisonnable.

L’innovation majeure de Marble, dès sa version 1.0, réside dans sa capacité à inférer la troisième dimension à partir de diverses sources, qu’il s’agisse d’images 2D, de vidéos, de panoramas ou même de simples descriptions textuelles. Le modèle est capable de comprendre la structure spatiale de la scène, la géométrie des objets et les relations de profondeur, générant ainsi un environnement 3D cohérent en seulement 3 à 5 minutes.

Marble 1.1: L’Amélioration de la Qualité Visuelle

La version 1.1, présentée comme le nouveau modèle par défaut, met l’accent sur un aspect crucial pour l’adoption professionnelle: la fidélité visuelle.

Aspect Marble 1.0 Marble 1.1 Impact
Qualité d’image Baseline initiale Amélioration significative: meilleur éclairage, contraste renforcé, couleurs plus riches Réduction des artefacts visuels (sur-exposition, zones “lavées”)
Technologie sous-jacente 3D Gaussian Splatting 3D Gaussian Splatting + optimisations Mêmes fondations, meilleure exécution
Coût par génération 1 500 crédits 1 500 crédits (inchangé) Amélioration de la valeur à prix constant
Positionnement Modèle par défaut (remplacé mais toujours accessible) Nouveau modèle par défaut Simplification du choix pour les nouveaux utilisateurs

Les retours d’expérience des premiers utilisateurs indiquent que Marble 1.1 produit des scènes avec un éclairage global plus réaliste, une gestion améliorée des ombres et des reflets, ainsi qu’une réduction marquée des “artefacts de flou” qui pouvaient affecter certaines générations de la version 1.0. Ce progrès témoigne d’une technologie qui mature, passant de “ça fonctionne” à “ça fonctionne bien”.

Marble 1.1 Plus: La Rupture sur l’Échelle Spatiale

Cependant, la véritable innovation conceptuelle se trouve dans Marble 1.1 Plus. Alors que les modèles précédents étaient limités à une empreinte spatiale fixe (typiquement une pièce ou un petit extérieur), Marble 1.1 Plus introduit une capacité inédite: l’expansion dynamique de l’espace généré.

Le problème résolu : Pour créer un vaste environnement (comme une place de ville, un niveau de jeu ou un quartier), les utilisateurs devaient soit générer plusieurs scènes et les assembler manuellement, soit accepter des limitations frustrantes en matière de taille. La solution : Marble 1.1 Plus examine la scène et, lorsque cela est pertinent, étend automatiquement sa couverture spatiale en ajoutant des “cubes dynamiques” supplémentaires. Le modèle économique : La structure de prix reflète cette flexibilité: un coût de base de 1 500 crédits, augmenté de 300 crédits par “cube dynamique” ajouté, dans une limite maximale de 1 500 crédits supplémentaires. Ainsi, le coût total est plafonné à 3 000 crédits pour les plus grands mondes.

Cette avancée technique est cruciale, car elle transforme Marble d’un simple générateur de “dioramas 3D” en un véritable moteur de génération procédurale intelligente, capable de produire des environnements à l’échelle d’un jeu vidéo ou d’une simulation urbaine.

“Persistent Memory Graph” (PMG): L’Architecture Secrète

Derrière ces améliorations se cache une innovation architecturale majeure: le “Persistent Memory Graph” (PMG). Ce système de mémoire persistante permet à Marble de maintenir la cohérence d’une scène à grande échelle, même lorsque des zones éloignées sont explorées.

Concrètement, le PMG permet au modèle de :

  • Retenir la structure globale de la scène, même lorsque des interactions se produisent dans des zones éloignées.
  • Maintenir la cohérence géométrique entre les différents “cubes” générés.
  • Assurer des temps de réponse rapides (de l’ordre de la milliseconde) lors des interactions, quelle que soit la taille du monde.

Cette architecture est ce qui rend possible l’expansion dynamique de Marble 1.1 Plus: le modèle peut ajouter des cubes à la volée tout en maintenant la cohérence avec les cubes existants, grâce à cette mémoire partagée de la structure spatiale.

Spark 2.0: L’Autre Moitié de la Stratégie

L’annonce de Marble 1.1 n’était qu’une première étape. Le 14 avril 2026, moins d’une semaine plus tard, World Labs a présenté Spark 2.0, un moteur de rendu 3D Gaussian Splatting open source. Ce timing est loin d’être anodin.

Pourquoi un Moteur de Rendu ?

Générer un monde 3D est une chose, mais le rendre accessible, visualisable et modifiable sur des millions d’appareils (ordinateurs, tablettes, smartphones, casques VR) en est une autre. C’est précisément là qu’intervient Spark.

Avant Spark, l’écosystème des moteurs de rendu web pour 3DGS était confronté à des limitations sévères: certains moteurs ne pouvaient afficher qu’un seul objet 3DGS à la fois. D’autres ne supportaient pas l’animation dynamique des splats. Beaucoup reposaient sur des frameworks 3D de niche ou sur WebGPU (encore peu répandu), ce qui limitait leur compatibilité.

World Labs a donc développé son propre moteur de rendu interne, initialement nommé Forge, avant de le rebaptiser Spark. Ce moteur a été utilisé pour les démonstrations de Marble et pour le projet Lofi Worlds. Aujourd’hui, l’entreprise a choisi de l’open sourcer.

Les Trois Piliers Techniques de Spark 2.0

Spark 2.0 repose sur trois innovations techniques majeures, qui sont détaillées dans la documentation officielle :

a) Level-of-Detail (LoD) Continu

Spark implémente un système de détails progressifs continus, permettant d’adapter la qualité de rendu à la distance de l’observateur. Les objets proches sont rendus avec un maximum de détails, tandis que ceux plus éloignés le sont avec moins de splats.

Deux algorithmes sont proposés: Tiny-LoD: rapide et léger, idéal pour la génération en temps réel sur le web. Bhatt-LoD: haute précision, pour le traitement hors ligne. La spécificité de l’approche Spark réside dans l’utilisation d’un arbre de splats gaussiens hiérarchique, permettant une transition fluide entre les niveaux de détail, sans les artefacts de “saut” (popping) caractéristiques des solutions discrètes.

b) Streaming Progressif

Spark 2.0 définit un nouveau format de fichier, le .RAD (Radiance Fields). Ce format supporte la compression, l’accès aléatoire et le streaming, ce qui le rend parfaitement adapté aux applications web.

Le processus de chargement suit une logique “du grossier vers le fin” (coarse-to-fine): le monde s’affiche immédiatement dans une version basse résolution (64 000 splats). Les données sont téléchargées progressivement, en priorisant celles qui améliorent la zone visible par l’utilisateur. La scène s’affine continuellement à mesure que les données arrivent.

c) Mémoire Virtuelle GPU

L’innovation la plus technique réside dans l’application du concept de mémoire virtuelle au rendu 3DGS. Spark pré-alloue une mémoire GPU fixe (capacité de 16 millions de splats) et utilise un système de pagination pour charger et décharger dynamiquement les données.

Lorsque la mémoire est saturée, l’algorithme LRU (Least Recently Used) identifie les données les moins prioritaires à évacuer. Cela permet de naviguer dans des mondes de plus de 100 millions de splats sur des appareils aux capacités GPU limitées.

L’Importance Stratégique de l’Open Source

En open sourçant Spark 2.0, World Labs fait un pari stratégique :

Créer un standard de facto: En fournissant une solution de référence gratuite et performante, World Labs espère que Spark deviendra le moteur de rendu par défaut pour l’écosystème 3DGS. Accélérer l’adoption: Les développeurs peuvent désormais intégrer la visualisation de mondes 3DGS dans leurs applications sans avoir à réinventer la roue. Construire une communauté: Un projet open source attire les contributeurs, génère des retours et améliore la technologie plus rapidement qu’un développement interne fermé. Préparer le terrain pour Marble: Plus l’écosystème 3DGS sera vaste, plus la valeur de Marble (un générateur de mondes 3DGS) augmentera.

Cette stratégie s’inscrit dans une approche classique de l’industrie technologique: fournir gratuitement l’outil de visualisation pour susciter la demande pour l’outil de création.

Analyse Stratégique: La Vision à Long Terme de World Labs

En prenant du recul sur ces deux annonces, une vision stratégique cohérente se dessine.

Les Trois Piliers de la Spatial Intelligence

World Labs construit méthodiquement son infrastructure sur trois piliers :

Pilier Composant Statut Rôle
Création Marble 1.0 → 1.1 → 1.1 Plus Commercial (API, site web) Générer des mondes 3D à partir de prompts variés
Visualisation Spark 2.0 Open source Rendre ces mondes accessibles sur n’importe quel appareil
Édition Studio / Composer Intégré à la plateforme Modifier, affiner, exporter les mondes générés

L’utilisateur peut ainsi créer un monde avec Marble, le visualiser avec Spark, le modifier avec Studio, et l’exporter vers des moteurs tels qu’Unreal ou Unity.

Le Modèle Économique: Une Approche à Deux Vitesses

World Labs déploie une stratégie de monétisation sophistiquée :

Segment grand public / créateurs individuels: Génération gratuite pour les nouveaux utilisateurs (crédits offerts). Modèle Marble 1.1 à coût fixe (1 500 crédits), prévisible et accessible. Interface web simple, sans nécessité de compétences techniques.

Segment professionnel / entreprise: API payante pour l’intégration dans des applications tierces. Marble 1.1 Plus à coût variable, adapté aux gros volumes. Capacités d’export avancées et intégration avec les pipelines existants.

La Position Concurrentielle

World Labs se positionne sur un créneau spécifique mais stratégique: la génération de mondes 3D cohérents et modifiables.

Concurrent Domaine principal Différence avec World Labs
OpenAI (Sora) Génération vidéo Sora génère des vidéos 2D ; Marble génère des mondes 3D explorables
Google (Veo) Génération vidéo Même distinction
NVIDIA (Edify) Génération 3D pour jeux Focus sur les assets individuels, pas sur les mondes entiers
Decart (Minecraft AI) Génération de jeux en temps réel Différentiel technique et de maturité

L’avantage concurrentiel de World Labs repose sur trois éléments: la qualité de la modélisation spatiale: Compréhension des relations géométriques et causales entre les objets. La persistance et l’éditabilité: Les mondes générés peuvent être modifiés, contrairement à une simple vidéo. L’écosystème complet: De la génération à la visualisation en passant par l’édition.

Le Timing et le Rythme d’Innovation

Depuis le lancement officiel de Marble en novembre 2025, World Labs a maintenu un rythme d’innovation soutenu :

  • Novembre 2025: Lancement de Marble 1.0.
  • Début 2026: API, améliorations des exports, intégration de meshes dans Composer.
  • Avril 2026: Marble 1.1 et 1.1 Plus.
  • Mi-avril 2026: Spark 2.0 open source.

Ce rythme (une annonce majeure toutes les 4 à 6 semaines) envoie un signal fort au marché: l’entreprise est bien capitalisée, sa feuille de route est respectée, et la technologie progresse rapidement. C’est un facteur de confiance essentiel pour convaincre les clients professionnels.

Applications et Marchés Cibles

La combinaison de Marble 1.1 et Spark 2.0 ouvre des possibilités dans plusieurs secteurs.

Jeux Vidéo et Divertissement

Ce marché est le plus évident. Marble permet de prototyper rapidement des niveaux de jeu, des environnements et des décors.

Cas d’usage typique : Un level designer décrit un niveau de donjon en texte, Marble génère une version 3D explorable en 5 minutes. Le designer peut ensuite itérer, modifier et exporter vers Unity ou Unreal pour le développement final.

L’intérêt économique est massif: selon une analyse de marché citée dans la presse spécialisée, l’adoption de ce type d’outils pourrait réduire les temps de développement de 30% dans certains segments.

Architecture et Design d’Intérieur

La capacité de Marble à générer des espaces 3D à partir de photos ou de plans est précieuse pour les architectes et les décorateurs.

Cas d’usage : Un architecte prend des photos d’un espace vide, Marble génère plusieurs propositions d’aménagement 3D que le client peut explorer virtuellement. Les visioconférences se transforment ainsi en visites immersives.

Simulation et Formation

Pour les entreprises qui forment leurs employés à des procédures complexes (industries dangereuses, maintenance, santé), les simulations immersives sont coûteuses à produire.

Marble pourrait permettre de générer automatiquement des environnements d’entraînement variés à partir de descriptions textuelles, réduisant le coût de création de contenu pédagogique immersif.

Le Marché Stratégique: L’IA Incarnée (Embodied AI)

L’application la plus stratégique, et celle qui est probablement la plus chère au cœur de Fei-Fei Li, est la formation de robots et d’agents incarnés.

Le problème : Les robots nécessitent des millions d’heures d’entraînement dans des environnements variés. Les capturer dans le monde réel est coûteux, dangereux et limité. Les simulateurs sont utiles, mais souvent trop simplifiés ou éloignés du réel.

La solution : Marble peut générer des environnements d’entraînement variés, cohérents et conformes aux lois de la physique. Un robot peut ainsi s’entraîner virtuellement dans des milliers de cuisines, d’entrepôts ou de rues générées par Marble, avant d’être déployé dans le monde réel.

Cette application explique probablement une partie des 1 milliard de dollars levés par World Labs: l’incarnation de l’IA (robots, véhicules autonomes) est l’un des marchés les plus prometteurs pour la spatial intelligence.

Limites et Défis à Relever

Malgré ces avancées, plusieurs limitations persistent.

Personnages et Entités Animées

Marble génère des environnements statiques. Il ne crée pas encore de personnages, d’animaux ou d’entités animées de manière crédible. Un monde sans habitants reste un décor, aussi magnifique soit-il. La génération d’entités animées, cohérentes avec l’environnement et capables d’interactions, est probablement.

L’innovation récente de World Labs, illustrée par les mises à jour de Marble 1.1 et Spark 2.0, marque une avancée significative dans le domaine de la spatial intelligence. Ce développement ne se limite pas à une simple amélioration technique, mais s’inscrit dans une dynamique plus large qui transforme notre manière d’interagir avec le monde numérique. Les capacités de création de mondes 3D de cette entreprise ouvrent des perspectives inédites pour des secteurs variés tels que le divertissement, l’architecture et la formation, contribuant ainsi à une réduction des coûts et des délais de production.

En réfléchissant aux implications de ces technologies, on peut s’interroger sur l’impact qu’elles auront sur notre perception de la réalité. Alors que les frontières entre le réel et le virtuel deviennent de plus en plus floues, il est essentiel de considérer comment cette évolution influencera nos interactions sociales et notre créativité. Les environnements générés par intelligence artificielle pourraient également jouer un rôle crucial dans la façon dont les entreprises et les individus abordent l’éducation et la simulation, permettant des expériences d’apprentissage plus immersives et interactives.

La montée de la spatial intelligence soulève également des questions éthiques sur l’utilisation des données et la sécurité des utilisateurs dans ces nouveaux espaces numériques. Comment garantir un usage responsable de ces technologies tout en préservant la créativité et l’innovation ? Cette réflexion est d’autant plus pertinente à l’heure où la technologie continue d’évoluer à un rythme effréné.

En explorant davantage les possibilités offertes par des outils comme Marble et Spark, les créateurs et les professionnels sont invités à envisager un avenir où la technologie et l’imagination se conjuguent pour redéfinir notre rapport à l’espace et à l’interaction. L’importance de rester informé et engagé dans ce domaine en pleine expansion ne saurait être sous-estimée, car les implications de ces avancées se feront sentir dans tous les aspects de notre vie quotidienne.

Aller plus loin

Pour comprendre l’ambition et le vocabulaire de World Labs avant d’entrer dans la technique, commencez par la note de lancement qui explique la logique du “world model” et les usages visés. Elle permet de distinguer génération d’assets, reconstruction de scènes et création d’environnements cohérents. C’est aussi un bon repère pour repérer ce qui relève d’une démonstration produit versus une brique exploitable en pipeline. La lecture de Marble: A Multimodal World Model aide à poser ce cadre.

Pour aller droit au concret, la documentation des modèles clarifie ce que recouvrent les variantes et comment elles se positionnent en pratique. Vous y trouvez les différences de comportement attendues, ainsi que les contraintes de génération utiles pour anticiper la taille, la densité et le type d’environnements. Cette page sert aussi de référence stable quand vous comparez des rendus issus de versions différentes. Consultez Models – Marble.

Si votre objectif est d’intégrer la génération 3D dans une chaîne outillée, la doc API est la meilleure entrée, car elle formalise les formats d’entrée, les sorties et les paramètres. Elle aide à passer du “prompt” à une exécution reproductible, avec des appels scriptables et des scénarios d’automatisation. C’est particulièrement utile pour industrialiser des tests, des batchs, ou des itérations guidées par des données. Appuyez-vous sur Quickstart API – World Labs.

Pour suivre l’évolution rapide du produit et éviter les comparaisons trompeuses, les notes de version sont un réflexe simple mais décisif. Elles permettent de repérer les changements de modèle, d’interface, d’export et de performance qui peuvent expliquer des écarts de résultat. C’est aussi le bon endroit pour vérifier si une fonctionnalité évoquée dans un article est récente ou déjà remplacée. Gardez sous la main Release notes – Marble.

Dès qu’on parle de “mondes immenses”, la question de l’interopérabilité devient centrale, surtout si vous devez passer d’un outil à un autre sans perdre la structure de scène. OpenUSD est une référence de fait pour décrire des scènes complexes, leurs hiérarchies et leurs variantes dans des pipelines 3D modernes. La ressource est utile autant pour comprendre les formats que pour anticiper les implications de stockage, composition et collaboration. La base à lire est OpenUSD.

Pour situer Marble par rapport aux approches “radiance fields” et à la production de scènes depuis images/vidéos, il est utile d’avoir une boîte à outils de reconstruction et d’entraînement reproductible. Nerfstudio fournit une chaîne de bout en bout, avec des méthodes, des viewers et des pratiques de capture qui aident à comprendre d’où viennent les artefacts et les limites. Même si vous n’entraînez rien, la doc est précieuse pour lire correctement les contraintes de pose, de couverture et de cohérence multi-vues. Référez-vous à Nerfstudio Documentation.

Si vous cherchez un repère technique sur le rendu rapide de scènes de type radiance field, le “Gaussian splatting” est devenu un point de comparaison fréquent dans les discussions récentes. Le projet explique l’idée, montre des résultats et offre des éléments utiles pour comprendre pourquoi certaines approches passent mieux à l’échelle que d’autres. Cela aide aussi à différencier reconstruction, rendu interactif et génération sémantique, qui n’ont pas les mêmes contraintes. Une bonne entrée est 3D Gaussian Splatting for Real-Time Radiance Field Rendering.

Pour parler d’échelle sans rester abstrait, regarder les jeux de données 3D massifs aide à comprendre ce que signifie “diversité”, “couverture” et “généralisation” en pratique. Objaverse-XL est souvent cité car il structure des expérimentations comparables et met en évidence les défis de qualité, de déduplication et de licences quand on change d’ordre de grandeur. C’est une ressource utile si vous voulez relier la promesse de génération à la réalité des corpus et des distributions d’objets. Explorez Objaverse-XL.

Enfin, pour relier génération 3D et production d’expériences interactives, il vaut la peine de se replonger dans les workflows de création temps réel et de fabrication d’assets. Les parcours de Unity Learn permettent de structurer rapidement l’intégration d’environnements dans un moteur, avec une logique d’itération, de performance et de packaging. Pour compléter côté création et prototypage procédural, la documentation Geometry Nodes – Blender Manual offre une base solide pour manipuler et automatiser la géométrie avant import. Ensemble, ces deux ressources aident à passer d’un “monde généré” à un monde réellement exploitable dans une production.