La biologie, en tant que science fondamentale, représente un labyrinthe de complexité et d’intrigue. Chaque jour, les chercheurs s’efforcent de percer les mystères du vivant, d’analyser les interactions infinies entre gènes, protéines et cellules, et de comprendre comment ces éléments se combinent pour donner naissance à la diversité de la vie sur Terre. Pourtant, malgré les avancées spectaculaires réalisées au cours des dernières décennies, le domaine médical est confronté à un paradoxe frappant: même avec des outils technologiques de pointe, la capacité à prédire avec précision l’impact d’un traitement sur un patient demeure très limitée.

Ce défi résonne également dans d’autres secteurs, comme l’intelligence artificielle, où les algorithmes, bien qu’impressionnants, peinent encore à appréhender la complexité des émotions humaines ou des comportements sociaux. Tout comme les programmeurs cherchent à affiner leurs modèles pour anticiper des actions humaines, les biologistes doivent s’efforcer de comprendre des systèmes vivants qui échappent souvent à la logique linéaire. Ce manque de clarté en biologie se manifeste par une statistique alarmante: près de 90 % des médicaments en phase d’essai échouent. Ce chiffre met en lumière non seulement les risques financiers considérables, mais aussi la pression immense exercée sur les chercheurs pour innover et développer des traitements capables de transformer des vies.

Dans ce contexte, l’émergence de l’intelligence artificielle se présente comme une lueur d’espoir. Des technologies comme AlphaFold, qui a fait sensation en prédisant la structure des protéines, ouvrent de nouvelles avenues pour l’exploration biologique. Cependant, l’IA ne doit pas être considérée comme une solution miracle, mais plutôt comme un outil puissant à intégrer dans une approche holistique. Bioptimus, par exemple, incarne cette ambition en cherchant à établir un modèle capable de simuler la biologie à l’échelle humaine, reliant génomique, histopathologie et données cliniques pour offrir une vision plus complète du vivant. En s’attaquant à la complexité de la biologie, cette startup parisienne aspire à transformer non seulement la recherche médicale, mais aussi la manière dont nous concevons et administrons les traitements, en plaçant l’homme et son histoire au cœur de cette révolution scientifique.

L’Intelligence Artificielle au Service de la Biologie: L’Exemple de Bioptimus

La biologie représente sans aucun doute l’un des systèmes les plus complexes que l’humanité ait tenté de déchiffrer. Malgré des décennies d’accumulation de données et de construction de connaissances, la médecine se confronte à un défi majeur: l’absence d’un cadre prédictif solide pour anticiper les effets d’un traitement ou l’évolution d’une maladie. Cette « carte incomplète » du vivant se traduit par un chiffre alarmant: près de 90 % des médicaments qui parviennent aux essais cliniques échouent, après des années de développement et des investissements se chiffrant en centaines de millions d’euros.

L’Impact de l’IA sur la Biologie

AlphaFold: Une Révolution dans la Biologie Structurale

L’intelligence artificielle a déjà transformé certains aspects de la biologie, mais AlphaFold, développé par Google DeepMind, a véritablement marqué un tournant. Ce modèle a été récompensé par le prix Nobel de chimie en 2024, ayant résolu un problème crucial resté sans réponse pendant des décennies: la prédiction de la structure tridimensionnelle des protéines à partir de leur séquence d’acides aminés. Cependant, bien qu’AlphaFold ait révolutionné la biologie structurale, il ne représente qu’un fragment d’un problème bien plus vaste. Comprendre le vivant nécessite de relier les gènes, les protéines, les cellules, les tissus, les organes, l’environnement et l’historique médical de chaque patient.

Bioptimus: Une Startup Prometteuse

Ambitions et Objectifs

C’est précisément cette vision intégrative qui anime Bioptimus, une startup parisienne se positionnant à la croisée des chemins entre science et industrie. Son ambition est de construire un modèle de fondation multi-échelle et multi-modal pour la biologie, un véritable « GPT du vivant » capable de générer des simulations biologiques.

H-optimus-0: Un Modèle de Fondation Open Source

En un an seulement, Bioptimus a lancé h-optimus-0, un modèle de fondation open source dédié à la pathologie. Ce modèle est considéré comme le plus vaste de son genre dans ce domaine. Les équipes de Harvard et de l’Université de Leeds ont démontré que h-optimus-0 surpasse les modèles existants dans divers domaines, tels que la prédiction de l’expression génique à partir de la morphologie des tissus, le sous-typage des cancers de l’ovaire et la détection de biomarqueurs, permettant ainsi une meilleure évaluation de la réponse à certains traitements. Avec plus de 100 000 téléchargements, ce chiffre est particulièrement satisfaisant pour un domaine aussi spécialisé que l’histopathologie.

Ressources Critiques pour Modéliser la Biologie

Données: Un Actif Stratégique

Pour modéliser la biologie à toutes ses échelles, Bioptimus a dû sécuriser trois actifs stratégiques. Tout d’abord, les données sont cruciales. Contrairement à d’autres domaines, la quantité de données biologiques pertinentes et de qualité est limitée, souvent sous contrôle propriétaire et rarement accessibles au public. Certaines bases de données peuvent coûter plusieurs millions d’euros pour quelques milliers de patients, dans un marché encore en pleine évolution où un jeu de données acheté aujourd’hui pourrait devenir, un an plus tard, un standard ouvert ou dévalué. Bioptimus combine des données publiques, des partenariats avec des établissements hospitaliers et l’accès aux données patients d’Owkin, qui a incubé la startup, pour alimenter ses modèles basés sur des cas cliniques concrets.

Puissance de Calcul

Ensuite, la puissance de calcul est essentielle. En moins d’un an, Bioptimus a levé l’équivalent de 65 millions d’euros, dont une part significative a été investie dans des clusters GPU et des infrastructures cloud dédiées. Une grande partie des fonds levés est destinée à l’entraînement de ces modèles massifs, capables d’intégrer différentes modalités et de travailler sur des volumes de données hétérogènes.

Équipe Interdisciplinaire

Enfin, l’équipe constitue un atout majeur. Bioptimus a rassemblé des profils diversifiés issus de Google DeepMind, d’Owkin et de laboratoires académiques de premier plan. Cela se traduit sur le terrain par des équipes où cohabitent des spécialistes du machine learning, des pathologistes, des biologistes, des ingénieurs HPC et des data scientists, chacun apportant une expertise pointue dans son domaine respectif.

Éthique, Diversité et Gestion des Données

Contraintes Éthiques

Au-delà de la quantité de données, Bioptimus doit également faire face à des contraintes qualitatives et éthiques. Toutes les données ne se valent pas, et un modèle de pathologie peut facilement surinterpréter des artefacts liés à des types de scanners, des protocoles de préparation de lames ou des habitudes de rédaction des comptes rendus par certains pathologistes. La diversité recherchée n’est donc pas uniquement démographique (genre, origine, âge), mais également technologique (types de scanners), organisationnelle (types d’hôpitaux et pratiques) et géographique.

Mise en Place d’un Scientific Advisory Board

La gestion de ces biais potentiels est primordiale, tant pour des raisons de performance scientifique que pour des considérations réglementaires et d’acceptabilité des modèles par les autorités et les cliniciens. Dans ce cadre, Bioptimus a constitué un comité consultatif scientifique composé de chercheurs de premier plan en biologie, en sciences médicales et en machine learning. Ce comité a pour mission d’orienter les choix scientifiques, d’ouvrir des portes auprès de l’industrie pharmaceutique et des fournisseurs de données, et de challenger les architectures des modèles en développement.

Concurrence et Trajectoire Produit

Paysage Concurrentiel

Sur le plan concurrentiel, Bioptimus évolue dans un environnement où plusieurs acteurs poursuivent des objectifs similaires, souvent avec des moyens financiers bien plus importants, comme Isomorphic Labs (Alphabet) ou XtalPi en Chine. En janvier 2025, la startup a bouclé une levée de 41 millions d’euros en série A, menée par Cathay Innovation, avec la participation de Bpifrance, Sofinnova Partners, Andera Partners, Hitachi Ventures, Sunrise, Boom Capital Ventures et Pomifer Capital, portant ainsi ses financements cumulés à environ 76 millions de dollars.

Financement et Stratégie de Développement

Bioptimus adopte une approche disciplinée en matière d’allocation de capital, en choisissant soigneusement les pathologies ciblées et en arbitrant entre une commercialisation précoce et la poursuite d’une feuille de route à long terme. L’accent est mis sur la sélection de jeux de données réellement différenciants, plutôt que sur des données « spectaculaires » mais rapidement banalisées. Ce capital permettra d’accélérer le développement d’un premier modèle multimodal commercial, d’élargir l’accès à des données rares, et de réaliser l’objectif, à horizon cinq à dix ans, de construire des jumeaux numériques capables de simuler la biologie de chaque patient, du microscopique au macroscopique.

Bioptimus est dirigée par un collectif d’élites scientifiques, d’ingénieurs et d’entrepreneurs, avec à sa tête Jean-Philippe Vert, co-fondateur et CEO. Ancien directeur de recherche chez Owkin et ex-responsable de recherche chez Google Brain, il possède un parcours académique impressionnant (École Polytechnique, PhD en mathématiques) et plus de 190 publications. Il est accompagné de co-fondateurs issus de Google DeepMind et d’Owkin, tels que Rodolphe Jenatton (Chief Technology Officer), Zelda Mariet (VP Research), Felipe Llinares-López (VP AI), ainsi que David Cahané et Éric Durand, qui apportent des compétences scientifiques pointues en machine learning, IA appliquée à la biologie, bioinformatique et modélisation des données biomédicales. Ce socle fondateur est complété par un leadership opérationnel et stratégique avec Mathilda Ström, nommée en novembre 2024 Chief Operating Officer.

La complexité de la biologie et les défis associés à la médecine moderne soulignent l’importance d’une approche intégrée et innovante. Les statistiques alarmantes concernant les échecs des traitements en essais cliniques révèlent une nécessité urgente de revisiter les méthodes de recherche et de développement. Dans cette quête, l’intelligence artificielle se présente non seulement comme un outil, mais comme un catalyseur de transformation, capable de relier des domaines disparates tels que la génétique, l’imagerie médicale et l’histoire clinique des patients.

Des initiatives comme celles de Bioptimus illustrent comment la technologie peut redéfinir notre compréhension du vivant, ouvrant la voie à des traitements plus personnalisés et efficaces. Les jumeaux numériques, par exemple, pourraient révolutionner la manière dont nous concevons la médecine, rendant possible la simulation des effets des traitements avant leur administration. Cette avancée ne se limite pas à des applications cliniques, mais touche également des questions sociétales plus larges, notamment celles liées à l’éthique, à l’accessibilité des soins et aux biais dans les données.

En se projetant dans l’avenir de la biologie et de la médecine, il devient essentiel de considérer comment ces innovations peuvent influencer notre approche de la santé, tant au niveau individuel que collectif. Le rôle des scientifiques, des ingénieurs et des décideurs est crucial dans cette dynamique, alors que nous nous dirigeons vers un avenir où la technologie et la biologie convergent pour redéfinir les frontières de la connaissance humaine. Cette exploration des intersections entre science et technologie invite chacun à réfléchir à la manière dont nous pouvons collectivement façonner un système de santé plus équitable et adapté aux défis du XXIe siècle. Quelles seront les prochaines étapes pour garantir que ces avancées profitent à tous ?

Aller plus loin

Plongez dans les avancées qui lient IA et biologie avec ces ressources solides et actuelles.

Commencez par AlphaFold — technologie et retombées, qui présente les modèles, leurs capacités et leurs impacts récents sur la découverte scientifique.

Complétez avec la base de données AlphaFold Protein Structure Database, pour explorer et télécharger des structures prédictives à grande échelle.

Poursuivez sur le site officiel de Bioptimus, qui détaille la vision « foundation models » pour la biologie, les actualités et les informations sur l’équipe et les projets.

Pour suivre la recherche de pointe en bio‑tech, la revue Nature Biotechnology publie études, perspectives et outils à l’interface IA/biologie.

Côté éthique et gouvernance dans la santé, le guide OMS/WHO — Ethics and governance of AI for health offre des recommandations concrètes et applicables.

Sur les jumeaux numériques médicaux, l’article en libre accès Digital Twins in Healthcare — Methodological Challenges fait le point sur les usages cliniques et les défis.

Enfin, pour structurer vos données et améliorer la robustesse des modèles, Datasheets for Datasets propose un cadre de documentation favorisant diversité, traçabilité et qualité des jeux de données.

Ces liens offrent un panorama cohérent pour comprendre comment l’IA — et Bioptimus en particulier — peut accélérer la modélisation du vivant, de la structure des protéines aux applications cliniques responsables.