STOCKAGE DE DONNÉES

Capsule temporelle d’ADN pour l’info numérique

Le vieux rêve de stocker des données sur l’ADN de manière compacte et durable est devenu réalité. Une application est déjà sur le marché.

Lionel Pousaz, 2 décembre 2021

Les petites boules de verre (vues ici à travers un microscope électronique) protègent l’ADN de l’air ambiant et le préservent ainsi pour des centaines de milliers d’années. | Photo: Heinz Troll

En théorie, un seul gramme d’ADN pourrait contenir l’équivalent de 210 millions de téraoctets de données, soit à peu près autant de disques durs de capacité moyenne. Il peut rester lisible pendant des centaines de milliers d’années, contre quelques dizaines d’années à peine pour les supports numériques actuels. Cette compacité et cette durabilité en font un candidat prometteur pour stocker des données numériques. C’est ce à quoi travaillent Robert Grass et Wendelin Stark, chercheurs à l’ETH Zurich. Cet été, leurs avancées leur ont valu le European Inventor Award de l’Office européen des brevets.

Il est facile de représenter de l’information numérique avec de l’ADN. Le code binaire est converti en code quaternaire – les quatre bases chimiques de l’ADN, désignées par les lettres A, T, G et C. En l’occurrence, A tient lieu de 00, T de 11, G de 10 et C de 01. Le défi réside plutôt dans le stockage. L’ADN ne se conserve que sous certaines conditions, à l’abri de l’air et de l’oxygène. Un processus qui a fait ses preuves: l’ADN est encore lisible dans des dents humaines fossilisées vieilles d’un million d’années. S’inspirant de ce phénomène, les chercheurs ont encapsulé la molécule dans des nanoparticules de verre. «Le verre représente le matériau idéal, explique Robert Grass. On sait le manipuler à l’échelle nanométrique, et il ne réagit pas avec l’ADN.» Le résultat ressemble à une sorte de poudre grisâtre. Pour lire l’ADN, il faut ensuite le libérer de sa gangue. Les scientifiques plongent alors les nanoparticules dans une solution fluorée qui dissout le verre. L’ADN est relâché, il peut être lu.

«Ce procédé est le premier qui a vraiment permis la mise en pratique de l’idée du stockage ADN de données à long terme.»Dina Zielinski

Le procédé ne fonctionne qu’à une seule reprise: une fois dissous, le verre ne se reforme pas. Pour cette raison, l’application de choix de ce procédé est le stockage à long terme, note Robert Grass. «Certains fonds de bibliothèque ou d’archives légales ne requièrent pas de consultations fréquentes. C’est là que l’ADN prend l’avantage sur les supports standards.» «Ces travaux sont d’une importance cruciale. Le principal intérêt du stockage ADN de données, c’est le long terme, et ce procédé est le premier qui permet vraiment de mettre cette idée en pratique», explique Dina Zielinski. Biologiste computationnelle à l’Institut national de la santé et de la recherche médicale en France, elle n’a pas participé aux travaux des scientifiques zurichois.

Suivi de provenance

Les chercheurs développent une autre application, plus surprenante peut-être. Leur start-up Haelixa utilise un code-barres ADN encapsulé pour suivre la chaîne d’approvisionnement des textiles – de la collecte de la fibre jusqu’au produit fini. Des étiquettes invisibles qui permettraient aussi de vérifier la provenance de nombreux autres produits. Le but des scientifiques reste néanmoins le stockage de grandes quantités de données à très long terme. «Tant que nous serons faits d’ADN, nous disposerons d’un moyen pour le lire, explique Robert Grass. Je suis fasciné par l’idée que la technologie que nous avons développée puisse conserver nos informations jusque dans un futur très lointain. Manque seulement la clé de décryptage. C’est un peu comme si vous deviez reconstituer une photo jpeg à partir d’un code binaire. C’est compliqué, mais on y travaille.»

«Nous cherchons encore le juste équilibre entre coût, vitesse et précision.»Robert Grass

Dans un avenir proche, l’équipe souhaite optimiser les technologies de synthèse de l’ADN. Pour l’heure, les procédés sont lents et coûteux – les scientifiques sous-traitent cette étape à des entreprises spécialisées. «L’industrie biomédicale fournit des séquences très précises, ce qui a du sens dans ce domaine. Mais pour les données numériques, les décodeurs peuvent corriger une majorité d’erreurs. Pour nous, l’idéal serait un système de synthèse moins précis, mais plus rapide et abordable. »

Côté lecture, l’équipe utilise encore des séquenceurs du commerce. «Il leur faut tout de même une bonne nuit de travail pour potasser ‘Guerre et Paix’, note Robert Grass. Même si la technologie s’améliore constamment, c’est encore trop lent.» Il est confiant que le jour où on disposera de technologies de lecture et d’écriture à bas prix est proche: «Nous cherchons encore le juste équilibre entre coût, vitesse et précision. A terme, les solutions devraient être accessibles pour tous, à la maison.»

CC BY-NC-ND

Horizons (FR)

Suivi de provenance