Enregistrer pour l'éternité

Comment pouvons-nous conserver nos connaissances actuelles pour les millénaires à venir ? Des chercheurs de l'ETH montrent une possibilité de stocker des informations sous forme d'ADN et de les conserver pour (presque) l'éternité.

Vue agrandie : les données numérisées sont écrites dans l'ADN, qui est à son tour enfermé dans un fossile.
Pour préserver notre savoir numérique pour l'éternité, les chercheurs de l'ETH s'inspirent des fossiles. (Illustration : Philipp St?ssel/EPF Zurich)

Des manuscrits millénaires nous permettent d'avoir un aper?u des cultures lointaines et du savoir de nos ancêtres. Mais à l'ère du numérique, une grande partie de notre savoir se trouve sur des serveurs et des disques durs qui ne pourront probablement pas survivre des milliers d'années. Les chercheurs cherchent donc de nouvelles possibilités de stockage à long terme de grandes quantités de données. Une attention particulière est accordée à un support de stockage naturel : l'ADN, la substance héréditaire.

L'ADN s'y prête bien, car il permet de stocker de grandes quantités d'informations de manière compacte. Seulement, les données ne peuvent pas forcément être récupérées sans erreur : La décomposition chimique de l'ADN et les erreurs de lecture provoquent des lacunes et des informations erronées dans les données codées. Des chercheurs dirigés par Robert Grass, enseignant au Département de chimie et des sciences biologiques appliquées de l'ETH Zurich, montrent maintenant comment il est possible d'obtenir un stockage à long terme sans erreur, peut-être même pour plus d'un million d'années. D'une part, ils encapsulent les morceaux d'ADN porteurs d'informations dans du dioxyde de silicium (verre), d'autre part, ils utilisent un algorithme pour corriger les erreurs dans les données lues.

Manteau de protection fossile artificiel

Il y a deux ans déjà, des chercheurs ont montré qu'il était possible de stocker des données sous forme d'ADN et de les lire à nouveau. Il ne s'est écoulé que peu de temps entre l'"écriture" de l'information - c'est-à-dire la synthèse de la séquence d'ADN codante correspondante - et la lecture. Même avec des périodes aussi courtes, le risque d'erreur posait problème, car des erreurs se produisent lors de l'écriture et de la lecture de l'ADN. Sur de longues périodes, l'ADN peut en outre subir d'importantes modifications, car il réagit chimiquement avec l'environnement. Cela constitue un obstacle à la conservation à long terme. Il est toutefois possible d'isoler et d'analyser du matériel génétique vieux de plusieurs centaines de milliers d'années à partir d'os fossiles, car il y est encapsulé et protégé. "Comme dans de tels os, nous voulions protéger l'ADN porteur d'informations par une enveloppe artificielle", explique Robert Grass.

Pour ce faire, son équipe a intégré l'ADN dans des billes de silice d'environ 150 nanomètres de diamètre. L'information inscrite dans l'ADN par les chercheurs était le Pacte fédéral suisse de 1291 ainsi que la "Méthodologie des théorèmes mécaniques d'Archimède". Afin de simuler en peu de temps la dégradation du support d'information qu'est l'ADN sur de longues périodes, ils l'ont conservé jusqu'à un mois à des températures comprises entre 60 et 70 degrés Celsius. De telles températures permettent de reproduire la dégradation chimique de plusieurs siècles en l'espace de quelques semaines. De cette manière, les chercheurs ont comparé le stockage de l'ADN dans une enveloppe de silicate avec d'autres méthodes de stockage courantes : séché sur du papier filtre et intégré dans un polymère. Les molécules dans le manteau de silicate se sont révélées particulièrement stables. L'ADN a pu être facilement extrait du matériau à l'aide d'une solution de fluorure, et l'information a pu être lue à partir de celui-ci.

Comme le confinement dans la silice correspond à peu près à celui des os fossiles, les chercheurs ont pu se baser sur ces données préhistoriques concernant la stabilité à long terme de l'ADN encapsulé. Ils ont calculé leur pronostic à partir de ces données : en cas de stockage à basse température, comme par exemple dans le coffre-fort mondial des semences au Spitzberg à moins 18 degrés Celsius, l'information codée par l'ADN pourrait durer plus d'un million d'années. En comparaison, les données sur microfilm ne peuvent être conservées "que" pour une durée estimée à 500 ans.

Récupérer les points de données perdus

Il ne suffit cependant pas de stocker le support d'information pendant de si longues périodes sans l'endommager de manière significative, les données doivent également pouvoir être lues sans erreur. Gr?ce aux énormes progrès réalisés dans les technologies de séquen?age de l'ADN, la lecture des données ainsi stockées est désormais abordable et devrait devenir encore plus économique à l'avenir. Ces technologies ne sont toutefois pas infaillibles.

Pour remédier à ce problème, Reinhard Heckel de l'Institut des techniques de communication de l'ETH Zurich a développé une méthode de correction des erreurs. Celle-ci se base sur ce que l'on appelle les codes Reed-Solomon, similaires à ceux utilisés pour les transmissions de données sur de longues distances, par exemple pour les communications radio avec les sondes spatiales. La clé de cette méthode est une information supplémentaire que l'on annexe aux données proprement dites, explique Heckel. "Pour définir une parabole, il suffit en fait de trois points. Pour les données codées par ADN, il s'agit certes d'un degré de complexité plus élevé, mais le principe de la "sauvegarde" de sécurité des chercheurs, codée dans l'ADN, fonctionne de la même manière. Même en cas de stockage dans des conditions défavorables, cette correction d'erreur a permis de restaurer sans erreur les informations enregistrées à titre de test, à savoir le Pacte fédéral suisse et le texte d'Archimède.

Quelles informations conserverait-il pendant des millions d'années ? Des documents désignés par l'Unesco comme particulièrement importants (Mémoire du monde), dit Robert Grass. Et Wikipedia. "Certaines choses y sont décrites en détail, d'autres moins. Cela donne probablement un bon aper?u de ce que notre société actuelle sait et de ce qui la préoccupe, et à quel point".

Référence bibliographique

Grass RN, Heckel R, Puddu M, Paunescu D, Stark WJ : Robust Chemical Preservation of Digital Information on DNA in Silica with Error-Correcting Codes. Chimie appliquée ?dition internationale, 54, 8, 2552,-2555, DOI : page externe10.1002/anie.201411378.

JavaScript a été désactivé sur votre navigateur.