679-08911769_72dpi

CNRS LE JOURNAL, JUIN 2017

Un nouvel outil de bio-informatique, mis au point par une équipe franco-néerlandaise, est capable d’établir la carte génomique des principaux variants d’une même population de virus. Une prouesse technique qui pourrait permettre d’identifier très vite les caractéristiques des souches virales impliquées dans certaines épidémies et juguler ainsi leur progression.

Les virus à ARN se révèlent parfois de redoutables agents infectieux, comme en atteste la vaste épidémie d’Ebola qui frappa l’Afrique de l’Ouest entre décembre 2013 et mars 2016. Durant cette période, le virus a provoqué plus de 11 000 décès parmi les 28 000 personnes infectées. Bien que les raisons d’une telle hécatombe demeurent complexes, l’impossibilité d’établir le portrait-robot de la souche virale à l’origine de l’épidémie explique en partie son ampleur exceptionnelle : « Lorsqu’un virus comme Ebola, le VIH ou Zika infecte l’homme, son ARN subit une succession de mutations dans le but d’échapper à la réponse immunitaire de son hôte. Ces mutations donnent naissance à une multitude de variants génomiques très proches les uns des autres, qualifiés de quasi-espèces » , rappelle Éric Rivals, chercheur en bio-informatique au Laboratoire d’informatique, de robotique et de microélectronique de Montpellier¹ (LIRMM) et directeur de l’Institut de biologie computationnelle² (IBC).

Or cette stratégie d’adaptation complique grandement la tâche des scientifiques qui tentent de séquencer les génomes viraux. L’opération de séquençage génère en effet des millions de fragments d’une centaine de nucléotides que de savants calculs informatiques permettent ensuite d’assembler afin de reconstituer le génome dans sa totalité. « Ces outils de bio-informatique sont très efficaces lorsqu’il s’agit de reconstruire un génome unique de plante ou d’animal, constate Éric Rivals. Mais face à un virus présentant une multitude de variants génomiques, ces outils s’avèrent inopérant car ils ont tendance à regrouper entre eux des fragments d’ARN provenant de quasi-espèces différentes. »

Un assemblage méticuleux

Pour parvenir à discriminer ces quasi-espèces virales, des chercheurs du LIRMM et du Centrum voor Wiskunde en Informatica (CWI) d’Amsterdam ont développé un outil dédié à l’assemblage de leurs génomes respectifs³. Celui-ci combine une méthode d’indexation capable d’identifier les chevauchements fiables entre fragments de nucléotides viraux et un algorithme de reconstruction progressive et simultanée des génomes de quasi-espèces. Baptisé SAVAGE par l’équipe franco-néerlandaise, le logiciel est censé entrer en action à l’issue de la  phase de séquençage consistant à casser le génome en plusieurs morceaux d’ARN. Sa principale mission : s’assurer que l’étape suivante, destinée à mettre bout à bout les fragments d’une même quasi-espèce virale pour en reconstituer le génome, se déroule sans la moindre erreur.

« En appliquant des chevauchements entre ces séquences trois fois plus importants que ceux pratiqués par une méthode d’assemblage classique, SAVAGE doit permettre de distinguer des sous-espèces de virus très proches sur le plan génétique tout en estimant de manière précise leur proportion respective au sein d’une même population virale », détaille le chercheur. Restait toutefois à mesurer l’efficacité de cette nouvelle stratégie d’assemblage sur de véritables génomes viraux.

Reconstruction de la structure d'un virus entier en combinant radiocristallographie et cryo-microsco

 

Circonscrire les épidémies

Dans un premier temps, les scientifiques ont modélisé la structure génomique de populations virales (hépatite C,  VIH, Zika, Ebola), comprenant une dizaine de quasi-espèces chacune. Après avoir simulé le découpage de ces différents variants génomiques, ils ont tenté de reconstruire leur génome à l’aide du logiciel SAVAGE. 90 % du génome de toutes les quasi-espèces modélisées a ainsi pu être reconstitué et ce pour toutes les espèces de virus testées.

Afin de confirmer les excellentes performances de leur outil d’assemblage, les chercheurs l’ont ensuite confronté à des données réelles. Ils ont pour cela utilisé un jeu de séquences génomiques existant, obtenu en inoculant cinq quasi-espèces de VIH à des cellules en culture, chacune d’elle étant en outre introduite dans des proportions différentes. À partir de l’ARN viral extrait de ces cultures cellulaires et préalablement séquencé, l’équipe a ensuite cherché à déterminer le génome de toutes les quasi-espèces inoculées via divers outils d’assemblage dont SAVAGE.

Résultat : seul ce dernier s’est montré capable d’établir à la fois la diversité génomique de la population de VIH et la part respective des cinq variants dans le milieu cellulaire. « L’ensemble de ces tests témoigne de la capacité de notre logiciel à gérer effectivement la complexité virale en l’absence de génome de référence, ce qui est très souvent le cas lors d’une épidémie émergente », souligne Éric Rivals. Faute de disposer d’informations génétiques fiables sur la nature de l’ennemi à combattre, des infections virales –comme l’épidémie d’Ebola de 2014 ou celle de Zika, survenue au Brésil en 2015 – s’étendent rapidement sans que l’on puisse les circonscrire. Mais en associant ce nouvel outil d’assemblage prometteur à une approche de séquençage à haut débit des génomes viraux, la perspective de mettre au point des thérapies ciblant les principales sous-espèces virales à l’origine de tels épisodes infectieux semble aujourd’hui à portée de main.

Notes:

  1. Unité CNRS/Université de Montpellier.
  2. L’Institut de biologie computationnelle (IBC) de Montpellier développe des méthodes et des logiciels innovants pour analyser, intégrer et contextualiser des données biologiques à grande échelle dans les domaines de la santé, de l’agronomie et de l’environnement.
  3. « De novo assembly of viral quasispecies using overlap graphs », Jasmijn A. Baaijens, Amal Zine El Aabidine, Eric Rivals, Alexander Schoenhuth, Genome Research, avril 2017, vol. 27 : 1-14.

Photo 1: Constellation de virus (vue d’artiste). © MASTERFILE
Photo 2:Reconstruction de la structure d’un virus entier en combinant radiocristallographie et cryo-microscopie électronique. Il s’agit du rotavirus, responsable de gastro-entérites chez les jeunes enfants et les bébés. © Félix REY/Jean COHEN/PRASAD BVV/CNRS Photothèque