Un outil pour démêler la jungle des virus

679-08911769_72dpi

CNRS LE JOURNAL, JUIN 2017

Un nouvel outil de bio-informatique, mis au point par une équipe franco-néerlandaise, est capable d’établir la carte génomique des principaux variants d’une même population de virus. Une prouesse technique qui pourrait permettre d’identifier très vite les caractéristiques des souches virales impliquées dans certaines épidémies et juguler ainsi leur progression.

Les virus à ARN se révèlent parfois de redoutables agents infectieux, comme en atteste la vaste épidémie d’Ebola qui frappa l’Afrique de l’Ouest entre décembre 2013 et mars 2016. Durant cette période, le virus a provoqué plus de 11 000 décès parmi les 28 000 personnes infectées. Bien que les raisons d’une telle hécatombe demeurent complexes, l’impossibilité d’établir le portrait-robot de la souche virale à l’origine de l’épidémie explique en partie son ampleur exceptionnelle : « Lorsqu’un virus comme Ebola, le VIH ou Zika infecte l’homme, son ARN subit une succession de mutations dans le but d’échapper à la réponse immunitaire de son hôte. Ces mutations donnent naissance à une multitude de variants génomiques très proches les uns des autres, qualifiés de quasi-espèces » , rappelle Éric Rivals, chercheur en bio-informatique au Laboratoire d’informatique, de robotique et de microélectronique de Montpellier¹ (LIRMM) et directeur de l’Institut de biologie computationnelle² (IBC).

Or cette stratégie d’adaptation complique grandement la tâche des scientifiques qui tentent de séquencer les génomes viraux. L’opération de séquençage génère en effet des millions de fragments d’une centaine de nucléotides que de savants calculs informatiques permettent ensuite d’assembler afin de reconstituer le génome dans sa totalité. « Ces outils de bio-informatique sont très efficaces lorsqu’il s’agit de reconstruire un génome unique de plante ou d’animal, constate Éric Rivals. Mais face à un virus présentant une multitude de variants génomiques, ces outils s’avèrent inopérant car ils ont tendance à regrouper entre eux des fragments d’ARN provenant de quasi-espèces différentes. »

Un assemblage méticuleux

Pour parvenir à discriminer ces quasi-espèces virales, des chercheurs du LIRMM et du Centrum voor Wiskunde en Informatica (CWI) d’Amsterdam ont développé un outil dédié à l’assemblage de leurs génomes respectifs³. Celui-ci combine une méthode d’indexation capable d’identifier les chevauchements fiables entre fragments de nucléotides viraux et un algorithme de reconstruction progressive et simultanée des génomes de quasi-espèces. Baptisé SAVAGE par l’équipe franco-néerlandaise, le logiciel est censé entrer en action à l’issue de la  phase de séquençage consistant à casser le génome en plusieurs morceaux d’ARN. Sa principale mission : s’assurer que l’étape suivante, destinée à mettre bout à bout les fragments d’une même quasi-espèce virale pour en reconstituer le génome, se déroule sans la moindre erreur.

« En appliquant des chevauchements entre ces séquences trois fois plus importants que ceux pratiqués par une méthode d’assemblage classique, SAVAGE doit permettre de distinguer des sous-espèces de virus très proches sur le plan génétique tout en estimant de manière précise leur proportion respective au sein d’une même population virale », détaille le chercheur. Restait toutefois à mesurer l’efficacité de cette nouvelle stratégie d’assemblage sur de véritables génomes viraux.

Reconstruction de la structure d'un virus entier en combinant radiocristallographie et cryo-microsco

 

Circonscrire les épidémies

Dans un premier temps, les scientifiques ont modélisé la structure génomique de populations virales (hépatite C,  VIH, Zika, Ebola), comprenant une dizaine de quasi-espèces chacune. Après avoir simulé le découpage de ces différents variants génomiques, ils ont tenté de reconstruire leur génome à l’aide du logiciel SAVAGE. 90 % du génome de toutes les quasi-espèces modélisées a ainsi pu être reconstitué et ce pour toutes les espèces de virus testées.

Afin de confirmer les excellentes performances de leur outil d’assemblage, les chercheurs l’ont ensuite confronté à des données réelles. Ils ont pour cela utilisé un jeu de séquences génomiques existant, obtenu en inoculant cinq quasi-espèces de VIH à des cellules en culture, chacune d’elle étant en outre introduite dans des proportions différentes. À partir de l’ARN viral extrait de ces cultures cellulaires et préalablement séquencé, l’équipe a ensuite cherché à déterminer le génome de toutes les quasi-espèces inoculées via divers outils d’assemblage dont SAVAGE.

Résultat : seul ce dernier s’est montré capable d’établir à la fois la diversité génomique de la population de VIH et la part respective des cinq variants dans le milieu cellulaire. « L’ensemble de ces tests témoigne de la capacité de notre logiciel à gérer effectivement la complexité virale en l’absence de génome de référence, ce qui est très souvent le cas lors d’une épidémie émergente », souligne Éric Rivals. Faute de disposer d’informations génétiques fiables sur la nature de l’ennemi à combattre, des infections virales –comme l’épidémie d’Ebola de 2014 ou celle de Zika, survenue au Brésil en 2015 – s’étendent rapidement sans que l’on puisse les circonscrire. Mais en associant ce nouvel outil d’assemblage prometteur à une approche de séquençage à haut débit des génomes viraux, la perspective de mettre au point des thérapies ciblant les principales sous-espèces virales à l’origine de tels épisodes infectieux semble aujourd’hui à portée de main.

Notes:

  1. Unité CNRS/Université de Montpellier.
  2. L’Institut de biologie computationnelle (IBC) de Montpellier développe des méthodes et des logiciels innovants pour analyser, intégrer et contextualiser des données biologiques à grande échelle dans les domaines de la santé, de l’agronomie et de l’environnement.
  3. « De novo assembly of viral quasispecies using overlap graphs », Jasmijn A. Baaijens, Amal Zine El Aabidine, Eric Rivals, Alexander Schoenhuth, Genome Research, avril 2017, vol. 27 : 1-14.

Photo 1: Constellation de virus (vue d’artiste). © MASTERFILE
Photo 2:Reconstruction de la structure d’un virus entier en combinant radiocristallographie et cryo-microscopie électronique. Il s’agit du rotavirus, responsable de gastro-entérites chez les jeunes enfants et les bébés. © Félix REY/Jean COHEN/PRASAD BVV/CNRS Photothèque

 

 

2017, Une année avec le CNRS

Couv_Rapport CNRS2017

RAPPORT SCIENTIFIQUE DU CNRS, JUILLET 2018

Le développement de nouvelles technologies, associé aux approches pluridisciplinaires, a permis des avancés spectaculaires des connaissances du vivant. De l’exploitation du monde microbien et la découverte de nouvelles formes de vie à la compréhension du fonctionnement du cerveau, le vivant connaît une véritable révolution. Lire la suite »

Le vin à la conquête du monde

France, Vaucluse (84), Rasteau, vin de la vallée du Rhône, vendange

CNRS LE JOURNAL, JUILLET 2018

En quelques décennies, le vin est devenu un produit phare de l’économie mondialisée. À l’occasion de l’EuroScience Open Forum (Esof), qui se tient à Toulouse tout au long de la semaine, des chercheurs du groupe « In Vino Varietas » vont se pencher sur les évolutions récentes de la filière vitivinicole, de la production à la commercialisation du vin jusqu’à la manière de le consommer. Lire la suite »

L’épigénétique mène le génome à la baguette

cosmos_9022969_001_72dpi

CNRS LE JOURNAL, JUIN 2018

Identifiées chez la mouche drosophile il y a plus de 70 ans, les protéines Polycomb et Trithorax apparaissent depuis peu comme des régulateurs essentiels de l’expression de nos gènes. Retour sur les travaux récents mettant en lumière le rôle de ces complexes protéiques et les perspectives médicales que soulèvent ces découvertes. Lire la suite »