Entretien avec Jared Simpson, Ph. D.
Partout au Canada, les chercheurs s’efforcent sans relâche de suivre la propagation du virus et l’évolution de la COVID-19 au moyen du séquençage du virus et un logiciel mis au point par l’équipe de recherche de Jared Simpson, Ph. D., permet de contrôler la qualité des échantillons testés.
Le laboratoire de M. Simpson, situé à l’Institut ontarien de recherche sur le cancer et à la University of Toronto, met au point de nouveaux moyens d’analyser les données du séquençage génomique. Le logiciel ouvert ncov-tools du laboratoire a contribué aux efforts canadiens de séquençage des virus en détectant les problèmes de qualité dans les échantillons viraux et en s’assurant du bon fonctionnement des échantillons témoins.
Nous avons demandé à M. Simpson de nous parler de l’importance des outils que son laboratoire met au point pour le séquençage effectué partout au pays, et de son travail en tant que membre du Réseau canadien de génomique COVID-19 (RCanGéCO). M. Simpson fait partie du Comité de mise en œuvre de l’initiative VirusSeq du RCanGéCO et il dirige l’équipe d’assurance et de contrôle de la qualité de l’initiative pour le RCanGéCO.
« Plus d’une douzaine d’endroits au pays séquencent des génomes, et chaque mois, de nouveaux voient le jour en ligne. Nous avons uniformisé les méthodes utilisées pour séquencer et analyser les génomes, ce qui nous permet de produire uniformément les données de haute qualité dont nous avons besoin pour observer les variations du virus au Canada ». — Jared Simpson, Ph. D.
En quoi votre logiciel joue-t-il un rôle central dans les efforts canadiens de séquençage du SRAS-CoV-2?
C’est une question de normalisation et de contrôle de qualité. Le RCanGéCO étant un réseau national, nous souhaitions être en mesure de comparer les résultats de séquençage d’un océan à l’autre. Pour y parvenir, nous avions besoin de données fiables de haute qualité : un génome séquencé en Colombie-Britannique allait-il être de qualité équivalente à un génome séquencé au Québec ou en Nouvelle-Écosse?
Très rapidement, nous avons décidé de normaliser le séquençage et les méthodes d’analyse utilisés pour générer un génome, et nous avons adopté le même logiciel et les mêmes pipelines pour l’analyse des données. Le groupe de travail de contrôle de la qualité de l’initiative VirusSeq a réuni tous les intervenants pour déterminer les normes de qualité qui seraient retenues pour le projet.
Qu’entendez-vous par qualité?
L’échantillon clinique constitue le point de départ du séquençage du génome, et il peut contenir beaucoup ou très peu de virus. Lorsqu’il n’y a qu’une petite quantité de virus dans l’échantillon, le séquençage est beaucoup plus difficile. Nous devions donc trouver des façons d’identifier ces échantillons difficiles à analyser, qui ne seraient peut-être pas utiles dans les analyses ultérieures, pour suivre les lignées, par exemple. La portion de génome viral que nous pouvons reconstuire après le séquençage, généralement exprimée sous forme de pourcentage, constitue l’un de nos principaux critères de contrôle de la qualité. Si l’échantillon clinique contient très peu de virus, nous ne pourrons peut-être pas reconstruire plus de 50 % du génome. Selon nos critères, un génome doit être reconstruit au minimum à 90 % pour être de haute qualité. Nous nous penchons également sur des aspects tels que le nombre de mutations, le type de mutations et certaines caractéristiques qui peuvent nous indiquer que les échantillons ont été mélangés.
Dans un pays comme le Canada, où la gestion des services de soins de santé diffère d’une province à l’autre, pourquoi croyez-vous que votre logiciel fait l’unanimité?
Notre équipe du RCanGéCO est très collaborative. Tout le monde a reconnu le besoin de normaliser les données. Le fait de pouvoir normaliser très rapidement les pipelines d’analyse et l’ensemble du contrôle de la qualité permet d’éviter beaucoup de problèmes plus tard lorsque vient le temps d’intégrer les données pour brosser un portrait de la situation à l’échelle nationale.
La collaboration et le recours à des expertises variées ont été des éléments clés dans la mise au point de ces outils. Mon collègue bio-informaticien Richard de Borja, par exemple, travaille de près avec moi dans ce projet. Richard est le développeur principal du ncov-tools et il s’occupe de la mise à jour du progiciel pour toutes les vérifications de la qualité. Il exécute également le ncov-tools pour l’ensemble des génomes séquencés à notre institut, l’IORC. Le ncov-tools est accessible sur GitHub, de sorte que n’importe qui peut analyser ses résultats de séquençage dans le pipeline et obtenir un rapport de qualité pour ses génomes.
Vous dirigez l’équipe d’assurance et de contrôle de la qualité de l’initiative VirusSeq. Quelles sont les autres tâches de l’équipe et en quoi sont-elles importantes pour lutter contre la pandémie au Canada?
La création d’une norme qui définit ce qu’est un génome de haute qualité a été une étape cruciale. Mais les membres du groupe remplissent également la fonction essentielle de cibler les éléments à améliorer dans les pipelines qui transforment des données brutes de séquençage en génome complet. L’équipe agit à titre de groupe de discussion pour trouver la source de problèmes liés au séquençage relevés par d’autres groupes. Ces derniers peuvent en discuter avec d’autres experts de partout au pays par l’entremise du groupe de travail d’assurance et de contrôle de la qualité. Ces échanges ont mené à l’amélioration des pipelines d’analyse, à la création de nouveaux types de critères pour le contrôle de la qualité et au perfectionnement des protocoles de séquençage.
Comment vos collaborations à l’international ont-elles influencé votre travail concernant la COVID-19?
Je travaille avec Nick Loman et Josh Quick de la University of Birmingham au Royaume-Uni depuis de nombreuses années. En 2015, ils ont conçu un système portatif de séquençage génomique pour assurer la surveillance du virus Ebola directement sur le terrain, en Afrique occidentale. Je les ai aidés en mettant au point un logiciel d’analyse nommé nanopolish pour interpréter les données de séquençage des génomes. Leur projet a mené à la création de l’initiative ARTIC Network, à qui l’on doit l’un des principaux protocoles utilisés pour séquencer les coronavirus.
Cette collaboration de longue date avec Nick et Josh, et maintenant avec John Tyson, en Colombie-Britannique, et Matt Loose, de la University of Nottingham, m’a amené à participer aux efforts de séquençage en Ontario, puis auprès du RCanGéCO.
Le Réseau canadien de génomique COVID-19 (RCanGéCO) a pour mission de relever le défi de la COVID-19 en produisant les données accessibles et utilisables des génomes viraux et humains pour orienter les décisions stratégiques et les décisions en santé publique, et mettre au point des traitements et des vaccins. Ce consortium pancanadien est dirigé par Génome Canada, en partenariat avec les six centres de génomique régionaux, le Laboratoire national de microbiologie et les laboratoires provinciaux de santé publique, les centres de séquençage du génome (par le truchement de CGEn), les hôpitaux, les universités et l’industrie dans l’ensemble du pays.
Crédit pour les photos :
- Photo de J.P. Moczulski — CP Images
- Avec l’autorisation de S Lawler — IORC