Bionieuws

Gen & Micro

Virusbron afleidbaar uit rna-analyses

In een veldlab in een de jungle in Noord-Congo bereiden onderzoekers zich voor op het nemen van urine- en bloedmonsters van vleermuizen om levend Ebola-virus in handen te krijgen. Het nu gepubliceerde Schots onderzoek kan helpen zulk veldwerk gerichter in te zetten. Foto: Kai Kupferschmidt / Science. Zie: http://www.sciencemag.org/news/2017/06/hunting-ebola-among-bats-congo

Gastheren en overbrengers van mogelijk schadelijke opkomende virussen zijn sneller te voorspellen door automatische leersystemen los te laten op rna-sequentiegegevens.

De oorsprong van mysterieuze virusuitbraken zijn vlugger te achterhalen door een model te gebruiken dat sequentiegegevens van virus-rna met behulp van machinaal leren analyseert. Dit kan helpen eerder natuurlijke virusreservoirs en het vectortype dat het virus overdraagt op te sporen. Dit claimen onderzoekers van de universiteit van Glasgow in een publicatie in Science van 2 november. ‘Modellen zoals deze, die profiteren van de opkomst van goedkope genoomsequencing, kunnen het tijdsverschil tussen virusontdekking en gericht onderzoek, surveillance en beheersing verkleinen’, stellen de onderzoekers.

Volgens de in opkomende infectieziekten gespecialiseerde viroloog Marion Koopmans van het Erasmus Medisch Centrum in Rotterdam is de voorgestelde methodologische aanpak zeker interessant. ‘Het is echter nu nog niet robuust genoeg voor praktische toepassing. Daarvoor levert het nog te veel fout-positieve en fout-negatieve resultaten op. Maar het biedt wel een interessant perspectief om het aantal kandidaten voor virusreservoirs en -vectoren in te perken.’

Verwantschap
De Schotse onderzoeksgroep verzamelde een dataset met genoomsequenties van 536 enkelstrengs rnavirussen. Deze set beslaat elf virusfamilies en een virusorde die representatief zijn voor rna-virussen die mensen infecteren. Voor ieder virus is uit de literatuur informatie opgenomen over het bekende, meestal dierlijke reservoir of gastheer en de identiteit van het vectortype: knut, mug, zandvlieg of teek. Met een op basis van fylogenetische verwantschap gebaseerd algoritme en de dataset blijken vervolgens de reservoir- en vectortypes die bij een virus behoren voorspelbaar te zijn met een betrouwbaarheid van respectievelijk 58 en 67 procent. De onderzoekers gebruikten automatisch leren om de voorspelkracht te verbeteren tot respectievelijk 72 en 91 procent. Hiervoor zetten ze ruim vierduizend kwantitatieve genoomgegevens van virussen – van onder meer codon- en aminozuureigenschappen – in bij het trainen, optimaliseren en valideren van de algoritmen.

Weesvirussen
De auteurs demonstreren vervolgens hun aanpak door voorspellingen uit te voeren voor zogenaamde weesvirussen, waarvan reservoir en vector nog onbekend of onzeker zijn. Zo kwamen zij als bron voor het in mensen gevonden darminfecterende coronavirus 4.408 uit op een evenhoevige. Dat lijkt te sporen met de veel veronderstelde virusoverdracht van runderen op mensen bij deze infectieziekte. Ook voor virussen waarvan de oorsprong nog een compleet mysterie is, genereert het model mogelijke kandidaten. ‘Het Bas-Congo-ebolavirus veroorzaakt bijvoorbeeld een uitbraak in de Democratische Republiek Congo die alleen bij mensen is ontdekt. Onze modellen voorspellen hiervoor een eenhoevige als reservoir en een grote kans op transmissie door geleedpotigen, met knutten als meest waarschijnlijke overbrengers van deze opkomende ziekte’, schrijven de onderzoekers.

‘Er moet een brug geslagen
worden tussen computer-
modellen en gerichte
validatiestudies’

‘De mogelijkheid voorspellingen te doen en op basis van genoominformatie het aantal kandidaten voor reservoir en vector in te perken, is inderdaad een veelbelovend aspect van deze studie’, meent Koopmans. ‘Het zwakke punt is nog wel dat ze hiervan in dit artikel nog geen enkele bevestiging presenteren. Dat is de logische en ook lastige eerstvolgende stap die nog gezet moet worden. Er moet een brug geslagen worden tussen zulke computermodellen en gerichte validatiestudies in het lab en in het veld. Terugkoppeling met velddata is ook essentieel om het systeem van automatisch leren dat deze studie inbrengt te perfectioneren. Maar zeker is dat er een wereld te winnen is door via genetische data patronen te vinden en die te gebruiken voor het scherpstellen van vervolgonderzoek in het veld.’

Dit artikel verscheen in Bionieuws 17 van 3 november 2018.