Scienza al lavoro: software e sequenziamento genetico seguono il coronavirus

La traduzione in italiano per il Blog delle Stelle dell’articolo pubblicato su IEEE Spectrum:


Mentre il nuovo micidiale coronavirus si diffonde per il pianeta, gli scienziati stanno utilizzando il sequenziamento genetico e uno strumento software open source per tracciare la sua trasmissione.

Lo strumento software, chiamato Nextstrain, non è in grado di prevedere la successiva direzione del virus. Ma ci può dire da dove provengono nuovi casi di virus.

Queste sono informazioni cruciali per i funzionari sanitari di tutto il mondo, che stanno cercando di determinare se nuovi casi arriveranno nei loro Paesi attraverso viaggi internazionali o se vengono trasmessi localmente.
Questo tipo di analisi, chiamata epidemiologia genomica, “è estremamente preziosa per la salute pubblica”, dice James Hadfield, uno scienziato computazionale che lavora su Nextstrain. “Prima invertiamo questi dati, migliore è la risposta”.

Il nuovo coronavirus, che causa la malattia respiratoria Covid-19, è emerso per la prima volta a dicembre in Cina, dove ha infettato oltre 80.000 persone. Da allora si è diffuso in oltre 85 nazioni (PDF), e finora con le maggiori concentrazioni di casi in Corea del Sud, Iran e Italia. Più di 250 casi sono stati confermati negli Stati Uniti al momento della stampa.
Quando compaiono nuovi casi, è importante determinare l’origine del virus  se la persona infetta ha contratto il virus localmente o in un’altra regione. Questo può fornire informazioni per decidere su restrizioni di viaggio, chiusura delle scuole, quarantene e dove focalizzare le risorse per contenere l’epidemia.

COME IL SEQUENZIAMENTO GENETICO MAPPA IL CORONAVIRUS.

L’analisi genomica può fornire indizi sull’origine di un virus. Durante un’epidemia, il codice genetico di un virus subirà mutazioni costantemente mentre si diffonde attraverso una popolazione. Le mutazioni sono lievi (spesso nel codice cambia solo una lettera, come da AATC a ATTC). Le mutazioni forniscono una specie di marcatura temporale e geografica. Finora non ci sono prove che le mutazioni influenzino la biologia del virus.

Mettendo a confronto i codici genetici dei campioni virali prelevati a livello globale, è possibile costruire una mappa delle mutazioni mentre si muove intorno al mondo. Questo è ciò che fa Nextstrain. “Facciamo affidamento sulla presenza di queste mutazioni genetiche che si verificano naturalmente per visualizzare la diffusione del virus” ha detto Hadfield.

Nextstrain  traccia il virus come un albero genealogico, o una linea temporale evolutiva. Per il coronavirus, quell’albero genealogico ha origine nella città cinese di Wuhan e si dirama da lì. Quando compaiono nuovi casi, il codice genetico di quei campioni virali può essere confrontato con quelli nel database per determinare la sua regione di origine.
Per esempio, negli Stati Uniti, i ricercatori hanno letto, o messo in sequenza, i genomi del coronavirus da 8 casi in California. Di questi, almeno 6 erano geneticamente distinti l’uno dall’altro, suggerendo che erano arrivati negli Stati Uniti attraverso viaggi internazionali, dice Hadfield.

“Quello che possiamo dire dai dati genomici  è che ci sono stati, così almeno sembra, 6 introduzioni indipendenti del virus in California” dice Hadfield. “Ciò non significa che in California non avvenga la trasmissione locale in uscita, ma che i dati genomici non lo hanno ancora confermato”.

CORONAVIRUS SEMINATO NELLA ZONA DI SEATTLE.

Al contrario, la regione di Seattle è diventata un luogo di trasmissione della comunità, secondo l’analisi di Nextstrain. Il software ha confrontato due casi, uno trovato a metà gennaio e l’altro a fine febbraio, entrambi a Snohomish, vicino Seattle. I due virus erano geneticamente simili, suggerendo una trasmissione locale.

Trevor Bedford, un investigatore del Fred Hutchinson Research Center, il quale ha contribuito allo sviluppo di Nextstrain, dice che nelle sei settimane fra il primo e il secondo caso, la trasmissione non rilevata stava probabilmente prosperando. Egli riteneva che nella zona di Seattle circa 600 persone erano probabilmente infettate, forse addirittura 1500. (Molti casi del nuovo coronavirus erano leggeri e le persone infettate potevano non necessitare di cure mediche).

Lo sforzo di Nextstrain si basa, ovviamente, sul fatto che gli scienziati siano disposti ad ottenere e mettere in sequenza campioni virali e caricarli su siti Web accessibili liberamente. Finora i ricercatori sembrano tutti disponibili. La maggior parte sta caricando i dati del sequenziamento sulla piattaforma GISAID, disponibile pubblicamente, dice Hadfield. “E’ qui che il team Nextstrain accede ai suoi dati” dice.

Gli scienziati nelle aree a risorse limitate potrebbero non disporre degli strumenti di laboratorio o della formazione necessari per eseguire questo tipo di analisi. Così, un gruppo, chiamato ARTIC Network, ha fornito protocolli e formazione per permettere agli scienziati di tutto il mondo di eseguire il monitoraggio e il sequenziamento delle malattie. Stanno anche sviluppando “un-laboratorio-in-valigia” che può essere distribuito in località remote e con risorse limitate.

Un successo è arrivato dal Brasile la scorsa settimana. In meno di 48 ore, i ricercatori hanno raccolto un campione da un individuo di San Paolo con Coronavirus, hanno messo in sequenza il genoma del virus usando i protocolli ARTIC, e hanno condiviso i dati in GISAID. Gli scienziati hanno usato una sequenze portatile del genoma chiamato MiuJON.