Vi kan nå se et virus mutere som aldri før

Å spore koronavirusets utvikling, bokstav for bokstav, revolusjonerer pandemisk vitenskap.

En illustrasjon av et øyeeplet som ser på genetisk sekvensering.

Getty / Paul Spella / The Atlantic

I begynnelsen var det en.



De første genom for viruset som forårsaket en mystisk sykdom vi ennå ikke hadde navngitt COVID-19 var delt av forskere 10. januar 2020. Det eneste genomet varslet verden om faren for et nytt koronavirus. Det var grunnlaget for nye tester da landene kjempet for å finne viruset innenfor sine egne grenser. Og det ble malen for vaksiner, de samme som nå kommer til millioner av mennesker hver dag. Det første koronavirusgenomet kan ha vært de viktigste 30 000 brevene som ble publisert i hele 2020.

Siden den gang har antallet sekvenserte genomer ganske enkelt eksplodert, til 700 000. I løpet av et drøyt år har viruset som forårsaker COVID-19 blitt det mest sekvenserte viruset gjennom tidene – og har svevet forbi mangeårige utfordrere som HIV og influensa. Tusenvis av koronavirusgenomer sekvenseres rundt om i verden hver dag; flere ble generert i løpet av det minuttet det tok for deg å lese disse tre avsnittene. Det har vært en revolusjon, sier Judith Breuer, en virolog ved University College London.

Vi lever nå gjennom den første pandemien i menneskets historie der forskere kan sekvensere raskt og rasende nok til å spore et nytt viruss utvikling i sanntid – og til å handle besluttsomt på denne informasjonen. Virus får stadig mutasjoner – genetiske skrivefeil – og av og til muterer de til en variant av interesse. Det var sekvensering som identifiserte en distinkt og mer overførbar variant i Storbritannia. Det var sekvensering som førte til strengere nedstengninger som svar. Og det er nå sekvensering som sporer spredningen av varianter, inkludert de som først ble funnet i Sør-Afrika og Brasil, som har mutasjoner sløvende immunitet fra vaksiner og tidligere infeksjoner.

Uten sekvensering kunne vi ha sett mystiske nye bølger eller reinfeksjoner, bare for å spekulere vilt og retrospektivt om hvorfor; nå kan forskere spore disse epidemiologiske trendene til bokstav-for-bokstav endringer i koronavirusets genetiske kode – og gjøre det raskt nok til å påvirke politikken, og potensielt bremse variantene før de tar over. Denne systematiske sekvenseringen av positive COVID-19-tester kalles genomisk overvåking.

Fremveksten av genomisk overvåking har overrasket til og med forskere. Hvis de hadde visst at varianter ville bli forsidenyheter, hadde de kanskje kommet med bedre navn enn B.1.1.7, 20I/501Y.V1 og VOC 202012/01, som til forveksling er alle navn for samme U.K.-variant . (Ikke rart at publikum har fortsatt å bare kalle det den britiske varianten, til tross offisielle formaninger for å unngå geografiske navn.) WHO diskuterer akkurat nå en ny variant-navneordning . En slik ordning eksisterer ikke, fordi vi aldri hadde behøvd å snakke om varianter offentlig før – fordi vi aldri hadde identifisert varianter raskt nok til å ha betydning for pandemirespons før.

De uutgrunnelige variantnavnene er et lite, om enn illustrerende, eksempel på utfordringene som følger med å rive genomisk overvåking ut av akademiske laboratorier og kaste den inn i folkehelsen. Sekvensering er enkelt i disse dager, fortalte forskere meg om og om igjen. Analyse er vanskelig. Og, med noen få bemerkelsesverdige unntak, er det vanskeligere å overtale publikum til å gjøre reelle ofre basert på noen skiftende bokstaver i et viralt genom. Pandemien har vist kraften til genomisk overvåking, men også avdekket utfordringene ved å håndtere den. I fremtiden, når vi har lært leksjonene av COVID-19, kan genomisk overvåking av sykdommer bli rutinemessig og byråkratisk. Det kan være pandemiens største vitenskapelige arv.

Men denne gangen, i denne pandemien, har suksessen med genomisk overvåking vært avhengig av menneskelig intuisjon og menneskelig framsyn og en og annen heldig pause.


Historien om de koblede funnene av variantene i Storbritannia og Sør-Afrika er et slikt eksempel. Sist vinter begynte Tulio de Oliveira, en bioinformatiker ved University of KwaZulu-Natal i Sør-Afrika, å se på en gruppe mystiske tilfeller av lungebetennelse i Kina. Og da det første virale genomet kom på internett i januar, begynte han å forberede laboratoriet sitt for å sekvensere koronaviruset i Sør-Afrika.

De Oliveira var en av en liten gruppe forskere over hele verden som allerede hadde betydelig erfaring med denne typen ting. Han hadde tidligere sekvensert genomene til virus, som Zika, dengue, chikungunya og gul feber, som sirkulerer i Sør-Amerika. (De Oliveira kommer opprinnelig fra Brasil.) Andre har gjort lignende arbeid med influensa, ebola, West Nile og Lassa feber. Men for det meste hadde disse studiene en tendens til å være små og retrospektive – og de gikk i rolig tempo i akademia. Da resultatene ble publisert, var utbruddet vanligvis for lengst over.

Dette nye koronaviruset var en nødsituasjon, og de Oliveira ønsket å komme i forkant av det. I løpet av uker hadde teamet hans ferdig med å skrive programvaren for å sette sammen genomer av det nye viruset, fløyet inn samarbeidspartnere fra Brasil, og fylt opp laboratoriekjemikalier i påvente av nedleggelsen av flyreiser. De Oliveira så for seg en systemisk sekvensering av COVID-19-prøver over hele Sør-Afrika. For å komme dit, måtte han sikre seg juridisk og etisk tillatelse til å samle positive COVID-19-prøver fra myndighetenes testlaboratorier. Disse prøvene måtte deretter reprosesseres for sekvensering. Typiske COVID-19-tester hurtigleser bare noen få utdrag av koronavirusets genom; sekvensering betyr å lese alle 30 000 bokstavene.

I mars i fjor, da COVID-19 begynte å dukke opp i Sør-Afrika, var teamet til de Oliveira klare til å gå. Et nøkkelspørsmål for genomisk overvåking i de første dagene var ganske enkelt hvordan COVID-19 hadde kommet inn i landet. Så vitenskapsmenn brukte genomer for å rekonstruere virusets vei: Koronaviruset hadde blitt introdusert flere ganger, for det meste fra Europa. I løpet av 2020 vokste og avtok pandemien, og de Oliveira og kollegene hans fortsatte å samle sekvenser.

I november dukket et helt nytt mønster opp. Leger i Sør-Afrikas Eastern Cape fortalte de Oliveira at tilfellene økte igjen, tilsynelatende fra ingensteds. Hadde viruset endret seg? Kan det ha mutert? Teamet hans flyttet raskt til sekvensprøver fra 50 klinikker i regionen i løpet av en uke, og de fant en overraskende mangel på mangfold. Prøvene fra alle de 50 klinikkene var nært beslektet, med nesten alle de samme mutasjonene. De så ut som én variant. Fordi han hadde data fra de siste syv månedene, visste de Oliveira at dette var merkelig; normalt, hvis han prøver 50 klinikker, kan han finne 30 eller 40 forskjellige versjoner av et virus. Og fordi han hadde data fra hele landet, kunne han se at denne varianten nå kom snikende inn i andre regioner. Alle de månedene med sekvensering hadde gitt resultater, men nyhetene var dårlige. Viruset hadde virkelig endret seg. Og den nye varianten tok over.

I begynnelsen av desember, de Oliveira delte noen foreløpige resultater med en gammel kollega, Andrew Rambaut, som spesialiserer seg på utviklingen av nye virus. De to hadde overlappet hverandre i Oxford for rundt 15 år siden; Rambaut er nå ved University of Edinburgh, i U.K. De Oliveira flagget en bestemt mutasjon, kalt N501Y, som sitter i en nøkkelregion av piggproteinet som binder seg direkte til menneskelige celler.

På de Oliveiras tips , begynte Rambaut å undersøke koronavirussekvenser i Storbritannia, som har det største og best finansierte genomiske overvåkingsprogrammet i hele verden. (De Oliveira hadde faktisk modellert Sør-Afrikas overvåkingsprogram på det. Men, selvfølgelig, vi har mye mindre ressurser, sa han, så Sør-Afrika sekvenserte bare en brøkdel av så mange prøver som Storbritannia var.) Seks tusen miles unna, N501Y dukket også opp i den britiske databasen - i sekvenser fra Kent, hvor saker økte til tross for en pågående nedstengning.

I løpet av uker vil U.K. annonsert oppdagelsen av sin egen mer overførbare variant, som hadde oppstått uavhengig av Sør-Afrika-varianten. Nyhetene ga gjenklang over hele verden. Mange land, inkludert USA, flyttet for å begrense reiser til Storbritannia og se etter varianten innenfor sine egne grenser.


Storbritannia har det største COVID-19-sekvenseringsprogrammet i verden, ikke en liten del fordi det allerede hadde mange av de beste ekspertene på dette feltet. Vi jobber alle med britene fordi de er så jævla flinke, sier Kristian Andersen, mikrobiolog ved Scripps Research i San Diego. Storbritannia har på egenhånd generert mer enn en tredjedel av alle genomer for dette koronaviruset, takket være et konsortium av akademiske og offentlige laboratorier kalt COVID-19 Genomics UK , eller COG-UK.

Ideen til COG-UK kom til Sharon Peacock, en mikrobiolog ved University of Cambridge, da den første bølgen begynte å ramme Europa. 4. mars sendte hun en e-post til fem kolleger for å snakke. Jeg ville egentlig ha en fornuftssjekk, fortalte hun meg. Det var ennå ikke klart at viruset ville eksplodere til en ukontrollert pandemi. Italia hadde ennå ikke låst seg. Livet gikk fortsatt som normalt. Var en enestående nasjonal overvåkingsinnsats virkelig verdt det? Forskere trodde ikke at koronaviruset muterte veldig fort. Sekvensering kan ikke finne noe mer enn en haug med meningsløse mutasjoner.

Men Peacocks kolleger var enige om at nasjonal genomisk overvåking var verdt å prøve. Sekvensering, som gir mye mer informasjon enn en enkel positiv-eller-negativ test, kan i det minste gi dem en detaljert titt på hvordan viruset sprer seg.

Konsortiet ønsket ikke nødvendigvis å se etter varianter. Varianter var en teoretisk mulighet, men ingen visste når og hvor de kunne oppstå. Så til å begynne med var forskere mer interessert i hvordan koronaviruset kom til landet - hovedsakelig gjennom andre europeiske land som Italia, Spania og Frankrike, snarere enn direkte fra Kina, viser det seg. Og de var interessert i hvordan viruset spredte seg, på store og små måter. En studie fant en COVID-19-klynge blant seks dialysepasienter som alle hadde avtaler på samme ukedager. Virusene deres var veldig like, men atskilte fra en avstamning som sirkulerte andre steder på sykehuset, noe som antydet at alle disse dialysepasientene ble smittet på samme måte - enten under dialyse eller under delt transport til sykehuset. Av avgjørende betydning, ved å utelukke overføring fra andre steder på sykehuset, kunne tjenestemenn målrette mot det underliggende problemet i stedet for å utstede tyngende generelle retningslinjer. Sykehuset stengte dialyseventerommet, spredte pasientene mer og påtvunget universell maskering under transport.

Men etter hvert som sakstallene skjøt i været, ble spørsmålet om hvordan viruset kom inn i landet litt uklart. Viruset var allerede overalt. Og flere saker betydde flere sekvenser - så mange sekvenser. Vi har aldri brukt sekvensering på denne skalaen, fortalte Peacock.

Ingen mennesker kan muligens gå gjennom de tusenvis av coronavirus-genomene som genereres daglig for å se etter hint av plagsomme mutasjoner. Tilogmed beregningsverktøy for å sammenligne genomer knekker seg under vekten av alle tilgjengelige data. Forskere kartlegger ofte relaterte genomer som grener i et evolusjonstre. Men på et visst tidspunkt blir disse trærne uhåndterlige. Analyseverktøyene våre er ikke bygget for å gjøre dette, sier Emma Hodcroft, en molekylær epidemiolog ved Universitetet i Bern og en medutvikler av Nextstrain , et åpen kildekode-prosjekt som visualiserer patogensekvenser. Tipset som bidro til oppdagelsen av den britiske varianten kom tross alt fra de Oliveira, som sekvenserte et mindre, mer håndterbart antall prøver i Sør-Afrika, etter forslag fra leger i frontlinjen.

En tett kobling mellom leger, offentlige helsetjenestemenn og sekvenseringslaboratorier er avgjørende for suksessen til genomisk overvåking. Leger og folkehelsetjenestemenn kan legge merke til trender på bakken som tipser genomister, som igjen kan oppdage mutasjoner som gir grunnlag for ny politikk. Men disse verdenene er ikke nødvendigvis vant til å snakke med hverandre. Og trærne som eksperter på genomisk overvåking foretrekker for å visualisere relaterte genomer er vanskelige å tolke, fordi ufullstendig prøvetaking betyr at hele grener mangler.

Faktisk har selv eksperter hatt problemer med å tolke dataene. I februar i fjor oppdaget forskere i staten Washington den første tilfelle av lokal overføring av COVID-19, som de antok, fra dens virale sekvens, stammet fra et tilfelle av en mann som hadde returnert fra Kina seks uker tidligere. Dette antydet at viruset stille hadde spredt seg i Washington i mer enn en måned. Det var en stor vekker. Men som ekstra sekvensering har fylt ut manglende grener, et mer komplett – og annerledes – bilde av de tidlige dagene har dukket opp . Mer sannsynlig enn ikke var det andre tilfellet ikke avstammet fra det første. En separat introduksjon av COVID-19 så sannsynligvis Washingtons lokale overføringskjede.

Dette er fortsatt en utfordring i mindre skalaer også, for eksempel når et sykehus prøver å finne opprinnelsen til utbruddet. Scenario A, der ansatte smitter hverandre på kaffepauser, krever andre intervensjoner enn Scenario B, der flere pasienter overfører viruset til ansatte på en bestemt avdeling. Breuer, virologen ved University College London, leder en COG-UK studie for å se om genomisk overvåking faktisk kan hjelpe sykehus med å identifisere og fikse feil i infeksjonskontroll.

Rå virale sekvenser eller trær er ganske ubrukelige for sykehus; teamet hennes har i stedet utviklet automatiserte rapporter som oversetter dataene til en sannsynlighet for at ett tilfelle er relatert til andre på samme sykehus. Det har tatt en stund før disse rapportene blir riktige, erkjenner Breuer, og de kan fortsatt bli bedre. I mellomtiden finner sykehusene selv ut hvordan de skal integrere denne nye datastrømmen i sine retningslinjer. Det er desto vanskeligere når de er opptatt med å bare prøve å holde tritt med pandemiens knuse. Når du blir overveldet av saker, blir det veldig vanskelig for team å se på data, sier hun. Rapportene blir mindre nyttige, fordi folk bare ikke har tid til å se på dem.

Dette er det praktiske problemet som genomisk overvåking gjentatte ganger har møtt under denne pandemien. Forskere kan generere så mye data de vil, men å få publikum til å handle på den informasjonen er en helt annen utfordring.


Da Storbritannia og Sør-Afrika slo alarm om nye varianter, reagerte land rundt om i verden på radikalt forskjellige måter.

På den ene enden av spekteret har Danmark tatt dem på alvor. Den prøver å sekvensere nesten alle positive prøver i landet, takket være et robust nasjonalt overvåkingsprogram som kobles til det nasjonale helsevesenet. Det er en veldig, veldig stor fordel. Vi har fire-fem store sykehus, og når du først har kontaktet dem, har du stort sett alt i Danmark, sier Mads Albertsen, mikrobiolog ved Aalborg Universitet som har rekonfigurert laboratoriet for COVID-19-sekvensering. Siden desember har Danmark fulgt med på andelen av U.K.-varianten, B.1.1.7, stadig økning i sekvenseringsdataene .

Som et resultat implementerte landet en streng lockdown, selv om det totale antallet COVID-19-tilfeller har falt siden desember. Butikker holdt stengt, det samme gjorde skoler for femteklassinger og eldre. Antall personer som fikk lov til å samles ble kuttet fra 10 til fem. Hadde vi ikke hatt tallene på B.1.1.7, ville vi ha åpnet samfunnet mye mer, sier Albertsen. kun Danmark begynte å lempe noen restriksjoner 1. mars som en del av en langsom, kalkulert gjenåpning. Landet har fortsatt en av de laveste infeksjonstallene i Europa. Jeg har vært veldig glad for at regjeringen bruker dataene jeg har generert på varianter, fortalte Albertsen. Men det er også litt skummelt at de legger så mye på skuldrene våre. Genomics har aldri tidligere vært ansvarlig for dataene som styrer åpning og lukking av hele land.

USA har tatt en mye mer mangelfull tilnærming til variantene. Da jeg spurte Andersen, mikrobiologen ved Scripps Research, om USA handler på informasjon om genomisk overvåking, svarte han rett ut: Nei, det gjør vi ikke. (Andersen, som er fra Danmark, gir også råd til den danske regjeringen.) Han påpekte at det samme problemet har dukket opp igjen og igjen i pandemien: USA synes ikke i stand til å planlegge for hva som vil skje hvis variantene blir dominerende; vi reagerer kun på det som skjer akkurat nå. Stater med økende andeler av B.1.1.7, som Florida, legger ikke nye restriksjoner slik Danmark har. Og forrige uke rullet Texas og Mississippi tilbake maskemandatene sine.

Som andre deler av pandemiresponsen, har sekvensering i USA vært ekstremt stykkevis. Andersen jobber med folkehelseavdelingen i San Diego, hvor de sekvenserer omtrent 2 prosent av alle bekreftede tilfeller – en liten brøkdel sammenlignet med Storbritannia eller Danmark, men anstendig sammenlignet med resten av USA God dekning i alle områder av USA er sannsynligvis på grunn av viljen til en bestemt vitenskapsmann eller laboratorium.

Ved University of Michigan fortalte Adam Lauring meg at han personlig kjører rundt og samler prøver fra testlaboratorier for å få dem til sekvenseringsmaskiner. Det er en del av et forsøk på å spore COVID-19 på campus, og universitetets oppdagelse av B.1.1.7 blant studentidrettsutøvere førte til en to ukers suspensjon av idrettsprogrammet. Ved Louisiana State University har Jeremy Kamil sekvensert rundt 2000 genomer etter å ha fått universitetets visekansler om bord og satt sammen ulike finansieringskilder. Datamengden oversettes ikke nødvendigvis til folkehelsepolitikk. For eksempel, sier Kamil, hvis han finner et sykehjem med flere separate introduksjoner av COVID-19, har han ingen måte å fortelle anlegget om å trappe opp sine infeksjonskontrolltiltak. Sekvensering har bare ikke vært en del av verktøysettet for folkehelse før. Offentlige helsemyndigheter visste ikke hva vi gjør, og hvordan det ville være nyttig, og hvordan dataene kunne bli behandlet, sier Vaughn Cooper, en mikrobiolog som driver en sekvenseringsanlegg i Pittsburgh som behandler Kamils ​​prøver. Det er ikke en kritikk. Dette er fortsatt ny teknologi.

Alaska er en stat hvor helseavdelingen har prioritert sekvensering, men det har vært vanskelig å få leger og sykehus til å sende inn prøver. Tilbydere vil vite hva som er i det for dem, sier Jayme Parker, statens laboratoriesjef. Og svaret er dessverre ikke mye. Parker kan ikke formelt fortelle legene om pasienten deres var infisert med en av variantene, fordi laboratoriet hennes mangler klinisk sertifisering. Og selv om hun kunne, kan ikke legene gjøre mye med informasjonen; det endrer ikke behandlingen for COVID-19. (Det eneste unntaket er at monoklonalt antistoffbehandling kan være mindre effektive mot Brasil- og Sør-Afrika-variantene, selv om de fortsatt er sjeldne i USA, og bruken av antistoffterapi er også lav.) Når avdelingen får prøver, kommer de på forskjellige typer vattpinner i forskjellige typer medier i forskjellige beholdere. Mye håndtering er nødvendig for å gjøre dem klare for batch-sekvensering. I begynnelsen husker jeg at jeg fikk urinkopper med saltvann i med en vattpinne, sier hun. Det ble veldig uregjerlig. I Danmark, derimot, fortalte Albertsen meg at testlaboratoriene konsoliderer alle de positive prøvene til ryddige plater med 96 små brønner, stort sett klare til bruk.

Genomisk overvåking, påpeker Parker, er nyttig på befolkningsnivå, men det krever å overtale folk til å delta på individnivå. Med USAs fragmentariske helse- og folkehelsesystemer betyr det å koble sammen utallige individuelle prikker: fysisk å få prøvene til riktig laboratorium, sortere ut alle juridiske og etiske papirer og deretter tolke resultatene for publikum. Jo lengre tid det tar å koble disse prikkene, jo mer tid tar det å få en prøve gjennom sekvenseringsrørledningen. Hvis tjenestemenn ikke ser dataene om B.1.1.7-prevalens før for eksempel en måned etter at en pasient først fanget varianten, begrenser det hvor raskt de kan skreddersy et svar. Hvis de imidlertid sekvenserer innen dager, kan de teoretisk prioritere å spore en B.1.1.7-pasients kontakter for å bremse varianten . Men jo tregere genomisk overvåking er, jo mindre nyttig er den for folkehelsen. På et tidspunkt blir det bare akademisk igjen.

Dessuten er sekvenseringsdata bare nyttige når de er koblet til epidemiologiske data. For å finne ut om varianter sprer seg eller forårsaker mer alvorlig sykdom, må du også vite når folk ble syke, hvor de er, hvor syke de ble, og hvordan disse mønstrene endres over tid. I de siste ukene i USA har forskere oppdaget flere varianter med muligens bekymringsfulle mutasjoner i California, New York og Louisiana, men de mangler konteksten for å vurdere om de er reelle trusler. Storbritannia og Sør-Afrika var i stand til å finne ut viktigheten av variantene deres så raskt på grunn av deres systematiske overvåkingssystem.

Nylig har CDC begynt å trappe opp sin nasjonale innsats for genomisk overvåking. Det har lagt til kontrakter med nasjonale testselskaper som Helix. Og forrige måned kunngjorde Biden-administrasjonen 200 millioner dollar som en forskuddsbetaling for CDCs sekvenseringsarbeid. Andersen sa at han håper USA klarer å sekvensere 2 prosent av alle positive nasjonalt, med et nettverk av sentinel-nettsteder som kan sekvensere med høyere volum på visse steder.

Å bygge denne infrastrukturen for første gang er vanskelig; bygge den på farten, enda mer. Men når det neste pandemiske viruset rammer, kan genomisk overvåking være klar til å gå – så klar at det neste viruset raskt kan innhente COVID-19 som tidenes mest sekvenserte virus. Eller enda bedre, viruset vil holdes inne, og vi vil aldri ha nok tilfeller til å sekvensere 700 000 genom i løpet av et år igjen.