Plague Flag

Plague Flag

Jag läste en fantastisk artikel i Nature (vol. 459, pp 931-939, 18 juni 2009) som väl summerade det nuvarande läget vad gäller influensaviruset H1N1 men också jämförde det med andra varianter. Särskilt diskuteradess dess patologiska komponenter på djupet – dvs det som är dödligt – och jämfördes med andra liknande virus.

Detta influensavirus är riktigt fascinerande. Tillåt mig att breda ut texten en smula…

Jämfört med andra virus

Hur många bitar behövs det för att döda en människa?

H1N1-viruset har blivit synat ordentligt i sömmarna och dess genetiska sekvenser undersökts och loggats i NCBI Influenza Virus Resource database. Exempelvis en influensavariant känd som A/Italy/(49/2009(H1N1) isolerades från näsan hos en 26-årig kvinna som återvände till Italien efter ett besök i USA och hela genomet hos viruset finns postat på denna webbsida. Här kommer de första 120 bitarna i den informationsmängd som utgör genomet.

atgaaggcaa tactagtagt tctgctatat acatttgcaa ccgcaaatgc agacacatta

Kom ihåg att varje symbol representerar ett av fyra möjliga värden. Därför är det 2 bitar information per symbol. Alternativt kan de också representeras som en sekvens av aminisyror genom en direkt översättningstabell via de följande peptiderna:

MKAILVVLLYTFATANADT 

I detta fall representerar varje symbol en aminosyra som är ekvivalet med 6 bitar information, dvs 3 DNA-kodoner per aminosyra. M står för Metionin, K är Lysin, A är Alanin osv. Du kan hitta hela översättningstabellen här.

För de som inte är förtrogna med molekulärbiologi så kan man säga att DNA är informations-ekvivalet med RNA rakt översättningsbart 1-till-1. DNA är som ett program sparat på hårddisken, RNA är samma program laddat i en dators RAM-minne. När DNA laddas sker något som kallas för transkription där T-baserna byts mot U-baser. Varje baspar specificerar en av fyra möjliga symboler, A, T eller U, G och C) så ett enstaka baspar innebär alltså 2 bitar information.

Proteiner är resultatet av att köra ett RNA-program. När RNA tolkas i en cell så syntetiseras det protein (eller de proteiner) som RNA står för. Detta sker i steg om 3 symboler RNA mot 1 aminosyra som är byggstenarna i ett protein. Man kan jämföra proteiner med pixlarna i en frame buffer om man är bekant med hur grafikkort fungerar. Ett komplett protein är en bild på skärmen, varje aminosyra är en pixel som bygger upp denna bild. Varje pixel har ett färgdjup om 6 bitar som mappas 3 till 1 på ett medium som lagrar 2 bitar per symbol eller baspar i detta fall och varje pixel har en färgpalett som översätter ett visst värde mot en lagrad färg. Till skillnad från datorgrafik kan dock antalet aminosyror variera i ett protein.

Vi gör ett exempel av det, låt oss säga att vi har sex bitar information sparat på datorns hårddisk, det innebär exempelvis sekvensen ATG och denna laddas till minnet RAM som RNA och blir då AUG (T översätts till U alltid i detta fall). När detta tolkas av datorn läses AUG som en pixelfärg och slås upp i paletten och där får vi då resultatet M som står för aminosyran metionin som råkar vara startsekvensen i varenda biologiskt DNA-program! Eftersom DNA och RNA är informationsekvivalenta (kan översättas rakt 1-till-1) så väljer forskarna för det mesta att lagra sekvenserna i DNA-format – även om det som i fallet med influensavirus egentligen inte finns något DNA i viruset – bara RNA.

Tillbaka till huvudpoängen med detta. Denna särskilda RNA-subrutin som vi talade om här tidigare i inledningen kodar för något som kallas HA-genen som producerar hemaglutinin, i just detta fall är det H1 hos H1N1-viruset och det är härifrån som virusen klassas.

Om man tänker sig organismer som datorer med IP-adresser så är varje funktionell cellgrupp inom organismen en rutin som lyssnar på sin egen aktiva port. Så precis som port 25 oftast kopplar mot en SMTP-server på en dator så kopplar H1 specifikt mot luftvägarna i en människas respiratoriska system. Intressant nog kopplar även H1 mot inälvorna i många fågelarter varför viruset kan hoppa mellan så vitt skilda organismer som människor och fåglar. Men detta innbär att symptomen för detta virus blir helt annorlunda i människor där det attackerar luftvägarna och i fåglar där det attackerar mag-tarm-kanalen i stället.

Till skillnad från H5-virus som var den stora skrämsellarmet för några år sedan som kodar specifikt för en del i lungorna hos människor som sitter väldigt djupt så är som regel inte H1 virus lika allvarliga för de attackerar inte lika känslig vävnad. H5-virus leder som regel i människor till kraftig lunginflammation medan H1 mest innebär snuva, nysningar och irritation i de över luftvägarna och orsakar täppt näsa medan H5-virus kan helt göra det omöjligt att andas på egen hand.

Forskare lär sig mer om denna H5-port för varje dag, artikeln i Nature indikerar att vissa människor bär på en mutation som gör att deras lungor ”inte lyssnar” på den här porten utan är mer eller mindre immuna mot H5-virus. Dessa människor skulle vara de som hade lättast att överleva en pandemi baserade på t.ex. fågelinfluensavirus som H5N1 eftersom de skulle ha ett naturligt skydd mot dessa medan de flesta andra som inte hade det skulle sakna detta skydd och mycket lättare duka under för H5N1 eller någon följdsjukdom.

Så hur många bitar information finns det egentligen i H1N1 som också kallas svininfluensa egentligen? Den råa informationsmängden är 26 022 bitar. Några används inte (läses aldrig) i genmaskineriet så räknar vi bort dessa blir det 25 054 bitar kvar.  Dessa siffror är inte helt exakta, viruset muterar gärna och ofta vilket gör att antalet använda bitar kan variera från en stam till en annan av samma virus. I datorvärlden kan man säga att viruset innehåller självmodifierande kod som gör att medan det kör sin genetiska sekvens i din cells biologiska maskineri kan den ibland skapa två olika proteiner från en enda gen beroende på hur den körs. Detta är mycket intressant förstås men i datorsammanhang kan man jämföra det med att en viss kod producerar ett resultat om vissa variabler är satta på ett sätt och ett annat resultat om variablerna inte är satta på ett specifikt sätt.

Men grovt räknat – det behövs ca 25 kilobit information vilket är alltså 3.2 kilobyte – ungefär lika mycker RAM som finns ledigt i en Commodore VIC-20 för BASIC-tolken att använda – för att ha en god chans att ta livet av en människa.

Detta är mycket mer effektivt än de enklaste datorvirus, som exempel MyDoom som innehåller ungefär 22 kB information.

Det är ganska fantastiskt att förstå att man kan dödas av en blygsam 3.2 kilobyte lång sekvens med data. Men med tanke på att vår egen DNA:s informationsmängd väger in runt 850 Mbyte data så borde det finnas en och annan exploit och säkerhetslucka som kan nyttjas av skadlig kod.

Att hacka svininfluensan

En intressant konsekvens från att läsa denna artikel i Nature, och att se hela virusets genetiska sekvens, är att jag nu vet hur man skulle kunna modifiera virusets genom för att göra det mer dödligt.

Så här går det till:

Artikeln i Nature noterar t.ex. att varianter av genen PB2 som har glutaminsyra vid position 627 i den genetiska sekvensen har en låg patogenes (inte så dödlig) medan en variant som i stället har lysin på samma position är betydligt dödligare för människor. Om vi tittar på sekvensen av PB2 för H1N1 så kan vi genom databasen hitta sekvensen som ser ut så här:

601 QQMRDVLGTFDTVQIIKLLP
621 FAAAPPEQSRMQFSSLTVNV
641 RGSGLRILVRGNSPVFNYNK

Som du kan se finns det ett ”E” i position 627 vilket är koden för glutaminsyra. Tack och lov är detta den mindre dödliga versionen, troligen är det därför inte så många dog av utbrottet av svininfluensan som hade en hel världs virologer vid strupen i några veckor innan man insåg att detta inte var den nya digerdöden.

Om vi gör om det till DNA-kod i stället för aminosyrakod så får vi följande:

621  F  A  A  A   P  P  E   Q  S  R
1861 tttgctgctg ctccaccaga acagagtagg

Nu syns det att vi har ”GAA” som kodar för ”E” (glutaminsyra). För att modifiera detta genom till att bli många gånger dödligare behöver vi bara byta ut sekvensen ”GAA” mot sekvensen ”AAA” eller ”AAG” som båda kodar för lysin.

Alltså den verkligt farliga varianten av H1N1 skulle kunna ha detta i sitt genom:

621  F  A  A  A   P  P  K   Q  S  R
1861 tttgctgctg ctccaccaaa acagagtagg

En enda symbol skiljer dessa två varianter åt från varandra. På datorspråk är det två bitars information i hela den genetiska sekvensen på 3.2 kB som vi har ändrat på.

Rent teoretiskt finns det ett antal välkända sätt man skulle kunna syntetisera denna ändring i ett laboratorium utrustat för mikrobiologisk forskning. Det går till och med att beställa sådana sekvenser från labb över Internet från ställen som exempelvis ”Mr. Gene” så egentligen behöver jag inte veta så mycket själv om hur det går till. Priset för detta arbete skulle gå på ca 8 000 SEK. Inte så värst farligt för att ta fram en sjukdom som potentiellt kunde döda en stor del av mänskligheten.

Notera att Mr. Gene och de flesta andra dock har procedurer som gör att man inte kan beställa vilka sekvenser som helst från dem. Men hur kan man veta att de inte missar något eller kollar alla möjliga varianter av detta. Hur kan man veta att de faktiskt skulle hitta denna variant av modifierad H1 gen?

Även så finns det också en annan teknik som kan användas där man låter mutationer ske riktat och där borde man relativt enkelt också kunna få fram denna förändring i ett någorlunda väl utrustat labb för mikrobiologi.

[Jag noterade just följande citat från artikeln: Neumann, G. et al Generation of influenza A viruses entirely from cloned cDNA. Proc. Natl Acad. Sci. USA 96, 9345-9350 (1999). Denna artikel berätta om hur man gör ett influensavirus].

Adapterbar influensa

Okay, innan vi sätter i halsen över detta lilla hack, låt oss se vad influensa kan åstadkomma på egen hand. Först och främst så är det en verkligt dödlig punch förpackad i en liten låda på 3.2 kbyte. Hur långt vi än har kommit i forskningen så är det inte mycket vi kan göra efter att en kropp blivit infekterad av det. Därifrån handlar det mest om kroppens eget immunsystem.  Kan influensa själv utföra denna genmanipulering?

Det korta svaret är ja, det kan det.

Faktum är att influensa har utvecklats för att tillåta sådana adaptioner snabbt och effektivt. Normalt när DNA kopieras finns det en felrättningsfunktion som kontrollerar det kopierade genomet så att det stämmer med originalet. Detta ger oss ett mycket lågt tal av felkopiering – dock inte helt noll, mutationer uppstår spontant ibland i alla organismer och kan ge oss allt från allvarliga sjukdomar till viss resistens mot malaria eller bara en annan ögonfärg.

Men influensavirus använder inte DNA. De använder RNA som är bara ena halvan av DNA. Därför saknar de denna felrättningsmekanism för att jämföra med och har en helt annan struktur för att kopiera sina sekvenser.

Det visar sig att influensavirus innanför själva skalet packar en proteinfabrik som är av en hög komplexitet och specialanpassad för RNA-kopiering. Det som är signifikant här är avsaknaden av felrättning i kopiorna vilket innebär att under vissa förhållanden kan antalet fel vara ganska stora. Det sker under normala förutsättningar ungefär ett misstag per 10 000 baspar som kopieras. Hur långt är vårat virusgenom? Ungefär 13 000 baspar. Därför har vi i snitt mer än ett fel per kopia av viruset rent statistiskt.

Då tar vi det igen. Därför har varje producerad viruspartikel i snitt mer än ett fel i sitt genom. En slumpmässig mutation.

En del av dessa lär inte påverka viruset särskilt mycket, en del kanske tom gör att det inte kan fungera och fortsätta infektera fler celler i kroppen men eftersom virus replikeras geometriskt i kroppen i astronomiska antal så kommer också tusentals mutationer provas varje timme i en infekterad kropp.

Chansen att det hack vi beskrev tidigare uppträder naturligt blir alltså ganska hög. Detta är troligen den största anledningen till att man var från officiellt håll så oroad över detta virus när det trots allt ganska snabbt visade sig att det inte var så farligt. Men om en enda viruspartikel lyckats mutera ett G till ett A och sedan spritt sig till en annan människa och så vidare då hade kanske vår värld sett totalt annorlunda ut idag.

Kanske vore det därför smart att försöka infektera sig med den variant av H1N1 som finns i dag. Det borde kunna ge en viss immunitet mot en muterad och mycket dödligare form av viruset. The Centre for Disease Control (CDC) i USA har fört följande statistik: 87 döda från 21 449 bekräftat smittade eller om man så vill en 0.4 % mortalitet hos viruset som det ser ut nu. Som kontrast kan nämnas att ”vanlig flunsa” har en mortalitet som ligger < 0.1 % här i västvärlden medan spanska flunsan hamnade runt 2.5 % dödlighet av alla som blev infekterade med den.

H5N1 å andra sidan har en mortalitet som är betydligt högre. Närmare 50 % men det sprider sig inte så lätt från människa till människa tack och lov. Genom att ådra sig H1N1 idag skulle immunförsvaret vara beredd och lättare kunna ta hand om en dödligare variant och därför har en sorts vaccination genomförts. Problemet är bara att om många infekteras då ökar ju även antalet mutationer och risken att en mycket dödlig variant uppträder kommer som ett brev på posten.

Det finns en liten intressant sak med dessa influensavirus som bygger lite på deras RNA-arkitektur och som kan vara intressant att känna till. Denna intressanta sak är att genomet ligger förpackat i viruset som 8 separata strängar av RNA i stället för en enda lång sträng som i många andra virus och i andra levande celler. Varför är detta viktigt?

Om man betraktar vad som sker när en person infekteras av två olika sorters influensa samtidigt så börjar bilden klarna. När detta sker invaderas förr eller senare samma celler av båda varianterna och eftersom virusen lagrar sina sekvenser i åtta olika strängar kan dessa mixas fritt inuti en cell som är infekterad. Så om du är oturlig nog att ådra dig två olika sorters influensa så kan en sådan mixning ske som producerar en hybrid form av viruset, en ny variant som kan ha helt andra egenskaper jämfört med de två virus som invaderade dig från början. RNA-bitarna är kopierade, mixade, förpackade i viruspartiklar som sedan släpps lös och försöker invadera fler celler i kroppen. Denna process är mycket elegant och tillåter att man slumpmässigt blandar genom mellan virus.

Detta kan ske i fåglar, grisar, människor och andra djur som får influensa. Blir man infekterad med 3 eller tom 4 varianter samtidigt kan mycket komplexa utbyten ske som ger upphov till typer som tidigare aldrig existerat och som immunförsvaret inte känns igen alls.

Detta är anledningen till att H1N1 kallas för ”triple-reassortant”: genom antingen en serie av dubbla infektioner eller möjligen en enstaka infektion av flera influensor i samma bärare har H1N1 skapats av en mix med RNA-bitar som har gett det egenskaper som att det lätt infekterar människor samtidigt som vårat immunförsvar inte känner igen det. Detta är den perfekta grogrunden för en pandemi. Hade den dessutom haft en hög mortalitet hade vi förmodligen varit i full panik nu.

Så genom att spara sitt genom som RNA, sakna felrättning vid kopieringen samt lagra sitt genom som 8 disparata enheter som lätt switchas fram och tillbaka har viruset skapat en adaptionsmekanism som gör att det är extremt svårt att ta kål på, nya varianter kommer dyka upp hela tiden som vårt immunförsvar inte känner till och förr eller senare kommer en mutation eller en sådan blandning ske mellan två eller flera influensor som leder till en mycket farlig variant.

Men det var inte denna gång som vi såg den varianten.