Hva er et gen?

Kanskje det er betimelig å starte denne bloggen med dette spørsmålet. Underlig, kanskje. Det er mer enn 8 år siden DNA-sekvensen til det humane genom ble bestemt. Så er det fortsatt nødvendig å stille dette spørsmålet?

Vel, – forsøk å finne noen genforskere som vil si deg nøyaktig hvor mange gener mennesket har! Circa 30,000, vil de fleste si. Men du får ikke vite om det er 29,832 eller 32,118. Grunnen er at det er vanskelig å gi en presis definisjon av et gen.

Ikke det at vi ikke vet hva gener er. Vi vet tilogmed ganske mye om hvordan genene virker. Så – for ordens skyld, – her er en gen-definisjon som holder for de aller fleste av våre gener:

«Et gen er en del av et kromosom, et stykke DNA, som koder for et RNA-molekyl» (hentet fra GENsidene)

– og for de fleste gener blir RNA-molekylet gjort om til et mRNA som igjen koder for et protein. Så, for de fleste gener gjelder relasjonen «ett gen – ett protein».

Når vi undersøker genomene til menneske og andre organismer, finner vi stadig nye unntak for denne enkle «ett gen – ett protein»-regelen. Et slikt unntak ble beskrevet av Fisher et al., i tidsskriftet Nature (25. september 2008): Hos nematoden Caenorhabditis elegans er leses de to nabogenene, eri-6 og eri-7, av i motsatt retning. Men, når RNA-transkriptene fra de to genene dannes, tvinnes de sammen i et lite område, og det dannes en kombi-mRNA, – og denne kombi-mRNAen koder for ett protein. Dette er altså et eksemple på at TO gener koder for ETT protein. Fenomenet kalles trans-splicing. Mer om det siden.

Men HVORFOR kan vi ikke gi et presist tall på antall gener i vårt genom? Den genetiske koden ble jo knekket på 60-tallet. Poenget er: mens den genetiske koden forklarer hvordan basesekvensen i mRNA oversettes av ribosomene til proteinsekvenser, – så vet vi fortsatt ikke nøyaktig hvordan DNA-sekvensene transkriberes til mRNA. Dvs. vi kjenner ikke mekanismene for avlesing av DNA til mRNA godt nok. Mer presist: vi kan ikke, – fra DNA-sekvensen alene, avgjøre hvor avlesingen av et gen starter.

De molekylære mekanismene som styrer hvor og hvor ofte et stykke DNA skal avleses er nøye regulert. Dette kalles genregulering. Det som gjør dette spørsmålet så vanskelig er at de ulike genene reguleres forskjellig.

Skjematisk tegning av et gen

Skjematisk tegning av et gen, et mRNA og proteinet det koder for.

Bildet illustrerer et gen hvor den delen som avleses (transkriberes) til mRNA er vist som en blå boks. mRNAen koder i neste omgang for et protein. De fargede firkantene foran og bak den transkriberte delen indikerer sekvenser i DNA hvor regulatoriske proteiner binder og regulerer genet.  Les mer om dette på GENsidene.

Det er i dag derfor vanlig å presisere definisjonen av et gen til 

«.. en del av et kromosom, et stykke DNA, som koder for et RNA-molekyl inkludert de omkringliggende regioner som er nødvendige for at genet skal uttrykkets korrekt i alle celler og til enhver tid»

Dette kalles ofte en transkripsjonsenhet – og er egentlig en god og «funksjonell» definisjon på et gen.

Regulatoriske sekvenser kan ligge langt ovenfor (eller nedenfor) den delen av genet som avleses, og det kan være andre gener i mellom. Slik vil flere gener kunne overlappe hverandre i utstrekning langs kromosomet. Dette gjør det naturligvis litt mer komplisert å gi en ren og pen definisjon av hvert enkelt gen. For de fleste gener kjenner vi på langt nær alle de regulatoriske sekvensene.

For å forstå hvordan vårt genom fungerer, må vi derfor finne både de generelle mekanismene for genregulering og de mekanismer som gjør at hvert enkelt av de ca. 30,000 genene våre reguleres korrekt. Dette er en formidabel oppgave og forskere over hele verden deltar. GENtidene vil følge dette forskningsfeltet i tiden framover.

Andre spørsmål reiser seg også: Hvor mange av våre gener er involvert i sykdom? Hvor mange gener er forskjellige mellom mennesker og våre nærmeste aper? – og hvilke av disse er det som bidrar til å gjøre menneskene forskjellige fra apene?

7 kommentarer

Filed under fag

7 responses to “Hva er et gen?

  1. hvor mange gen har vi ?

    • vel – som jeg skriver i artikkelen, – så VET vi faktisk ikke nøyaktig hvor mange gener vi har. Og dette er jo en smule paradoksalt: Aldri før har vi visst så mye om gener som nå, – men likevel strever vi med å gi en presis definisjon på hva et gen er og som holder for alle de ulike gentypene vi har funnet. Men, anslagsvis 30000. Skal vi si det sånn?! …. Så kan vi ha som agenda her på GENtidende å følge med på presiseringen av dette tallet i tiden som kommer.

  2. Regnefeil

    Jeg har hørt at vi kanskje består av en million proteiner. Hvordan kan det være mulig når vi bare har 30 000 gener?

  3. Godt spørsmål, Johan!
    Først, – de siste tallene fra ENSEMBL-databasen viser at det er identifisert 21.343 proteinkodende gener. Dertil er det 5-6.000 gener som koder for ulike RNA og nesten 10.000 pseudogener, – gener som har mistet sin funksjon.

    Så hvordan kan de neste 22.000 protein-kodende genene kode for en million proteiner?!
    Mange, ja kanskje de fleste genene er bygget opp slik at fra et og samme primær-transkript, – den første pre-mRNA som dannes, kan det lages flere forskjellige modne mRNA. Dette skjer ved en prosess som kalles spleising. Dersom spleisingen berører den delen av pre-mRNA som koder for proteinet, vil det dannes forskjellige proteinvarianter fra hver av spleisevariantene.

    I ASD-databasen er det per i dag registert 14.101 gener med mer enn en spleiseform (med et gjennomsnitt på 5,6 spleisevarianter per alternativt spleiset gen).
    Det er all grunn til å tro at dette er et underestimat, – og, med litt romslig regning, så kan dette generere ca 150.000 proteiner med forskjellig aminosyresekvens. Det er altså fortsatt et godt stykke til en million.

    Jeg vet ikke hvordan man er kommet fram til 1 million, – men jeg ser for meg to sannsynlige forklaringer:
    – Vi har rett og slett ikke sett mer en toppen av isfjellet av alternativ spleising. Det er fullt mulig at dette er bakgrunnen for estimatet på 1 million.
    – En annen mulighet kan knyttes til definisjonen av hva et protein er. I det jeg så langt har skrevet her på GENtidene (og GENsidene), så har jeg i all hovedsak betraktet et protein som ett polypeptid, – dvs. hvert protein består av en polypeptidkjede. Men begrepet ‘protein’ benyttes også om proteiner som består av flere polypeptider. Mange proteiner består av 2 eller flere polypeptider, – og mange polypeptider opptrer i flere forskjellige proteinkomplekser. Dersom vi teller opp (evt. estimerer) alle enkelt-polypeptidene og alle mulige kombinasjoner som finnes naturlig i kroppens celler, – og legger til alle spleisevariantene og deres komplekser, – så kan det godt hende vi kommer svært nær en million. Det er litt tidlig å gjøre realistiske estimater av antall proteinkomplekser, – fordi kartleggingen av slike komplekser er langt fra komplett.

    Det er enda et forhold som bidrar til variasjon og diversitet blant proteinene. Det skyldes at mange av aminosyrene i proteinene kan modifiseres etter at proteinene er laget. Det er allerede kartlagt et stort antall slike modifikasjoner, – men her har vi definitivt bare sett en brøkdel av den variasjonen som finnes. Les mer om dette på GENsidene.

    Så, du har helt rett, Johan, – selv om antallet gener kanskje er «bedrøvelig» lavt, – så er det flere mekanismer som bidrar til å lage et stort antall varianter og modifiserte former av proteinene.

    Men dette skal vi skrive mer om her og på GENsidene!

    • Regnefeil

      Takk for svar, men jeg har et annet problem med alle disse proteinene. Er de alle tilstede i alle celler til enhver tid? Det må da bli temmelig fullt i den enkelte celle i så fall.

  4. Shira

    Flott side!
    Gleder meg til å følge den fremover.

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s