Het is geen eigenschap van de genetische code. Wat is de genetische code: algemene informatie

Het is geen eigenschap van de genetische code. Wat is de genetische code: algemene informatie

DNA- en RNA-nucleotiden
  1. Purines: adenine, guanine
  2. Pyrimidinen: cytosine, thymine (uracil)

codon- een triplet van nucleotiden die coderen voor een specifiek aminozuur.

tabblad. 1. Aminozuren die veel voorkomen in eiwitten
Naam Afkorting
1. Alaninehelaas
2. ArginineArg
3. Asparagineasn
4. Asparaginezuuradder
5. CysteïneCys
6. GlutaminezuurGlu
7. GlutamineGln
8. Glycinegly
9. HistidineZijn
10. Isoleucineile
11. LeucineLeu
12. LysineLys
13. Methionineleerde kennen
14. FenylalaninePhoe
15. ProlinePro
16. Serieser
17. ThreonineThr
18. Tryptofaantrp
19. TyrosineTyr
20. Valinevali

Genetische code, ook wel een aminozuurcode genoemd, is een systeem voor het vastleggen van informatie over de volgorde van aminozuren in een eiwit met behulp van de volgorde van nucleotideresiduen in DNA die een van de 4 stikstofbasen bevatten: adenine (A), guanine (G ), cytosine (C) en thymine (T). Omdat de dubbelstrengs DNA-helix echter niet direct betrokken is bij de synthese van het eiwit dat wordt gecodeerd door een van deze strengen (d.w.z. RNA), is de code geschreven in de taal van RNA, waarin uracil (U) is opgenomen in plaats van thymine. Om dezelfde reden is het gebruikelijk om te zeggen dat een code een reeks nucleotiden is, geen basenparen.

De genetische code wordt weergegeven door bepaalde codewoorden - codons.

Het eerste codewoord werd in 1961 door Nirenberg en Mattei ontcijferd. Ze verkregen een extract van E. coli dat ribosomen en andere factoren bevat die nodig zijn voor eiwitsynthese. Het resultaat was een celvrij systeem voor eiwitsynthese, dat een eiwit uit aminozuren kon samenstellen als het benodigde mRNA aan het medium werd toegevoegd. Door synthetisch RNA, dat alleen uit uracils bestaat, aan het medium toe te voegen, ontdekten ze dat er een eiwit werd gevormd dat alleen uit fenylalanine (polyfenylalanine) bestond. Zo werd gevonden dat het triplet van UUU-nucleotiden (codon) overeenkomt met fenylalanine. Gedurende de volgende 5-6 jaar werden alle codons van de genetische code bepaald.

De genetische code is een soort woordenboek dat een tekst geschreven met vier nucleotiden vertaalt naar een eiwittekst geschreven met 20 aminozuren. De rest van de aminozuren die in het eiwit worden gevonden, zijn modificaties van een van de 20 aminozuren.

Eigenschappen van de genetische code

De genetische code heeft de volgende eigenschappen.

  1. drievoud Elk aminozuur komt overeen met een triple van nucleotiden. Het is gemakkelijk te berekenen dat er 4 3 = 64 codons zijn. Hiervan zijn 61 semantisch en 3 zinloos (beëindigende, stopcodons).
  2. Continuïteit(er zijn geen scheidingstekens tussen nucleotiden) - de afwezigheid van intragene leestekens;

    Binnen een gen maakt elk nucleotide deel uit van een significant codon. in 1961 Seymour Benzer en Francis Crick hebben experimenteel de tripletcode en de continuïteit ervan bewezen (compactheid) [show]

    De essentie van het experiment: "+" mutatie - het inbrengen van één nucleotide. "-" mutatie - verlies van één nucleotide.

    Een enkele mutatie ("+" of "-") aan het begin van een gen of een dubbele mutatie ("+" of "-") bederft het hele gen.

    Een drievoudige mutatie ("+" of "-") aan het begin van een gen bederft slechts een deel van het gen.

    Een viervoudige "+" of "-" mutatie bederft opnieuw het hele gen.

    Het experiment werd uitgevoerd op twee aangrenzende faaggenen en toonde aan dat:

    1. de code is triplet en er zijn geen leestekens in het gen
    2. er zijn leestekens tussen genen
  3. Aanwezigheid van intergene leestekens- de aanwezigheid onder de tripletten van initiërende codons (ze beginnen eiwitbiosynthese), codons - terminators (geven het einde van eiwitbiosynthese aan);

    Conventioneel behoort het AUG-codon ook tot leestekens - de eerste na de leader-reeks. Het vervult de functie van een hoofdletter. In deze positie codeert het voor formylmethionine (in prokaryoten).

    Aan het einde van elk gen dat codeert voor een polypeptide, is er ten minste één van de 3 terminatiecodons of stopsignalen: UAA, UAG, UGA. Ze beëindigen de uitzending.

  4. collineariteit- correspondentie van de lineaire sequentie van mRNA-codons en aminozuren in het eiwit.
  5. Specificiteit:- elk aminozuur komt alleen overeen met bepaalde codons die niet voor een ander aminozuur kunnen worden gebruikt.
  6. Unidirectioneel- codons worden in één richting gelezen - van de eerste nucleotide naar de volgende
  7. Degeneratie of redundantie, - meerdere tripletten kunnen coderen voor één aminozuur (aminozuren - 20, mogelijke tripletten - 64, 61 daarvan zijn semantisch, d.w.z. gemiddeld komt elk aminozuur overeen met ongeveer 3 codons); de uitzondering is methionine (Met) en tryptofaan (Trp).

    De reden voor de degeneratie van de code is dat de belangrijkste semantische lading wordt gedragen door de eerste twee nucleotiden in het triplet, en de derde is niet zo belangrijk. Vanaf hier code degeneratie regel : als twee codons twee identieke eerste nucleotiden hebben, en hun derde nucleotiden behoren tot dezelfde klasse (purine of pyrimidine), dan coderen ze voor hetzelfde aminozuur.

    Er zijn echter twee uitzonderingen op deze ideale regel. Dit zijn het AUA-codon, dat niet zou moeten overeenkomen met isoleucine, maar met methionine, en het UGA-codon, dat de terminator is, terwijl het zou moeten overeenkomen met tryptofaan. De degeneratie van de code heeft uiteraard een adaptieve waarde.

  8. Veelzijdigheid- alle eigenschappen van de hierboven genoemde genetische code zijn kenmerkend voor alle levende organismen.
    codon Universele code Mitochondriale codes
    Gewervelde dieren ongewervelde dieren Gist Planten
    UGAHOU OPtrptrptrpHOU OP
    AUAileleerde kennenleerde kennenleerde kennenile
    CUALeuLeuLeuThrLeu
    AGAArgHOU OPserArgArg
    AGGArgHOU OPserArgArg

    BIJ recente tijden Het principe van de universaliteit van de code werd door elkaar geschud in verband met de ontdekking door Berell in 1979 van de ideale code van menselijke mitochondriën, waarin de degeneratieregel van de code wordt vervuld. In de mitochondriale code komt het UGA-codon overeen met tryptofaan en AUA met methionine, zoals vereist door de code-degeneratieregel.

    Misschien hadden aan het begin van de evolutie alle eenvoudigste organismen dezelfde code als de mitochondriën, en toen onderging het kleine afwijkingen.

  9. niet overlappend- elk van de tripletten van de genetische tekst is onafhankelijk van elkaar, één nucleotide maakt deel uit van slechts één triplet; Op afb. toont het verschil tussen overlappende en niet-overlappende code.

    in 1976 AX174 faag-DNA werd gesequenced. Het heeft een enkelstrengs circulair DNA van 5375 nucleotiden. Van de faag was bekend dat deze codeert voor 9 eiwitten. Voor 6 van hen werden genen geïdentificeerd die achter elkaar waren gelokaliseerd.

    Er bleek een overlap te zijn. Het E-gen bevindt zich volledig binnen het D-gen. Het startcodon verschijnt als gevolg van een verschuiving van één nucleotide in de uitlezing. Het J-gen begint waar het D-gen eindigt. Het startcodon van het J-gen overlapt het stopcodon van het D-gen door een verschuiving van twee nucleotiden. Het ontwerp wordt "reading frame shift" genoemd door een aantal nucleotiden dat geen veelvoud van drie is. Tot op heden is overlap aangetoond voor slechts enkele fagen.

  10. Ruisimmuniteit- de verhouding van het aantal conservatieve substituties tot het aantal radicale substituties.

    Mutaties van nucleotidesubstituties die niet leiden tot een verandering in de klasse van het gecodeerde aminozuur worden conservatief genoemd. Mutaties van nucleotidesubstituties die leiden tot een verandering in de klasse van het gecodeerde aminozuur worden radicaal genoemd.

    Aangezien hetzelfde aminozuur kan worden gecodeerd door verschillende tripletten, leiden sommige substituties in tripletten niet tot een verandering in het gecodeerde aminozuur (bijvoorbeeld UUU -> UUC laat fenylalanine achter). Sommige substituties veranderen een aminozuur in een ander van dezelfde klasse (niet-polair, polair, basisch, zuur), andere substituties veranderen ook de klasse van het aminozuur.

    In elk triplet kunnen 9 enkele substituties worden gemaakt, d.w.z. u kunt kiezen welke van de posities u wilt wijzigen - op drie manieren (1e of 2e of 3e), en de geselecteerde letter (nucleotide) kan worden gewijzigd in 4-1 = 3 andere letters (nucleotiden). Totaal mogelijke vervangingen nucleotiden - 61 bij 9 = 549.

    Door direct te tellen op de tabel van de genetische code, kan men verifiëren dat van deze: 23 nucleotidesubstituties leiden tot het verschijnen van codons - translatieterminators. 134 substituties veranderen het gecodeerde aminozuur niet. 230 substituties veranderen de klasse van het gecodeerde aminozuur niet. 162 substituties leiden tot een verandering in de aminozuurklasse, d.w.z. zijn radicaal. Van de 183 substituties van het 3e nucleotide leiden 7 tot het verschijnen van translatiebeëindigers, en 176 zijn conservatief. Van de 183 substituties van het 1e nucleotide leiden 9 tot het verschijnen van terminators, 114 zijn conservatief en 60 zijn radicaal. Van de 183 substituties van het 2e nucleotide leiden 7 tot het verschijnen van terminators, 74 zijn conservatief en 102 zijn radicaal.


De reeks artikelen waarin de oorsprong van het Burgerlijk Wetboek wordt beschreven, kan worden beschouwd als een onderzoek naar gebeurtenissen waarover we weinig sporen hebben. Het begrijpen van deze artikelen vereist echter enige inspanning om de moleculaire mechanismen van eiwitsynthese te begrijpen. Dit artikel is het inleidende artikel voor een reeks auto-publicaties gewijd aan de oorsprong van de genetische code, en het is de beste plaats om kennis te maken met dit onderwerp.
Gebruikelijk genetische code(GC) wordt gedefinieerd als een methode (regel) voor het coderen van een eiwit op de primaire structuur van DNA of RNA. In de literatuur wordt meestal geschreven dat dit een één-op-één overeenkomst is van een sequentie van drie nucleotiden in een gen met één aminozuur in het gesynthetiseerde eiwit of het eindpunt van eiwitsynthese. Er zijn echter twee fouten in deze definitie. Dit impliceert 20 zogenaamde canonieke aminozuren, die zonder uitzondering deel uitmaken van de eiwitten van alle levende organismen. Deze aminozuren zijn eiwitmonomeren. De fouten zijn de volgende:

1) Canonieke aminozuren zijn niet 20, maar slechts 19. We kunnen een aminozuur een stof noemen die tegelijkertijd een aminogroep -NH 2 en een carboxylgroep - COOH bevat. Het feit is dat het eiwitmonomeer - proline - geen aminozuur is, omdat het een iminogroep bevat in plaats van een aminogroep, dus het is correcter om proline een iminozuur te noemen. In de toekomst zal ik echter voor het gemak in alle artikelen over HA ongeveer 20 aminozuren schrijven, wat de aangegeven nuance impliceert. De aminozuurstructuren worden getoond in Fig. een.

Rijst. 1. Structuren van canonieke aminozuren. Aminozuren hebben constante delen, zwart gemarkeerd in de figuur, en variabele (of radicalen), rood gemarkeerd.

2) De overeenkomst van aminozuren met codons is niet altijd eenduidig. Zie hieronder voor de schending van uniciteitsgevallen.

Het optreden van HA betekent het optreden van gecodeerde eiwitsynthese. Deze gebeurtenis is een van de belangrijkste voor de evolutionaire vorming van de eerste levende organismen.

De structuur van de HA wordt weergegeven in een cirkelvorm in Fig. 2.



Rijst. 2. Genetische code in een cirkelvorm. De binnenste cirkel is de eerste letter van het codon, de tweede een cirkel - de tweede letter van het codon, de derde cirkel - de derde letter van het codon, de vierde cirkel - aanduidingen van aminozuren in een drieletterige afkorting; P - polaire aminozuren, NP - niet-polaire aminozuren. Voor de duidelijkheid van de symmetrie is de gekozen volgorde van symbolen belangrijk U-C-A-G.

Laten we dus verder gaan met de beschrijving van de belangrijkste eigenschappen van HA.

1. drievoudigheid. Elk aminozuur wordt gecodeerd door een sequentie van drie nucleotiden.

2. De aanwezigheid van intergenetische leestekens. Intergene leestekens bevatten reeksen Nucleïnezuur waar de uitzending begint of eindigt.

Vertaling Ik kan niet beginnen met een codon, maar alleen met een strikt gedefinieerde - beginnend. Het startcodon is het AUG-triplet, dat de translatie start. In dit geval codeert dit triplet ofwel voor methionine ofwel voor een ander aminozuur, formylmethionine (in prokaryoten), dat alleen aan het begin van de eiwitsynthese kan worden ingeschakeld. Aan het einde van elk gen dat codeert voor een polypeptide bevindt zich ten minste één van de 3' beëindiging codons, of remlichten: UAA, UAG, UGA. Ze beëindigen de translatie (de zogenaamde eiwitsynthese op het ribosoom).

3. Compactheid, of de afwezigheid van intragene leestekens. Binnen een gen maakt elk nucleotide deel uit van een significant codon.

4. Niet overlappend. Codons overlappen elkaar niet, elk heeft zijn eigen geordende set nucleotiden, die niet overlapt met vergelijkbare sets naburige codons.

5. Degeneratie. De omgekeerde correspondentie in de aminozuur-codonrichting is dubbelzinnig. Deze eigenschap wordt degeneratie genoemd. Serie is een set codons die codeert voor één aminozuur, met andere woorden, het is een groep equivalente codons. Zie een codon als XYZ. Als XY "betekenis" definieert (d.w.z. aminozuur), dan heet het codon krachtig. Als een bepaalde Z nodig is om de betekenis van een codon te bepalen, dan heet zo'n codon zwak.

De degeneratie van de code hangt nauw samen met de ambiguïteit van de codon-anticodon-paring (een anticodon betekent een opeenvolging van drie nucleotiden op een tRNA die complementair kunnen paren met een codon op messenger-RNA (zie twee artikelen hierover in meer detail:): Moleculaire mechanismen voor het waarborgen van codedegeneratie en Regel van Lagerquist. Fysisch-chemische onderbouwing van symmetrieën en Rumer's relaties). Eén anticodon per tRNA kan één tot drie codons per mRNA herkennen.

6.Ondubbelzinnigheid. Elk triplet codeert slechts voor één aminozuur of is een translatieterminator.

Er zijn drie bekende uitzonderingen.

Eerst. In prokaryoten, op de eerste positie (hoofdletter), codeert het voor formylmethionine en in elk ander - methionine Aan het begin van het gen wordt formylmethionine gecodeerd door zowel het gebruikelijke AUG-methioninecodon als ook door het GUG-valine-codon of UUG leucine-codon, dat in het gen codeert voor respectievelijk valine en leucine.

In veel eiwitten wordt formylmethionine afgesplitst of wordt de formylgroep verwijderd, waardoor formylmethionine wordt omgezet in gewoon methionine.

Seconde. In 1986 ontdekten verschillende groepen onderzoekers tegelijk dat het UGA-terminatiecodon op mRNA kan coderen voor selenocysteïne (zie figuur 3), op voorwaarde dat het wordt gevolgd door een speciale nucleotidesequentie.

Rijst. 3. De structuur van het 21e aminozuur - selenocysteïne.

Bij E coli(dit is de Latijnse naam voor Escherichia coli) selenocysteyl-tRNA tijdens translatie en herkent het UGA-codon in mRNA, maar alleen in een bepaalde context e: voor de herkenning van het UGA-codon als zinvol, de sequentie van 45 nucleotiden lang, gelokaliseerd na het UGA-codon, is belangrijk.

Het weloverwogen voorbeeld laat zien dat, indien nodig, een levend organisme de betekenis van de standaard genetische code kan veranderen. In dit geval wordt de genetische informatie in de genen op een complexere manier gecodeerd. De betekenis van het codon wordt bepaald in de context van e met een bepaalde lange sequentie van nucleotiden en met de deelname van verschillende zeer specifieke eiwitfactoren. Het is belangrijk dat selenocysteïne-tRNA werd gevonden in vertegenwoordigers van alle drie de takken van het leven (archaea, eubacteriën en eukaryoten), wat wijst op de oudheid van de oorsprong van de selenocysteïne-synthese, en mogelijk de aanwezigheid ervan in de laatste universele gemeenschappelijke voorouder ( het zal in andere artikelen worden besproken). Hoogstwaarschijnlijk wordt selenocysteïne zonder uitzondering in alle levende organismen aangetroffen. Maar in elk afzonderlijk organisme wordt selenocysteïne in niet meer dan enkele tientallen eiwitten aangetroffen. Het maakt deel uit van actieve centra enzymen, in een aantal homologen waarvan gewone cysteïne op een vergelijkbare positie kan functioneren.

Tot voor kort werd aangenomen dat het UGA-codon ofwel als selenocysteïne ofwel als terminal kon worden gelezen, maar recentelijk is aangetoond dat in ciliaten Euplotes Het UGA-codon codeert voor cysteïne of selenocysteïne. Cm. " Genetische code laat inconsistenties toe"

Derde uitzondering. In sommige prokaryoten (5 soorten archaea en één eubacteriën - de informatie op Wikipedia is erg verouderd) speciaal zuur- pyrrolysine (Fig. 4). Het wordt gecodeerd door het UAG-triplet, dat in de canonieke code dient als een translatie-terminator. Aangenomen wordt dat in dit geval, net als bij de codering voor selenocysteïne, het lezen van UAG als een pyrrolysinecodon plaatsvindt door een speciale structuur op het mRNA. Pyrrolysine-tRNA bevat het anticodon CTA en wordt geaminoacyleerd door klasse 2 APCasen (voor de classificatie van APCasen, zie het artikel "Codasen helpen om te begrijpen hoe genetische code ").

UAG wordt zelden als stopcodon gebruikt en als dat zo is, wordt het vaak gevolgd door een ander stopcodon.

Rijst. 4. Structuur van het 22e aminozuur van pyrrolysine.

7. Veelzijdigheid. Nadat de decodering van het Burgerlijk Wetboek halverwege de jaren 60 van de vorige eeuw was voltooid, voor een lange tijd men geloofde dat de code in alle organismen hetzelfde is, wat de eenheid van de oorsprong van al het leven op aarde aangeeft.

Laten we proberen te begrijpen waarom de GC universeel is. Het is namelijk zo dat als er tenminste één codeerregel in het lichaam zou worden veranderd, dit ertoe zou leiden dat de structuur van een aanzienlijk deel van de eiwitten zou veranderen. Een dergelijke verandering zou te dramatisch zijn en daarom bijna altijd dodelijk, aangezien een verandering in de betekenis van a van slechts één codon gemiddeld 1/64 van alle aminozuursequenties kan beïnvloeden.

Hieruit volgt een zeer belangrijke gedachte - de HA is nauwelijks veranderd sinds zijn vorming meer dan 3,5 miljard jaar geleden. En daarom draagt ​​​​de structuur ervan een spoor van zijn optreden, en de analyse van deze structuur kan helpen begrijpen hoe de GC precies zou kunnen ontstaan.

In werkelijkheid kan HA enigszins verschillen in bacteriën, mitochondriën, de nucleaire code van sommige ciliaten en gisten. Momenteel zijn er minstens 17 genetische codes die 1-5 codons van de canonieke verschillen. In totaal worden 18 gebruikt in alle bekende varianten van afwijkingen van de universele GC verschillende vervangingen betekenis van een codon. De meeste afwijkingen van de standaardcode zijn bekend in mitochondriën - 10. Het is opmerkelijk dat mitochondriën van gewervelden, platwormen, stekelhuidigen, worden gecodeerd door verschillende codes, en schimmels, protozoa en coelenteraten - door één.

De evolutionaire nabijheid van soorten is geenszins een garantie dat ze vergelijkbare GC's hebben. De genetische codes kunnen zelfs tussen verschillende soorten mycoplasma's (sommige soorten hebben een canonieke code, terwijl andere anders zijn). Een soortgelijke situatie wordt waargenomen voor gist.

Het is belangrijk op te merken dat mitochondriën afstammelingen zijn van symbiotische organismen die zich hebben aangepast om in cellen te leven. Ze hebben een sterk gereduceerd genoom, sommige genen zijn naar de celkern verhuisd. Daarom zijn veranderingen in de HA daarin niet langer zo dramatisch.

De later ontdekte uitzonderingen zijn van bijzonder belang vanuit een evolutionair oogpunt, omdat ze kunnen helpen licht te werpen op de mechanismen van code-evolutie.

Tafel 1.

Mitochondriale codes in verschillende organismen.

codon

Universele code

Mitochondriale codes

Gewervelde dieren

ongewervelde dieren

Gist

Planten

UGA

HOU OP

trp

trp

trp

HOU OP

AUA

ile

leerde kennen

leerde kennen

leerde kennen

ile

CUA

Leu

Leu

Leu

Thr

Leu

AGA

Arg

HOU OP

ser

Arg

Arg

AGG

Arg

HOU OP

ser

Arg

Arg

Drie mechanismen voor het veranderen van het aminozuur dat door de code wordt gecodeerd.

De eerste is wanneer een codon niet (of bijna niet) wordt gebruikt door een organisme vanwege het ongelijkmatige voorkomen van sommige nucleotiden (GC-samenstelling), of combinaties van nucleotiden. Hierdoor kan zo'n codon volledig uit gebruik verdwijnen (bijvoorbeeld door het verlies van het corresponderende tRNA) en in de toekomst worden gebruikt om te coderen voor een ander aminozuur zonder noemenswaardige schade aan het lichaam aan te richten. Dit mechanisme is waarschijnlijk verantwoordelijk voor het verschijnen van sommige dialecten van codes in mitochondriën.

De tweede is de transformatie van het stopcodon in de betekenis van het nieuwe. In dit geval kunnen sommige van de getranslateerde eiwitten toevoegingen hebben. De situatie wordt echter gedeeltelijk gered door het feit dat veel genen vaak eindigen met niet één, maar twee stopcodons, aangezien vertaalfouten mogelijk zijn, waarbij stopcodons worden gelezen als aminozuren.

De derde is de mogelijk dubbelzinnige lezing van bepaalde codons, zoals die bij sommige schimmels voorkomt.

8 . Connectiviteit. Groepen equivalente codons (d.w.z. codons die coderen voor hetzelfde aminozuur) worden serie. De GC bevat 21 series, inclusief stopcodons. In wat volgt, zal voor de zekerheid elke groep codons worden genoemd contactpersoon, als het mogelijk is om van elk codon van deze groep over te gaan op alle andere codons van dezelfde groep door opeenvolgende nucleotidesubstituties. Van de 21 series zijn er 18 met elkaar verbonden, 2 series bevatten elk één codon en slechts 1 serie voor het aminozuur serine is losgekoppeld en splitst zich in 2 met elkaar verbonden subseries.


Rijst. 5. Connectiviteitsgrafieken voor sommige codereeksen. a - verbonden serie valine; b - verbonden reeksen leucine; de serinereeks staat los van elkaar en splitst zich in twee verbonden subreeksen. Het cijfer is ontleend aan een artikel van V.A. Ratner" Genetische code als een systeem."

De eigenschap van connectiviteit kan worden verklaard door het feit dat de HA tijdens de vormingsperiode nieuwe codons inving die minimaal verschilden van de reeds gebruikte.

9. Regelmaat eigenschappen van aminozuren door de wortels van drielingen. Alle aminozuren die worden gecodeerd door U-triplets zijn niet-polair, hebben geen extreme eigenschappen en afmetingen en hebben alifatische radicalen. Alle C-worteltripletten hebben sterke basen en de aminozuren waarvoor ze coderen zijn relatief klein. Alle tripletten met wortel A hebben zwakke basen en coderen voor niet-kleine polaire aminozuren. G-wortelcodons worden gekenmerkt door extreme en abnormale varianten van aminozuren en series. Ze coderen voor het kleinste aminozuur (glycine), het langste en platste (tryptofaan), het langste en "onhandigste" (arginine), het meest reactieve (cysteïne), en vormen een abnormale subset voor serine.

10. Blokkerigheid. De universele CC is een "blok"-code. Dit betekent dat aminozuren met vergelijkbare fysisch-chemische eigenschappen worden gecodeerd door codons die één base van elkaar verschillen. De blokkering van de code is duidelijk zichtbaar in de volgende afbeelding.


Rijst. 6. Blokstructuur van het Burgerlijk Wetboek. Witte kleur geeft aminozuren met een alkylgroep aan.


Rijst. 7. Kleurweergave van de fysisch-chemische eigenschappen van aminozuren op basis van de in het boek beschreven waardenStyers "Biochemie". Links - hydrofobiciteit. Rechts het vermogen om een ​​alfa-helix in een eiwit te vormen. Rode, gele en blauwe kleuren duiden aminozuren aan met een hoge, gemiddelde en lage hydrofobiciteit (links) of de overeenkomstige mate van vermogen om een ​​alfa-helix te vormen (rechts).

De eigenschap van blokkering en regelmaat kan ook worden verklaard door het feit dat tijdens de vormingsperiode de HA nieuwe codons inving die minimaal verschilden van de reeds gebruikte.

Codons met dezelfde eerste base (codonprefix) coderen voor aminozuren met vergelijkbare biosyntheseroutes. De codons van aminozuren die behoren tot de families shikimaat, pyruvaat, aspartaat en glutamaat hebben respectievelijk de voorvoegsels U, G, A en C. Voor de paden van de oude biosynthese van aminozuren en het verband met de eigenschappen van de moderne code, zie "Oude doublet genetische code werd vooraf bepaald door de routes voor de synthese van aminozuren. "Op basis van deze gegevens concluderen sommige onderzoekers dat de vorming van de code sterk werd beïnvloed door de biosynthetische relaties tussen aminozuren. De gelijkenis van biosynthetische routes betekent echter helemaal niet dat de overeenkomst van fysisch-chemische eigenschappen.

11. Geluidsimmuniteit. in de zeer algemeen beeld De ruisimmuniteit van GA betekent dat willekeurige puntmutaties en translatiefouten de fysisch-chemische eigenschappen van aminozuren niet veel veranderen.

De vervanging van één nucleotide in een triplet leidt in de meeste gevallen niet tot vervanging van het gecodeerde aminozuur, of leidt tot vervanging door een aminozuur met dezelfde polariteit.

Een van de mechanismen die de ruisimmuniteit van de GK garanderen, is de degeneratie ervan. De gemiddelde degeneratie is - aantal gecodeerde signalen/totaal aantal codons, waarbij gecodeerde signalen 20 aminozuren en het translatieterminatieteken omvatten. De gemiddelde degeneratie voor alle aminozuren en het terminatieteken is drie codons per gecodeerd signaal.

Om ruisimmuniteit te kwantificeren, introduceren we twee concepten. Mutaties van nucleotidesubstituties die niet leiden tot een verandering in de klasse van het gecodeerde aminozuur worden genoemd conservatief. Nucleotidesubstitutiemutaties die de klasse van het gecodeerde aminozuur veranderen, worden genoemd radicaal .

Elke triplet staat 9 enkele vervangingen toe. Er zijn in totaal 61 tripletten die coderen voor aminozuren.Daarom is het aantal mogelijke nucleotidesubstituties voor alle codons gelijk aan

61 x 9 = 549. Hiervan:

23 nucleotidesubstituties resulteren in stopcodons.

134 substituties veranderen het gecodeerde aminozuur niet.
230 substituties veranderen de klasse van het gecodeerde aminozuur niet.
162 substituties leiden tot een verandering in de aminozuurklasse, d.w.z. zijn radicaal.
Van de 183 substituties van het 3e nucleotide leiden 7 tot het verschijnen van translatiebeëindigers, en 176 zijn conservatief.
Van de 183 substituties van het 1e nucleotide leiden 9 tot het verschijnen van terminators, 114 zijn conservatief en 60 zijn radicaal.
Van de 183 substituties van het 2e nucleotide leiden 7 tot het verschijnen van terminators, 74 zijn conservatief en 102 zijn radicaal.

Op basis van deze berekeningen krijgen we: kwantificering ruisimmuniteit van de code, als de verhouding van het aantal conservatieve substituties tot het aantal radicale substituties. Het is gelijk aan 364/162 = 2,25

Bij een echte beoordeling van de bijdrage van degeneratie aan immuniteit tegen ruis, is het noodzakelijk om rekening te houden met de frequentie van voorkomen van aminozuren in eiwitten, die varieert in verschillende soorten.

Wat is de reden voor de ruisimmuniteit van de code? De meeste onderzoekers zijn van mening dat deze eigenschap een gevolg is van de selectie van alternatieve HA's.

Stephen Freeland en Lawrence Hurst genereerden willekeurig dergelijke codes en ontdekten dat slechts één van de honderd alternatieve codes niet minder ruisimmuniteit heeft dan de universele GC.
Nog meer interessant feit werd ontdekt toen deze onderzoekers een extra beperking introduceerden om rekening te houden met actuele trends in DNA-mutatiepatronen en translatiefouten. Onder dergelijke omstandigheden bleek SLECHTS ÉÉN CODE VAN EEN MILJOEN MOGELIJK beter te zijn dan de canonieke code.
Zo'n ongekende vitaliteit van de genetische code kan het gemakkelijkst worden verklaard door het feit dat deze is gevormd als gevolg van natuurlijke selectie. Misschien waren er ooit in de biologische wereld veel codes, elk met hun eigen gevoeligheid voor fouten. Het organisme dat er beter mee om kon gaan, had meer kans om te overleven, en de canonieke code won eenvoudigweg de strijd om het bestaan. Deze veronderstelling lijkt vrij realistisch - we weten immers dat er alternatieve codes bestaan. Voor meer informatie over ruisimmuniteit, zie Coded Evolution (S. Freeland, L. Hurst "Code Evolution". / / In the world of science. - 2004, No. 7).

Concluderend stel ik voor om het aantal mogelijke genetische codes te tellen dat kan worden gegenereerd voor 20 canonieke aminozuren. Om de een of andere reden is dit nummer nooit bij mij opgekomen. We moeten dus 20 aminozuren hebben en een stopsignaal gecodeerd door TEN MINSTE ÉÉN CODON in de gegenereerde GC's.

Mentaal zullen we de codons in een bepaalde volgorde nummeren. We zullen als volgt redeneren. Als we precies 21 codons hebben, zal elk aminozuur en elk stopsignaal precies één codon innemen. In dit geval zijn er 21 mogelijke GC's!

Als er 22 codons zijn, dan verschijnt er een extra codon, dat één van de 21 betekenissen kan hebben, en dit codon kan zich op elk van de 22 plaatsen bevinden, terwijl de overige codons precies één andere betekenis y hebben, zoals in het geval van 21 codons. Dan krijgen we het aantal combinaties 21!x(21x22).

Als er 23 codons zijn, dan krijgen we, op dezelfde manier argumenterend, dat 21 codons precies één verschillende betekenis van s hebben (21! opties), en twee codons hebben 21 verschillende betekenissen van a (21 2 betekenissen van s op een VASTE positie van deze codons). Het aantal verschillende posities voor deze twee codons zal 23x22 zijn. Totaal aantal GK-varianten voor 23 codons - 21!x21 2x23x22

Als er 24 codons zijn, dan is het aantal GC's 21!x21 3 x24x23x22, ...

....................................................................................................................

Als er 64 codons zijn, is het aantal mogelijke GC's 21!x21 43x64!/21! = 21 43x64! ~ 9.1x10 145

De genetische code van verschillende organismen heeft enkele gemeenschappelijke eigenschappen:
1) Drievoud. Om informatie vast te leggen, inclusief erfelijke informatie, wordt een bepaald cijfer gebruikt, waarvan het element een letter of symbool is. De verzameling van dergelijke symbolen vormt het alfabet. Individuele berichten worden geschreven als een combinatie van tekens die codegroepen of codons worden genoemd. Er is een alfabet bekend dat uit slechts twee tekens bestaat - dit is morsecode. Er zijn 4 letters in DNA - de eerste letters van de namen van stikstofbasen (A, G, T, C), wat betekent dat het genetische alfabet uit slechts 4 tekens bestaat. Wat is een codegroep, of, in een woord, een genetische code? Er zijn 20 basisaminozuren bekend, waarvan de inhoud in de genetische code moet worden geschreven, d.w.z. 4 letters moeten 20 codewoorden opleveren. Laten we zeggen dat het woord uit één teken bestaat, dan krijgen we slechts 4 codegroepen. Als het woord uit twee tekens bestaat, zijn er slechts 16 van dergelijke groepen, en dit is duidelijk niet genoeg om voor 20 aminozuren te coderen. Daarom moeten er minimaal 3 nucleotiden in het codewoord zitten, wat 64 (43) combinaties oplevert. Dit aantal tripletcombinaties is voldoende om alle aminozuren te coderen. Het codon van de genetische code is dus een triplet van nucleotiden.
2) Degeneratie (redundantie) - een eigenschap van de genetische code die enerzijds bestaat uit het feit dat het overbodige drielingen bevat, d.w.z. synoniemen, en anderzijds "betekenisloze" drielingen. Aangezien de code 64 combinaties omvat en er slechts 20 aminozuren worden gecodeerd, worden sommige aminozuren gecodeerd door verschillende tripletten (arginine, serine, leucine - zes; valine, proline, alanine, glycine, threonine - vier; isoleucine - drie; fenylalanine, tyrosine, histidine, lysine , asparagine, glutamine, cysteïne, asparaginezuur en glutaminezuur - twee; methionine en tryptofaan - één triplet). Sommige codegroepen (UAA, UAG, UGA) hebben helemaal geen semantische lading, d.w.z. het zijn "zinloze" drielingen. "Zinloze", of nonsens, codons fungeren als ketenafbrekers - leestekens in de genetische tekst - dienen als signaal voor het einde van de eiwitketensynthese. Een dergelijke coderedundantie is van groot belang voor het vergroten van de betrouwbaarheid van de overdracht van genetische informatie.
3) Niet-overlappend. Codedrietallen overlappen elkaar nooit, d.w.z. ze worden altijd samen uitgezonden. Bij het uitlezen van informatie van een DNA-molecuul is het onmogelijk om de stikstofbase van het ene triplet te gebruiken in combinatie met de basen van een ander triplet.
4) Uniciteit. Er zijn geen gevallen waarin hetzelfde triplet zou overeenkomen met meer dan één zuur.
5) De afwezigheid van onderscheidende karakters binnen het gen. De genetische code wordt zonder komma's vanaf een bepaalde plaats afgelezen.
6) Veelzijdigheid. Bij verschillende soorten levende organismen (virussen, bacteriën, planten, schimmels en dieren), coderen dezelfde tripletten dezelfde aminozuren.
7) Soortspecificiteit. Het aantal en de volgorde van stikstofbasen in de DNA-keten variëren van organisme tot organisme.

Gen- een structurele en functionele eenheid van erfelijkheid die de ontwikkeling van een bepaalde eigenschap of eigenschap regelt. Ouders geven tijdens de voortplanting een reeks genen door aan hun nakomelingen. Een grote bijdrage aan de studie van het gen werd geleverd door Russische wetenschappers: Simashkevich E.A., Gavrilova Yu.A., Bogomazova O.V. (2011)

Momenteel is in de moleculaire biologie vastgesteld dat genen delen van het DNA zijn die alle integrale informatie bevatten - over de structuur van één eiwitmolecuul of één RNA-molecuul. Deze en andere functionele moleculen bepalen de ontwikkeling, groei en het functioneren van het lichaam.

Tegelijkertijd wordt elk gen gekenmerkt door een aantal specifieke regulerende DNA-sequenties, zoals promotors, die direct betrokken zijn bij het reguleren van de expressie van het gen. Regulerende sequenties kunnen ofwel in de onmiddellijke nabijheid van het open leesraam dat codeert voor het eiwit, ofwel aan het begin van de RNA-sequentie, zoals het geval is bij promotors (de zogenaamde cis cis-regelgevende elementen), en op een afstand van vele miljoenen basenparen (nucleotiden), zoals in het geval van enhancers, isolatoren en suppressors (soms geclassificeerd als trans-regelgevende elementen transregulerende elementen). Het concept van een gen is dus niet beperkt tot het coderende gebied van DNA, maar is een breder concept dat regulerende sequenties omvat.

Oorspronkelijk de term gen verscheen als een theoretische eenheid voor de overdracht van discrete erfelijke informatie. De geschiedenis van de biologie herinnert zich discussies over welke moleculen drager kunnen zijn van erfelijke informatie. De meeste onderzoekers waren van mening dat alleen eiwitten zulke dragers kunnen zijn, omdat je door hun structuur (20 aminozuren) kunt creëren meer opties dan de structuur van DNA, dat uit slechts vier soorten nucleotiden bestaat. Later werd experimenteel bewezen dat het DNA is dat erfelijke informatie bevat, wat werd uitgedrukt als het centrale dogma van de moleculaire biologie.

Genen kunnen mutaties ondergaan - willekeurige of doelbewuste veranderingen in de volgorde van nucleotiden in de DNA-keten. Mutaties kunnen leiden tot een verandering in de sequentie, en dus een verandering in de biologische eigenschappen van een eiwit of RNA, wat op zijn beurt kan leiden tot een algemeen of lokaal veranderd of abnormaal functioneren van het organisme. Dergelijke mutaties zijn in sommige gevallen pathogeen, omdat hun resultaat een ziekte is, of dodelijk op embryonaal niveau. Niet alle veranderingen in de nucleotidesequentie leiden echter tot een verandering in de eiwitstructuur (door het effect van de degeneratie van de genetische code) of tot een significante verandering in de sequentie en zijn niet pathogeen. In het bijzonder wordt het menselijk genoom gekenmerkt door polymorfismen van één nucleotide en variaties in het aantal kopieën. kopie nummer variaties), zoals deleties en duplicaties, die ongeveer 1% van de volledige menselijke nucleotidesequentie uitmaken. Met name polymorfismen met één nucleotide definiëren verschillende allelen van hetzelfde gen.

De monomeren waaruit elke DNA-streng bestaat, zijn complex organische bestanddelen, inclusief stikstofbasen: adenine (A) of thymine (T) of cytosine (C) of guanine (G), een vijf-atoom suiker-pentose-deoxyribose, waarnaar het DNA zelf werd genoemd, evenals een fosforzuurresidu. Deze verbindingen worden nucleotiden genoemd.

gen eigenschappen

  1. discretie - onmengbaarheid van genen;
  2. stabiliteit - het vermogen om een ​​structuur te behouden;
  3. labiliteit - het vermogen om herhaaldelijk te muteren;
  4. meervoudig allelisme - veel genen bestaan ​​in een populatie in verschillende moleculaire vormen;
  5. allelisme - in het genotype van diploïde organismen, slechts twee vormen van het gen;
  6. specificiteit - elk gen codeert voor zijn eigen eigenschap;
  7. pleiotropie - meervoudig effect van een gen;
  8. expressiviteit - de mate van expressie van een gen in een eigenschap;
  9. penetrantie - de frequentie van manifestatie van een gen in het fenotype;
  10. amplificatie - een toename van het aantal kopieën van een gen.

Classificatie

  1. Structurele genen zijn unieke componenten van het genoom die een enkele coderende sequentie vertegenwoordigen bepaald eiwit of sommige soorten RNA. (Zie ook het artikel genen huishouden).
  2. Functionele genen - reguleren het werk van structurele genen.

Genetische code- een methode die inherent is aan alle levende organismen om de aminozuursequentie van eiwitten te coderen met behulp van een sequentie van nucleotiden.

In DNA worden vier nucleotiden gebruikt - adenine (A), guanine (G), cytosine (C), thymine (T), die in de Russische literatuur worden aangeduid met de letters A, G, C en T. Deze letters vormen het alfabet van de genetische code. In RNA worden dezelfde nucleotiden gebruikt, met uitzondering van thymine, dat wordt vervangen door een vergelijkbaar nucleotide - uracil, dat wordt aangeduid met de letter U (U in de Russische literatuur). In DNA- en RNA-moleculen liggen nucleotiden in ketens en zo worden sequenties van genetische letters verkregen.

Genetische code

Er zijn 20 verschillende aminozuren die in de natuur worden gebruikt om eiwitten te bouwen. Elk eiwit is een keten of meerdere ketens van aminozuren in een strikt gedefinieerde volgorde. Deze volgorde bepaalt de structuur van het eiwit, en dus al zijn biologische eigenschappen. De set aminozuren is ook universeel voor bijna alle levende organismen.

De implementatie van genetische informatie in levende cellen (dat wil zeggen, de synthese van een eiwit dat wordt gecodeerd door een gen) wordt uitgevoerd met behulp van twee matrixprocessen: transcriptie (dat wil zeggen, de synthese van mRNA op een DNA-sjabloon) en vertaling van de genetische code in een aminozuursequentie (synthese van een polypeptideketen op mRNA). Drie opeenvolgende nucleotiden zijn voldoende om 20 aminozuren te coderen, evenals het stopsignaal, wat het einde van de eiwitsequentie betekent. Een set van drie nucleotiden wordt een triplet genoemd. Geaccepteerde afkortingen die overeenkomen met aminozuren en codons worden in de figuur getoond.

Eigendommen

  1. drievoud- een significante eenheid van de code is een combinatie van drie nucleotiden (triplet of codon).
  2. Continuïteit- er staan ​​geen leestekens tussen de drielingen, dat wil zeggen dat de informatie continu wordt gelezen.
  3. niet overlappend- hetzelfde nucleotide kan niet tegelijkertijd deel uitmaken van twee of meer tripletten (niet waargenomen voor sommige overlappende genen van virussen, mitochondriën en bacteriën die coderen voor verschillende frameshift-eiwitten).
  4. Eenduidigheid (specificiteit)- een bepaald codon komt overeen met slechts één aminozuur (het UGA-codon in Euplotes crassus codes voor twee aminozuren - cysteïne en selenocysteïne)
  5. Degeneratie (redundantie) Meerdere codons kunnen overeenkomen met hetzelfde aminozuur.
  6. Veelzijdigheid- de genetische code werkt op dezelfde manier in organismen van verschillende niveaus van complexiteit - van virussen tot mensen (hierop zijn genetische manipulatiemethoden gebaseerd; er zijn een aantal uitzonderingen, weergegeven in de tabel in de "Variaties van de standaard genetische code " sectie hieronder).
  7. Ruisimmuniteit- mutaties van nucleotidesubstituties die niet leiden tot een verandering in de klasse van het gecodeerde aminozuur worden conservatief; nucleotidesubstitutiemutaties die leiden tot een verandering in de klasse van het gecodeerde aminozuur worden genoemd radicaal.

Eiwitbiosynthese en zijn stappen

Eiwitbiosynthese- een complex meertraps proces van synthese van een polypeptideketen uit aminozuurresiduen, dat voorkomt op de ribosomen van cellen van levende organismen met de deelname van mRNA- en tRNA-moleculen.

Eiwitbiosynthese kan worden onderverdeeld in stadia van transcriptie, verwerking en translatie. Tijdens transcriptie wordt de genetische informatie die is gecodeerd in DNA-moleculen gelezen en deze informatie wordt geschreven in mRNA-moleculen. Tijdens een reeks opeenvolgende stadia van verwerking worden enkele fragmenten die in volgende stadia niet nodig zijn, uit mRNA verwijderd en worden de nucleotidesequenties bewerkt. Nadat de code van de kern naar de ribosomen is getransporteerd, vindt de feitelijke synthese van eiwitmoleculen plaats door individuele aminozuurresiduen aan de groeiende polypeptideketen te hechten.

Tussen transcriptie en translatie ondergaat het mRNA-molecuul een reeks opeenvolgende veranderingen die zorgen voor de rijping van een functionerend sjabloon voor de synthese van de polypeptideketen. Aan het 5'-uiteinde is een dop bevestigd en aan het 3'-uiteinde een poly-A-staart, wat de levensduur van het mRNA verlengt. Met de komst van verwerking in een eukaryote cel, werd het mogelijk om gen-exons te combineren om een ​​grotere verscheidenheid aan eiwitten te verkrijgen die worden gecodeerd door een enkele DNA-nucleotidesequentie - alternatieve splicing.

Translatie bestaat uit de synthese van een polypeptideketen in overeenstemming met de informatie die wordt gecodeerd in boodschapper-RNA. De aminozuursequentie is gerangschikt met behulp van vervoer- RNA (tRNA), dat complexen vormt met aminozuren - aminoacyl-tRNA. Elk aminozuur heeft zijn eigen tRNA, dat een corresponderend anticodon heeft dat "matcht" met het mRNA-codon. Tijdens translatie beweegt het ribosoom langs het mRNA, terwijl de polypeptideketen zich opbouwt. Energie voor eiwitsynthese wordt geleverd door ATP.

Het afgewerkte eiwitmolecuul wordt vervolgens van het ribosoom gesplitst en naar de juiste plaats in de cel getransporteerd. Sommige eiwitten hebben aanvullende post-translationele modificatie nodig om hun actieve toestand te bereiken.

Dankzij het proces van transcriptie in een cel wordt informatie overgedragen van DNA naar eiwit: DNA - i-RNA - eiwit. De genetische informatie in DNA en mRNA zit in de sequentie van nucleotiden in moleculen. Hoe vindt de vertaling van informatie van de "taal" van nucleotiden naar de "taal" van aminozuren plaats? Deze vertaling wordt uitgevoerd met behulp van de genetische code. Een code, of cipher, is een systeem van symbolen om de ene vorm van informatie in een andere te vertalen. De genetische code is een systeem voor het vastleggen van informatie over de volgorde van aminozuren in eiwitten met behulp van de volgorde van nucleotiden in boodschapper-RNA. Hoe belangrijk de volgorde van dezelfde elementen (vier nucleotiden in RNA) is voor het begrijpen en bewaren van de betekenis van informatie, blijkt uit een eenvoudig voorbeeld: door de letters in de woordcode te herschikken, krijgen we een woord met een andere betekenis - doc. Wat zijn de eigenschappen van de genetische code?

1. De code is triplet. RNA bestaat uit 4 nucleotiden: A, G, C, U. Als we zouden proberen om één aminozuur aan te duiden met één nucleotide, dan zouden 16 van de 20 aminozuren onversleuteld blijven. Een tweeletterige code codeert voor 16 aminozuren (uit vier nucleotiden kunnen 16 verschillende combinaties worden gemaakt, die elk twee nucleotiden hebben). De natuur heeft een drieletterige of tripletcode gecreëerd. Dit betekent dat elk van de 20 aminozuren wordt gecodeerd door een reeks van drie nucleotiden die een triplet of codon worden genoemd. Van 4 nucleotiden kun je 64 verschillende combinaties van elk 3 nucleotiden maken (4*4*4=64). Dit is meer dan genoeg om voor 20 aminozuren te coderen en het lijkt erop dat 44 codons overbodig zijn. Dat is het echter niet.

2. De code is gedegenereerd. Dit betekent dat elk aminozuur wordt gecodeerd door meer dan één codon (twee tot zes). De uitzonderingen zijn de aminozuren methionine en tryptofaan, die elk door slechts één triplet worden gecodeerd. (Dit is te zien aan de tabel van de genetische code.) Het feit dat methionine wordt gecodeerd door één triplet OUT heeft een speciale betekenis, die u later duidelijk zal worden (16).

3. De code is eenduidig. Elk codon codeert slechts voor één aminozuur. Bij alle gezonde mensen, in het gen dat informatie bevat over de hemoglobine-bètaketen, het GAA- of GAG-triplet, codeert I, dat op de zesde plaats staat, voor glutaminezuur. Bij patiënten met sikkelcelanemie wordt het tweede nucleotide in dit triplet vervangen door U. Zoals uit de tabel blijkt, coderen de tripletten GUA of GUG, die in dit geval worden gevormd, voor het aminozuur valine. Waar zo'n vervanging toe leidt, weet je al uit de paragraaf over DNA.

4. Er zijn "leestekens" tussen genen. BIJ gedrukte tekst er is een punt aan het einde van elke zin. Verschillende verwante zinnen vormen een alinea. In de taal van genetische informatie is zo'n paragraaf een operon en zijn complementaire mRNA. Elk gen in het operon codeert voor één polypeptideketen - een frase. Aangezien in een aantal gevallen meerdere verschillende polypeptideketens achtereenvolgens langs de mRNA-template worden gecreëerd, moeten ze van elkaar worden gescheiden. Hiervoor zijn er drie speciale drielingen in de genetische code - UAA, UAG, UGA, die elk de stopzetting van de synthese van één polypeptideketen aangeven. Deze drielingen vervullen dus de functie van leestekens. Ze zitten aan het einde van elk gen. Er zijn geen "leestekens" in het gen. Aangezien de genetische code als een taal is, laten we deze eigenschap analyseren aan de hand van het voorbeeld van zo'n zin bestaande uit drielingen: de kat leefde rustig, die kat was boos op mij. De betekenis van wat er staat is duidelijk, ondanks het ontbreken van "leestekens". Als we één letter weglaten in het eerste woord (één nucleotide in het gen), maar we lezen ook in drietallen van letters, dan krijgen we onzin: ilb ylk ott ihb yls yls erm ilm no otk from komt ook voor als een of twee nucleotiden van het gen ontbreken. Het eiwit dat uit zo'n beschadigd gen wordt afgelezen, heeft niets te maken met het eiwit dat door het normale gen werd gecodeerd.

6. De code is universeel. De genetische code is hetzelfde voor alle wezens die op aarde leven. In bacteriën en schimmels, tarwe en katoen, vissen en wormen, kikkers en mensen coderen dezelfde drielingen voor dezelfde aminozuren.

keer bekeken