@ seeker
Es sind durchaus ganz verschiedene Varianten denkbar.
Im Bereich der Synthetischen Biologie wird auch mit
Alternativen zur natürlichen DNA gearbeitet. Konkret sind das andere Basen, andere Komponenten als Desoxyribose (bzw. Ribose bei RNA) und Phosphat für den Strang sowie Erweiterungen der Codon-Zahl, um mehr als nur 20 Aminosäuren zu codieren.
Grundsätzlich legt der genetische Code fest, über welche Basentripletts welche Aminosäure repräsentiert wird. Zunächst müssen es nicht Basentripletts sein, sondern es könnten auch Basendupletts sein oder Basenquadrupletts, also jeweils immer nur 2 Basen oder 4 Basen, statt 3. Abhängig ist das von der Struktur der Moleküle, die bei der Codierung beteiligt sind. In der natürlichen Variante sind das die entsprechenden
tRNAs sowie die zugehörigen aaRS, die sich so an die tRNAs anlagern, dass sie zur
Anticodonschleife der tRNA passen wie auch zu der Aminosäure, die dann verknüpft werden soll.
Wäre die tRNA anders geformt, könnte die Anticodonschleife größer sein, so dass entweder 4 Basen komplett den Ausschlag geben, welche aaRS welche Aminosäure verknüpft (das wäre dann ein vierbasiger Code), oder die zwei mittleren Basen geben den Ausschlag, werden aber links und rechts von einer weiteren Base flankiert, die für die Codierung bedeutungslos sind. Dann hätten wir einen zweibasigen Code mit zwei "Kommas".
Der vierbasige Code ohne "Komma" hätte 4 mal 4 mal 4 mal 4 Quadrupletts, die mit Aminosäuren zu belegen wären, also insgesamt 256 Positionen. Das erscheint recht viel. Selbst wenn man annimmt, dass jede Aminosäure vierfach redundant im Code vertreten ist, wären es immer noch 64 Aminosäuren, die spezifisch zu erkennen und zu verknüpfen wären. Rechnen wir noch die Stoppstellen ab, bleiben noch 62 oder 63 verschiedene Aminosäuren, aus denen sich dann Proteine zusammensetzen würden. Der Aufwand scheint mir recht hoch zu sein, zumal sich viele Aminosäuren in ihren Seitenketten und damit in ihren chemischen Eigenschaften ähneln dürften.
Ein zweibasiger Code hätte nur 4 mal 4 Dupletts, also lediglich 16 Positionen, die besetzt werden könnten. Das erscheint ziemlich wenig, da wir noch Stoppstellen abziehen müssen und zudem keine Redundanz gegeben wäre, die für die Störanfälligkeit wichtig wäre. Es gingen also maximal 15 Aminosäuren zu codieren, aber aus Redundanzgründen wären maximal 10 Aminosäuren codiert, um Proteine mit einer gewissen Störtoleranz zu produzieren, was dann doch recht wenig zu sein scheint.
Ich vermute daher, dass die Variante mit vier Basen und einem Triplett-Code ein Optimum darstellt, um den Grat zwischen Stabilität und Variabilität so hinzukriegen, dass eine langwährende Evolution möglich wird.