κατεύθυνση

Υπόδειγμα άσκησης στο κεφάλαιο 2 της βιολογίας κατεύθυνσης

Στο παρακάτω τμήμα DNA εντοπίστε:

α. το μήκος του διακεκομμένου γονιδίου (χωρίς τις αμετάφραστες περιοχές του)

β. τον κωδικό κλώνο του γονιδίου

γ. την αλληλουχία του εσωνίου, αν η ακολουθία αμινοξέων που κωδικοποιείται από το γονίδιο είναι:

met – gln – arg – val – asn – ala – pro – leu – leu – arg – his

5′ CCGAATGCAACGGGTAAATGCACGGCTTAGGTACAATCATTACTTAGACATTAGCCAGA 3′

3′ GGCTTACGTTGCCCATTTACGTGCCGAATCCATGTTAGTAATGAATCTGTAATCGGTCT 5′

 

Λύση…

Επειδή το γονίδιο κωδικοποιεί πεπτίδιο, είναι σίγουρο ότι στον κωδικό του κλώνο θα υπάρχει κωδικόνιο έναρξης (5′ ATG 3′) και κωδικόνιο λήξης (5′ TGA 3′ ή 5′ TAA 3′ ή 5′ TAG 3′). Παρά το γεγονός ότι ο γενετικός κώδικας είναι συνεχής και μη επικαλυπτόμενος κώδικας τριπλέτας, ο ενδιάμεσος αριθμός νουκλεοτιδίων δεν είναι απαραίτητα πολλαπλάσιος του τρία, λόγω της ύπαρξης του εσωνίου, το οποίο καλούμαστε να ανακαλύψουμε. Θα μας βοηθήσει σε αυτό η ακολουθία αμινοξέων που παρατίθεται παραπάνω.

Είναι γεγονός ότι όποιον κλώνο κι αν «διαβάσουμε» από το 5′ άκρο προς το 3′ άκρο, συναντάμε πιθανό κωδικόνιο έναρξης ATG. Το ίδιο ισχύει και για το κωδικόνιο λήξης. Εκείνο το στοιχείο, λοιπόν, που θα μας οδηγήσει στην ανακάλυψη του κωδικού κλώνου είναι η αντιστοίχιση κωδικονίων – αμινοξέων. Αμέσως μετά το κωδικόνιο έναρξης του άνω κλώνου υπάρχει η τριπλέτα CAA που κωδικοποιεί τη γλουταμίνη (gln), ενώ αμέσως μετά το κωδικόνιο έναρξης του κάτω κλώνου δεν υπάρχει τριπλέτα που να κωδικοποιεί το συγκεκριμένο αμινοξύ. Στο σημείο αυτό, θα μπορούσε κάλλιστα κάποιος να σκεφτεί πως αμέσως μετά το ATG του κάτω κλώνου ξεκινάει το εσώνιο του γονιδίου. Κάτι τέτοιο όμως δεν ισχύει, αφού πουθενά στη συνέχεια δε μπορούμε να εντοπίσουμε τριπλέτα CAA ή CAG (της γλουταμίνης), παρά μόνο αν υποθέσουμε πως υπάρχουν κι άλλα εσώνια. Η υπόθεση, όμως, αυτή είναι ασύμβατη με την εκφώνηση της άσκησης, η οποία διευκρινίζει πως το εσώνιο είναι μονάχα ένα. Άρα, ο κωδικός κλώνος είναι ο άνω.

Μετά το κωδικόνιο CAA, υπάρχει η τριπλέτα CGG. Αν κωδικοποιεί την αργινίνη (arg), τότε εξακολουθούμε να διαβάζουμε μέρος του πρώτου εξωνίου. Πράγματι, κωδικοποιεί το συγκεκριμένο αμινοξύ, οπότε «βαδίζουμε» ορθά. Κινούμενοι με τον ίδιο τρόπο, διαπιστώνουμε συμφωνία μεταξύ τριπλετών και αμινοξέων μέχρι και το αμινοξύ αλανίνη (ala). Στη συνέχεια, η τριπλέτα CGG δεν αντιστοιχεί στην προλίνη (pro). Άρα, κάπου εδώ ξεκινάει το εσώνιο, το οποίο αναζητούμε. Δεν πρέπει όμως, να ξεχνάμε πως τα εσώνια μπορεί να παρεμβάλονται ακόμα και εντός των κωδικονίων. Δηλαδή, δεν είναι απαραίτητο να ξεκινούν μετά την τρίτη βάση ενός κωδικονίου και να εκτείνονται μέχρι την πρώτη βάση του επόμενου κωδικονίου. Έτσι συμβαίνει κι εδώ. Το κωδικόνιο CCx της προλίνης (όπου x, οποιαδήποτε βάση) έχει την πρώτη του βάση πριν το εσώνιο και τις δύο επόμενες βάσεις του μετά το εσώνιο. Εδώ, γεννιέται αναπόφευκτα το ερώτημα σχετικά με το πού τελείωνει το εσώνιο; Αυτό θα το ανακαλύψουμε ψάχνοντας πού υπάρχει ο συνδυασμός (διάδα) μιας C (ως δεύτερη βάση του κωδικονίου προλίνης) με μια οποιαδήποτε επόμενη βάση (ως τρίτη βάση του κωδικονίου αυτού). Είναι λογικό ο συνδυασμός αυτός να υπάρχει σε αρκετά σημεία, πράγμα που οδηγεί σε σύγχυση. Η σύγχυση όμως αυτή παρακάμπτεται, αν σκεφτούμε πως η αμέσως επόμενη τριπλέτα πρέπει να κωδικοποιεί τη λευκίνη  (leu). Πρέπει, δηλαδή να είναι μία από τις TTA, TTG, CTT, CTA, CTC και CTG. Ο μόνος τρόπος για να ικανοποιηθεί κάτι τέτοιο είναι να θεωρήσουμε πως παρεμβάλεται, στον κωδικό κλώνο, εσώνιο με την αλληλουχία των 14 βάσεων GGCTTAGGTACAAT. Από ‘κει κι έπειτα, οι τριπλέτες ταιριάζουν με τα υπόλοιπα αμινοξέα, ενώ υπάρχει και το απαραίτητο κωδικόνιο λήξης (TAG) στο τέλος.

Αξίζει να σημειωθεί ότι ο πίνακας του γενετικού κώδικα παρουσιάζει τα κωδικόνια σε επίπεδο mRNA, ενώ στην εξήγηση της άσκησης χρησιμοποιούμε τα κωδικόνια σε επίπεδο (κωδικού κλώνου του) DNA. Αυτό, όμως, δεν αποτελεί πρόβλημα, επειδή η αλληλουχία τους είναι ίδια, με τη διαφορά ότι τοποθετούμε Τ όπου U.

Συμπερασματικά, το μήκος του γονιδίου (εξώνια και εσώνιο, συνολικά) είναι 50 ζεύγη βάσεων. Αναλυτικά, τα πρώτα 19 ζεύγη βάσεων αποτελούν το πρώτο εξώνιο, τα επόμενα 14 ζεύγη βάσεων αποτελούν το εσώνιο και τα τελευταία 17 ζεύγη βάσεων αποτελούν το δεύτερο εξώνιο (μαζί με το κωδικόνιο λήξης).

Όσο για την αλληλουχία του εσωνίου, αυτή είναι:

5’… GGCTTAGGTACAAT …3′

3’… CCGAATCCATGTTA …5′

 

Ο γενετικός κώδικας (στη “γλώσσα” του mRNA και με προσανατολισμό 5′ → 3′)

UUU

φαινυλαλανίνη

(phe)

UCU

σερίνη

(ser)

UAU

τυροσίνη

(tyr)

UGU

κυστεΐνη

(cys)

UUC

UCC

UAC

UGC

UUA

λευκίνη

(leu)

UCA

UAA

[λήξη]

UGA

[λήξη]

UUG

UCG

UAG

UGG

τρυπτοφάνη

(trp)

CUU

λευκίνη

(leu)

CCU

προλίνη

(pro)

CAU

ιστιδίνη

(his)

CGU

αργινίνη

(arg)

CUC

CCC

CAC

CGC

CUA

CCA

CAA

γλουταμίνη

(gln)

CGA

CUG

CCG

CAG

CGG

AUU

ισολευκίνη

(ile)

ACU

θρεονίνη

(thr)

AAU

ασπαραγγίνη

(asn)

AGU

σερίνη

(ser)

AUC

ACC

AAC

AGC

AUA

ACA

AAA

λυσίνη

(lys)

AGA

αργινίνη

(arg)

AUG

μεθειονίνη

(met) – [έναρξη]

ACG

AAG

AGG

GUU

βαλίνη

(val)

GCU

αλανίνη

(ala)

GAU

ασπαρτικό οξύ

(asp)

GGU

γλυκίνη

(gly)

GUC

GCC

GAC

GGC

GUA

GCA

GAA

γλουταμινικό οξύ

(glu)

GGA

GUG

GCG

GAG

GGG