Στο παρακάτω τμήμα DNA εντοπίστε:
α. το μήκος του διακεκομμένου γονιδίου (χωρίς τις αμετάφραστες περιοχές του)
β. τον κωδικό κλώνο του γονιδίου
γ. την αλληλουχία του εσωνίου, αν η ακολουθία αμινοξέων που κωδικοποιείται από το γονίδιο είναι:
met – gln – arg – val – asn – ala – pro – leu – leu – arg – his
5′ CCGAATGCAACGGGTAAATGCACGGCTTAGGTACAATCATTACTTAGACATTAGCCAGA 3′
3′ GGCTTACGTTGCCCATTTACGTGCCGAATCCATGTTAGTAATGAATCTGTAATCGGTCT 5′
Λύση…
Επειδή το γονίδιο κωδικοποιεί πεπτίδιο, είναι σίγουρο ότι στον κωδικό του κλώνο θα υπάρχει κωδικόνιο έναρξης (5′ ATG 3′) και κωδικόνιο λήξης (5′ TGA 3′ ή 5′ TAA 3′ ή 5′ TAG 3′). Παρά το γεγονός ότι ο γενετικός κώδικας είναι συνεχής και μη επικαλυπτόμενος κώδικας τριπλέτας, ο ενδιάμεσος αριθμός νουκλεοτιδίων δεν είναι απαραίτητα πολλαπλάσιος του τρία, λόγω της ύπαρξης του εσωνίου, το οποίο καλούμαστε να ανακαλύψουμε. Θα μας βοηθήσει σε αυτό η ακολουθία αμινοξέων που παρατίθεται παραπάνω.
Είναι γεγονός ότι όποιον κλώνο κι αν «διαβάσουμε» από το 5′ άκρο προς το 3′ άκρο, συναντάμε πιθανό κωδικόνιο έναρξης ATG. Το ίδιο ισχύει και για το κωδικόνιο λήξης. Εκείνο το στοιχείο, λοιπόν, που θα μας οδηγήσει στην ανακάλυψη του κωδικού κλώνου είναι η αντιστοίχιση κωδικονίων – αμινοξέων. Αμέσως μετά το κωδικόνιο έναρξης του άνω κλώνου υπάρχει η τριπλέτα CAA που κωδικοποιεί τη γλουταμίνη (gln), ενώ αμέσως μετά το κωδικόνιο έναρξης του κάτω κλώνου δεν υπάρχει τριπλέτα που να κωδικοποιεί το συγκεκριμένο αμινοξύ. Στο σημείο αυτό, θα μπορούσε κάλλιστα κάποιος να σκεφτεί πως αμέσως μετά το ATG του κάτω κλώνου ξεκινάει το εσώνιο του γονιδίου. Κάτι τέτοιο όμως δεν ισχύει, αφού πουθενά στη συνέχεια δε μπορούμε να εντοπίσουμε τριπλέτα CAA ή CAG (της γλουταμίνης), παρά μόνο αν υποθέσουμε πως υπάρχουν κι άλλα εσώνια. Η υπόθεση, όμως, αυτή είναι ασύμβατη με την εκφώνηση της άσκησης, η οποία διευκρινίζει πως το εσώνιο είναι μονάχα ένα. Άρα, ο κωδικός κλώνος είναι ο άνω.
Μετά το κωδικόνιο CAA, υπάρχει η τριπλέτα CGG. Αν κωδικοποιεί την αργινίνη (arg), τότε εξακολουθούμε να διαβάζουμε μέρος του πρώτου εξωνίου. Πράγματι, κωδικοποιεί το συγκεκριμένο αμινοξύ, οπότε «βαδίζουμε» ορθά. Κινούμενοι με τον ίδιο τρόπο, διαπιστώνουμε συμφωνία μεταξύ τριπλετών και αμινοξέων μέχρι και το αμινοξύ αλανίνη (ala). Στη συνέχεια, η τριπλέτα CGG δεν αντιστοιχεί στην προλίνη (pro). Άρα, κάπου εδώ ξεκινάει το εσώνιο, το οποίο αναζητούμε. Δεν πρέπει όμως, να ξεχνάμε πως τα εσώνια μπορεί να παρεμβάλονται ακόμα και εντός των κωδικονίων. Δηλαδή, δεν είναι απαραίτητο να ξεκινούν μετά την τρίτη βάση ενός κωδικονίου και να εκτείνονται μέχρι την πρώτη βάση του επόμενου κωδικονίου. Έτσι συμβαίνει κι εδώ. Το κωδικόνιο CCx της προλίνης (όπου x, οποιαδήποτε βάση) έχει την πρώτη του βάση πριν το εσώνιο και τις δύο επόμενες βάσεις του μετά το εσώνιο. Εδώ, γεννιέται αναπόφευκτα το ερώτημα σχετικά με το πού τελείωνει το εσώνιο; Αυτό θα το ανακαλύψουμε ψάχνοντας πού υπάρχει ο συνδυασμός (διάδα) μιας C (ως δεύτερη βάση του κωδικονίου προλίνης) με μια οποιαδήποτε επόμενη βάση (ως τρίτη βάση του κωδικονίου αυτού). Είναι λογικό ο συνδυασμός αυτός να υπάρχει σε αρκετά σημεία, πράγμα που οδηγεί σε σύγχυση. Η σύγχυση όμως αυτή παρακάμπτεται, αν σκεφτούμε πως η αμέσως επόμενη τριπλέτα πρέπει να κωδικοποιεί τη λευκίνη (leu). Πρέπει, δηλαδή να είναι μία από τις TTA, TTG, CTT, CTA, CTC και CTG. Ο μόνος τρόπος για να ικανοποιηθεί κάτι τέτοιο είναι να θεωρήσουμε πως παρεμβάλεται, στον κωδικό κλώνο, εσώνιο με την αλληλουχία των 14 βάσεων GGCTTAGGTACAAT. Από ‘κει κι έπειτα, οι τριπλέτες ταιριάζουν με τα υπόλοιπα αμινοξέα, ενώ υπάρχει και το απαραίτητο κωδικόνιο λήξης (TAG) στο τέλος.
Αξίζει να σημειωθεί ότι ο πίνακας του γενετικού κώδικα παρουσιάζει τα κωδικόνια σε επίπεδο mRNA, ενώ στην εξήγηση της άσκησης χρησιμοποιούμε τα κωδικόνια σε επίπεδο (κωδικού κλώνου του) DNA. Αυτό, όμως, δεν αποτελεί πρόβλημα, επειδή η αλληλουχία τους είναι ίδια, με τη διαφορά ότι τοποθετούμε Τ όπου U.
Συμπερασματικά, το μήκος του γονιδίου (εξώνια και εσώνιο, συνολικά) είναι 50 ζεύγη βάσεων. Αναλυτικά, τα πρώτα 19 ζεύγη βάσεων αποτελούν το πρώτο εξώνιο, τα επόμενα 14 ζεύγη βάσεων αποτελούν το εσώνιο και τα τελευταία 17 ζεύγη βάσεων αποτελούν το δεύτερο εξώνιο (μαζί με το κωδικόνιο λήξης).
Όσο για την αλληλουχία του εσωνίου, αυτή είναι:
5’… GGCTTAGGTACAAT …3′
3’… CCGAATCCATGTTA …5′
Ο γενετικός κώδικας (στη “γλώσσα” του mRNA και με προσανατολισμό 5′ → 3′) |
|||||||
UUU |
φαινυλαλανίνη (phe) |
UCU |
σερίνη (ser) |
UAU |
τυροσίνη (tyr) |
UGU |
κυστεΐνη (cys) |
UUC |
UCC |
UAC |
UGC |
||||
UUA |
λευκίνη (leu) |
UCA |
UAA |
[λήξη] |
UGA |
[λήξη] |
|
UUG |
UCG |
UAG |
UGG |
τρυπτοφάνη (trp) |
|||
CUU |
λευκίνη (leu) |
CCU |
προλίνη (pro) |
CAU |
ιστιδίνη (his) |
CGU |
αργινίνη (arg) |
CUC |
CCC |
CAC |
CGC |
||||
CUA |
CCA |
CAA |
γλουταμίνη (gln) |
CGA |
|||
CUG |
CCG |
CAG |
CGG |
||||
AUU |
ισολευκίνη (ile) |
ACU |
θρεονίνη (thr) |
AAU |
ασπαραγγίνη (asn) |
AGU |
σερίνη (ser) |
AUC |
ACC |
AAC |
AGC |
||||
AUA |
ACA |
AAA |
λυσίνη (lys) |
AGA |
αργινίνη (arg) |
||
AUG |
μεθειονίνη (met) – [έναρξη] |
ACG |
AAG |
AGG |
|||
GUU |
βαλίνη (val) |
GCU |
αλανίνη (ala) |
GAU |
ασπαρτικό οξύ (asp) |
GGU |
γλυκίνη (gly) |
GUC |
GCC |
GAC |
GGC |
||||
GUA |
GCA |
GAA |
γλουταμινικό οξύ (glu) |
GGA |
|||
GUG |
GCG |
GAG |
GGG |