Bioinformatica A.A. 2006/2007 - Dipartimento di Matematica e

Report
Bioinformatica
Corso di Laurea specialistica in Informatica
Traduzione e Proteine
23/04/2011
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cenni sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cenni sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
Il flusso dell’informazione genica
Il dogma centrale della biologia
•L’informazione genica è contenuta nel DNA
•Questa informazione è perpetuata nelle generazioni future tramite il processo
semiconservativo chiamato duplicazione del DNA
•L’espressione della informazione genica è invece un processo che passa attraverso
un intermediario transitorio: l’RNA messaggero. Questa molecola è sintetizzata sulla
base di uno STAMPO sul DNA e l’informazione in esso contenuta serve per dirigere
la sintesi di proteine.
•L’informazione passa (quasi) sempre dal DNA all’RNA e da questo alle proteine.
Mantenimento dell’informazione
DNA
Trasferimento dell’informazione
Trascrizione
Retrotrascrizione
RNA
Traduzione
Informazione contenuta nella
Informazione contenuta nella
Effettuata da alcuni virus sequenza
a RNA
sequenza
e nella quantità
chiamati retrovirus
Ruolo funzionale
Proteina
Informazione contenuta nella
struttura e nella quantità
Il flusso dell’informazione genica
Il viaggio dell’RNA messaggero
•L’RNA messaggero è sintetizzato nel nucleo a partire da uno stampo di DNA. Solo
un gene (eucarioti) o pochi geni (procarioti) alla volta vengono copiati su una
molecola di RNA
•Negli eucarioti l’RNA messaggero viene processato con
•L’aggiunta del CAP al 5’
•L’aggiunta della coda di poliA al 3’
•L’eliminazione degli introni (splicing)
•L’RNA maturo viene trasportato fuori dal nucleo nel citoplasma
•Nel citoplasma interagisci con gli organelli citoplasmatici deputati alla sintesi
proteica (i ribosomi)
•I ribosomi sintetizzano una catena proteica lineare aggiungendo uno per uno gli
aminoacidi necessari sulla base delle istruzioni contenute nella molecola di mRNA
•Esaurito il suo compito l’mRNA viene degradato rapidamente
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cenni sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
Le proteine – Natura ed informazione
• Le proteine sono macromolecole polimeriche. I costituenti delle
proteine sono gli aminoacidi.
• Gli aminoacidi sono molecole caratterizzate dalla presenza di un
gruppo aminico (basico) ed un gruppo acido che costituiscono
la parte costante della molecola e da un “residuo” variabile che
conferisce ad ogni aminoacido caratteristiche diverse.
• Il gruppo acido di un aminoacido ed il gruppo basico
dell’aminoacido successivo si uniscono tra loro tramite un
legame covalente forte chiamato legame peptidico. La
ripetizione lineare di questi legami peptidici costituisce lo
“scheletro” della catena polipeptidica.
• I “residui”, che costituiscono la parte variabile, possono
interagire tra loro. Residui appartenenti ad aminoacidi distanti
tra loro possono interagire tramite legami deboli portando ad
un “ripiegamento” della catena lineare della proteina. Queste
interazioni sono alla base della struttura 3d della proteina.
Le proteine – Natura ed informazione
Gli aminoacidi
Esistono 20 diversi aminoacidi
che combinati tra loro
costituiscono tutte le
proteine contenute negli
organismi viventi. Questi
aminoacidi hanno struttura
chimica e proprietà diverse.
Le proteine – Natura ed informazione
Gli aminoacidi
Sulla base delle caratteristiche del
loro gruppo R gli aminoacidi
possono essere:
• Idrofobici
• Polari
• Acidi
• Basici
• Aromatici
• Piccoli
Le interazioni tra gli aminoacidi, e
quindi la struttura 3d finale
della protena, saranno
influenzate dalle caratteristiche
chimiche degli stessi. Un
aminoacido acido ed uno
basico tendono ad interagire
tra loro, mentre uno polare ed
uno idrofobico no.
Le proteine – Natura ed informazione
Le proteine – Natura ed informazione
Le sequenze proteiche. L’informazione
Così come già visto per le sequenze di DNA o RNA, che vengono
rappresentate come stringhe composte dal susseguirsi di 4 possibili
caratteri che corrispondono ai 4 possibili nucleotidi, anche le
sequenze proteiche possono essere rappresentate da stringhe. In
questo caso i possibili aminoacidi sono 20 e di conseguenza anche
l’alfabeto utilizzatò nelle sequenze proteiche è costituito da (almeno)
20 caratteri.
HQVKVQGCWGRWRWQEFENAEGDEYAADLAQGSPATAAQNGPDVYVLPLTEVSLPMAKQPGRSVQLLKSTDVGRHSL
LYLKEIGRGWFGKVFLGEVNSGISSAQVVVKELQASASVQEQMQFLEEVQPYRALKHSNLLQCLAQCAEVTPYLLVMEFC
PLGDLKGYLRSCRVAESMAPDPRTLQRMACEVACGVLHLHRNNFVHSDLALRNCLLTADLTVKIGDYGLAHCKYREDYFV
TADQLWVPLRWIAPELVDEVHSNLLVVDQTKSGNVWSLGVTIWELFELGTQPYPQHSDQQVLAYTVREQQLKLPKPQLQL
TLSDRWYEVMQFCWLQPEQRPTAEEVHLLLSYLCAKGATEAEEEFERRWRSLRPGGGGVGPGPGAAGPMLGGVVELA
AASSFPLLEQFAGDGFHADGDDVLTVTETSRGLNFEYKWEAGRGAEAFPATLSPGRTARLQELCAPDGAPPGVVPVLSA
HSPSLGSEYFIRLEEAAPAAGHDPDCAGCAPSPPATADQDDDSDGSTAASLAMEPLLGHGPPVDVPWGRGDHYPRRSLA
RDPLCPSRSPSPSAGPLSLAEGGAEDADWGVAAFCPAFFEDPLGTSPLGSSGAPPLPLTGEDELEEVGARRAAQRGHW
RSNVSANNNSGSRCPESWDPVSAGCHAEGCPSPKQTPRASPEPGYPGEPLLGLQAASAQEPGCCPGLPHLCSAQGLA
PAPCLVTPSWTETASSGGDHPQAEPKLATEAEGTTGPRLPLPSVPSPSQEGAPLPSEEASAPDAPDALPDSPTPATGGEV
SAIKLASALNGSSSSPEVEAPSSEDEDTAEATSGIFTDTSSDGLQARRPDVVPAFRSLQKQVGTPDSLDSLDIPSSASDGG
YEVFSPSATGPSGGQPRALDSGYDTENYESPEFVLKEAQEGCEPQAFAELASEGEGPGPETRLSTSLSGLNEKNPYRDS
AYFSDLEAEAEATSGPEKKCGGDRAPGPELGLPSTGQPSEQVCLRPGVSGEAQGSGPGEVLPPLLQLEGSSPEPSTCPS
GLVPEPPEPQGPAKVRPGPSPSCSQFFLLTPVPLRSEGNSSEFQGPPGLLSGPAPQKRMGGPGTPRAPLRLALPGLPAA
LEGRPEEEEEDSEDSDESDEELRCYSVQEPSEDSEEEAPAVPVVVAESQSARNLRSLLKMPSLLSETFCEDL
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cennu sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
Il codice genetico
La necessità di codificare l’informazione
• L’informazione genica passa del DNA all’RNA. L’informazione
contenuta in queste molecole è simile, ed il meccanismo di
trasmissione dell’informazione (la complementarietà delle basi)
permette di copiare l’informazione del DNA sull’RNA utilizzando lo
stesso alfabeto (con l’eccezione dell’utilizzo dell U al posto della T)
AATGTATTC
TTACATAAG
AAUGUAUUC
TTACATAAG
• Nel passaggio da RNA a proteina il tipo di informazione cambia
notevolmente. Si deve passare da un alfabeto chimico basato su 4
diversi nucleotidi ad un alfabeto chimico basato su 20 diverse
aminoacidi.
• L’impossibilità di mantenere una corrispondeza univoca tra nucleotide
ed aminoacido impone l’utilizzo di una codifica
Il codice genetico
La necessità di codificare l’informazione
• Se ci fosse una corrispondenza 1 a 1 tra nucleotide ed aminoacido si
potrebbero utilizzare soltanto 4 aminoacidi per costruire una proteina.
• Se la corrispondenza fosse 2 ad 1 si potrebbero specificare 16 (4*4)
aminoacidi. Sfortunatamente gli aminoacidi sono 20: sono quindi
necessari 3 nucleotidi per identificare tutti gli aminoacidi esistenti.
• Le possibili combinazioni di 3 nucleotidi sono 64 (4*4*4). Poichè gli
aminoacidi sono solo 20 esiste una surplus informativo di 44 triplette.
• La “tabella” n*m che mette in relazione le 64 possibili triplette di
nucleotidi e i 20 aminoacidi è chiamata “codice genetico”.
• Il codice genetico è universale: una tripletta codifica lo stesso
aminoacido in (quasi) tutti gli organismi viventi.
• Le triplette di nucleotidi sull’mRNA vengono chiamate CODONI
Il codice genetico
Il fenomeno per il quale
esistono diverse triplette
che codificano per lo
stesso aminoacido è
definito come
“degenerazione del
codice”
La maggior parte degli
aminoacidi è codificata
da 2 o più triplette. La
metionina è codificata
solo dal codone AUG
che rappresenta anche il
codone di inizio della
sintesi proteica. I codoni
UGA UAA e UAG sono
chiamati codoni di
STOP. Ad essi con
corrisponde nessun
aminoacido ma
rappresentano i segnali
di terminazione per la
sintesi proteica.
SECOND
U
F
I U
R
S C
T
B A
A
S G
E
UUU
UUC
UUA
UUG
CUU
CUC
CUA
CUG
Phe
Leu
Leu
C
UCU
UCC
UCA
UCG
CCU
CCC
CCA
CCG
AUU
AUC Ile
AUA
AUGMet/start
ACU
ACC
ACA
ACG
GUU
GUC
GUA
GUG
GCU
GCC
GCA
GCG
Val
BASE
A
Ser
UAU
UAC
UAA
UAG
Tyr
Pro
CAU
CAC
CAA
CAG
His
Thr
AAU
AAC
AAA
AAG
Asn†
Ala
GAU
GAC
GAA
GAG
Asp
Stop
Gln†
Lys
Glu
G
UGU
UGC
UGA
UGG
CGU
CGC
CGA
CGG
AGU
AGC
AGA
AGG
GGU
GGC
GGA
GGG
Cys
Stop
Trp
U
C
A
G
Arg
U
C
A
G
Ser
Arg
Gly*
U
C
A
G
U
C
A
G
T
H
I
R
D
B
A
S
E
Il codice genetico
Le conseguenze della degenerazione del codice
•E’ sempre possibile passare dall’informazione contenuta nei nucleotidi alla
corrispondente sequenza proteica: ad ogni tripletta può essere associato uno ed un solo
aminoacido.
•Non è mai possibile ottenere, in modo univoco, una sequenza nucleotidica a partire
dalla sequenza proteica da essa generata
Sequenza proteica
AUG
MEFGLKEFLLNPSTPEGKLTPQRQTNPVWYACAWA
GAG
UUU
GGA
GAA
UUC
GGC
GGG
GGU
La retrotraduzione non è risolvibile in
maniera esatta e non può essere
dedotta dai sistemi biologici.
Il codice genetico
Il vacillamento della terza base
I CODONI CHE RAPPRESENTANO LO STESSO A.A., O A.A.
CORRELATI, HANNO SEQUENZE SIMILI.
SPESSO LA BASE CHE OCCUPA LA TERZA POSIZIONE DEL CODONE
NON E’ SIGNIFICATIVA, COME DIMOSTRA IL FATTO CHE NEI
GRUPPI DI 4 CODONI CHE RAPPRESENTANO LO STESSO A.A., SOLO
LA TERZA BASE E’ DIFFERENTE.
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cennu sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
La traduzione
La sintesi proteica viene chiamata anche traduzione poiché
durante questo processo l’informazione contenuta nell’RNA
messaggero viene tradotta utilizzando il codice genetico in una
sequenza di aminoacidi.
Durante la traduzione l’mRNA interagisce con i macchinari
molecolari deputati alla sintesi delle proteine: i RIBOSOMI.
I ribosomi sono complessi formati da proteine ed RNA
ribosomiale. L’RNA ribosomiale ha funzione strutturale ma
anche catalitica.
Nel ribosoma delle particolari molecole di RNA chiamate RNA
transfer (tRNA) traducono l’informazione dell’RNA messaggero
in sequenza aminoacidica. Sono degli accoppiatori molecolari:
da una parte hanno le funzioni molecolari per interagire con
l’RNA mentre dall’altra parte trasportano aminoacidi specifici.
La traduzione
I Ribosomi
IL RIBOSOMA E’ UNO DEI TANTI MACCHINARI CELLULARI.
E’ costituito da RNA (rRNA) E PROTEINE (DETTE, PER L’APPUNTO, RIBOSOMALI).
I RIBOSOMI CONSTANO DI DUE “SUBUNITA’”:
•SUBUNITA’ MAGGIORE (IMPLICATA NELLA FORMAZIONE DEI LEGAMI PEPTIDICI);
•SUBUNITA’ MINORE (DOVE I tRNA SI “ADATTANO” AI CODONI DELL’mRNA).
CIASCUNA SUBUNITA’ E’ UN AGGREGATO DI rRNA E PROTEINE RIBOSOMALI.
La traduzione
I Ribosomi
QUANDO NON STANNO SINTETIZZANDO ATTIVAMENTE PROTEINE, LE DUE SUBUNITA’
DEI RIBOSOMI SONO SEPARATE.
ESSE SI UNISCONO INSIEME SU UNA MOLECOLA DI mRNA IN GENERE VICINO
ALLA SUA ESTREMITA’ 5’ PER INIZIARE LA SINTESI PROTEICA.
La traduzione
I tRNA
Sono molecole adattatrici che legano e trasportano aminoacidi
specifici.
Due porzioni particolarmente importanti sono:
• ANTICODONE : sequenza di 3
nucleotidi complementari al codone
corrispondente all’aminoacido legato al
tRNA.
• Sito di attacco dell’aa. : sequenza 5’CCA-3’, uguale in tutti tRNA.
MET
La traduzione
I tRNA
L’anticodone si appaia in maniera specifica al codone sull’mRNA in modo
da permettere al tRNA di trasportare l’aminoacido corrispindente
quando questo viene richiesto dalla informazione contenuta sul
messaggero
MET
AUG
La traduzione
Quanti sono i tRNA?
UNA LOGICA DEDUZIONE PER QUANTO DETTO FIN’ORA E’ CHE DOVREBBERO ESSERCI 61
tRNA DIVERSI, UNO PER CIASCUN CODONE; CIO’ IMPLICHEREBBE DUE COSE:
1. GRANDE CONSUMO ENERGETICO DA PARTE DELLA CELLULA;
2. tRNA AVENTI ANTICODONI DIFFERENTI DEVONO PORTARE LO STESSO aa.
IN REALTA’ QUESTA CONDIZIONE E’ VERA SOLO PER ALCUNI tRNA, PER LA MAGGIORPARTE
(NELL’UOMO ESISTONO INFATTI SOLO 48 ANTICODONI DIFFERENTI A FRONTE DEI TEORICI 61
POSSIBILI), PERO’, SUSSISTE IL FENOMENO DEL “VACILLAMENTO” DELLA TERZA BASE, PER CUI SI
POSSONO FORMARE LEGAMI ANCHE “NON ORTODOSSI” FRA IL NUCLEOTIDE IN POSIZIONE 5’
DEL tRNA E IL NUCLEOTIDE IN 3’ DELL’mRNA.
La traduzione
Le fasi della traduzione
1) Inizio: la subunità minore del ribosoma si lega al messaggero. Il primo tRNA (quello della
fMET) con anticodone complementare alla tripletta AUG, che rappresenta il segnale di inizio, si
lega in corrispondeza del codone. Questo scatena il legame della subunità maggiore e l’inzio
della traduzione.
2) Allungamento: il ribosoma si sposta in direzione 3’ sul mRNA. I tRNA si legano uno dopo
l’altro ai codoni che via via vengono incontrati dal ribosoma mentre “legge” il filamento
ribonucleotidico. Il ribosoma catalizza di volta in volta il legame tra l’aminoacido già presente
all’interno del sito attivo ed il nuovo aminoacido appena entrato nel ribosoma allungando la
catena proteica nascente di un aminoacido alla volta.
3) Terminazione: Quando il ribosoma incontra un segnale di stop nessun tRNA si lega al sito
attivo del ribosoma. Si lagano invece specifici fattori di terminazione proteici che interrompono
la traduzione e facilitano la destabilizzazione del complesso.
La traduzione
L’inizio della traduzione
La traduzione inizia col riconoscimento
dell’mRNA da parte della subunità minore.
Il legame del tRNA della fMET (con
anticodone complementare ad AUG)
permette il legame della subunità maggiore.
fMet
Large
subunit
E
P
A
UAC
5’GAG...CU-AUG--UUC--CUU--AGU--GGU--AGA--GCU--GUA--UGA-AT GCA...TAAAAAA
Small mRNA
subunit
3’
La traduzione
La fase di allungamento
Un nuovo aminoacil tRNA
(complesso tra tRNA ed il suo
aminoacido corrispondente)
entra nel sito A del ribosoma. Il
suo anticodone è
complementare al codone che
si trova in corrispondenza del
sito A. Il primo aminoacido (la
metionina) presente nel sito P
si troverà quindi vicino ad un
nuovo aminoacido appena
trasportato dal suo tRNA. La
subunità maggiore del
ribosoma catalizza il legame di
questo nuovo aminoacodo con
la metionina. Il legame della
metionina con il suo tRNA viene
rotto.
La traduzione
La fase di allungamento
A questo punto abbiamo un tRNA “scarico” nel sito P,
un tRNA legato alla catena nascente (di due
aminoacidi, al momento) nel sito A. Il ribosoma si
sposta a sinistra sull’mRNA: il tRNA vuoto viene
liberato nel citoplasma, il tRNA legato a 2 aminoacidi
viene spostato nel sito P ed il sito A è di nuovo
disponobile per l’attacco di un nuovo aminoacil-tRNA.
Il processo viene iterato allungando ogni volta la
catena nascente di un aminoacido, seguendo le
istruzioni scritte sul messaggero.
La traduzione
La fine della traduzione
Quando il ribosoma, legato alla catena proteica
nascente, raggiunge un codone di stop, invece di un
aminoacil-tRNA, nel sito A si lega un fattore di
terminazione. La proteina nascente lascia il suo tRNA,
il ribosoma si destabilizza e la sintesi della proteina
finisce.
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cenni sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
Il folding delle proteine
Le strutture delle proteine
Abbiamo visto come le proteine vengono sintetizzate
come lunghe catene lineari. La mera sequenza di
aminoacidi della proteina viene definita “struttura
primaria”. Ma gli aminoacidi di una proteina possono
andare incontro ad interazioni che ne influenzano il
ripiegamento nello spazio. La forma di una proteina
ne influenzerà la funzione
Il folding delle proteine
I 4 livelli strutturali delle proteine
• Struttura primaria: sequenza di aminoacidi
• Struttura secondaria: formazione di ripiegamenti
regolari locali (alfa elica o foglietto beta)
• Struttura terziaria: formazione di una conformazione
tridimensionale definitiva per interazione di più
strutture globali
• Struttura quaternaria: interazione tra diversi
polipeptidi (subunità) per la formazione di un
complesso proteico completo e funzionale.
Il folding delle proteine
SPESSO IN UN PEPTIDE SI TROVANO DUE SCHEMI REGOLARI DI
RIPIEGAMENTO:
•L’ α-ELICA E
•IL FOGLIETTO β.
ENTRAMBI DERIVANO DALLA FORMAZIONE DI LEGAMI H FRA I GRUPPI N-H E
C=O DELL’OSSATURA POLIPEPTIDICA, SENZA COINVOLGERE LE CATENE
LATERALI DEGLI aa.
Il folding delle proteine
α-ELICA
SI FORMA QUANDO UNA SIGOLA CATENA POLIPEPTIDICA SI AVVOLGE SU SE STESSA PER FORMARE
UN CILINDRO RIGIDO: IN PARTICOLARE SI INSTAURA UN LEGAME H FRA UN LEGAME PEPTIDICO E IL
QUARTO SUCCESSIVO; SI GENERA COSI’ UN’ELICA REGOLARE DI PASSO UGUALE A 3,6 aa (CIOE’ 5,4Å)
.
TIPICAMENTE, BREVI REGIONI AD α-ELICA SONO ABBONDANTI IN PROTEINE POSTE NELLE MEMBRANE
CELLULARI (ES.: PROTEINE DI TRASPORTO E RECETTORI); IN ALTRE PROTEINE α-ELICHE SI
AVVOLGONO L’UNA INTORNO ALL’ALTRA PER FORMARE STRUTTURE STABILI NOTE COME “COILEDCOIL”.
(ES.: α-CHERATINA O MIOSINA).
α-ELICA
COILED-COIL
Il folding delle proteine
FOGLIETTO β (O β-SHEET)
SI FORMANO PER LEGAMI H TRA GRUPPI PEPTIDICI ADIACENTI APPARTENENTI A CATENE
POLIPETIDICHE DIFFERENTI CHE POSSONO DECORRERE PARALLELE OD ANTI-PARALLELE
(PARALLELE SE HANNO LO STESSO ORIENTAMENTO N-TERMINALE / C-TERMINALE; ANTIPARALLELE
SE UNA DECORN-TERMINALE / C-TERMINALE IN DIREZIONE NORD-SUD O EST-OVEST E L’ALTRA
N-TERMINALE / C-TERMINALE IN DIREZIONE SUD-NORD O OVEST-EST).
I FOGLIETTI BETA COSTITUISCONO IL “CORE” DI MOLTE STRUTTURE PROTEICHE
FOGLIETTO β (O β-SHEET)
Il folding delle proteine
STRUTTURE SUPER SECONDARIE, MOTIVI STRUTTURALI
•
•
•
•
a elica - loop - a elica: è presente in molte proteine che legano il Ca
(calmodulina e troponina C).
b-turn: due filamenti b antiparalleli uniti da un breve loop di 2-5 residui.
chiave greca: per formare questo motivo occorrono (minimo) quattro
filamenti b, due brevi loop e un loop più lungo.
b-a-b: è costituito da due filamenti b paralleli, intercalati da un'a-elica.
Il folding delle proteine
La struttura terziaria
Il folding delle proteine
La struttura quaternaria
A VOLTE LE PROTEINE CONSTANO DI PIU’ SUBUNITA’ PEPTIDICHE (CIASCUNA
GIA’ RIPIEGATA NELLA SUA STRUTTURA 3D) CHE INTERAGISCONO TRA LORO
TRAMITE LEGAMI NON COVALENTI (LEGAMI H ED INTERAZIONI IDROFOBICHE
PRINCIPALMENTE) A FORMARE UN’UNICA STRUTTURA FUNZIONALE: LA PRO=
TEINA AVENTE STRUTTURA QUATERNARIA.
Es.:PROTEINA EMOGLOBINA
Il folding delle proteine
I livelli di organizzazione di una proteina
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cenni sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
Genotipo e fenotipo
Il genotipo di un individuo è dato dal suo corredo
genetico, è ciò che è "scritto" nel DNA contenuto nel
nucleo di tutte le sue cellule ed è quindi immutabile.
Il fenotipo, invece, è l'insieme dei caratteri che l'individuo
manifesta: dipende dal suo genotipo, dalle interazioni fra
geni e anche da fattori esterni; dunque può variare.
IL GENOTIPO
IL FENOTIPO
È l’informazione genetica
È il modo in cui questa viene espressa
Genotipo e fenotipo
Il padre della genetica è Mendel. Nel tempo libero amava fare esperimenti incrociando
diverse varietà della pianta dei piselli. Fu lui a definire per la prima volta i concetti di
genotipo e fenotipo.
•Una pianta con seme giallo,
incrociata con una pianta con seme
giallo dava sempre progenie con
seme giallo.
•Una pianta con seme verde,
incrociata con una pianta con seme
verde dava sempre progenie con
seme verde.
•Una pianta con seme giallo,
incrociata con una pianta con seme
verde dava sempre progenie con
seme giallo. Il giallo è DOMINANTE
Genotipo e fenotipo
Il bello viene adesso: Se incrociamo le piante a seme giallo originate dai genitori misti
(seme giallo e seme verde) non otteniamo più solo piante a seme giallo ma anche
qualche piantina a seme verde!!!.
•Le piante a seme giallo che
incrociate tra loro danno sempre
seme giallo e le piante a seme giallo
che incrociate tra loro danno ANCHE
piante a seme verde sono
FENOTIPICAMENTE IDENTICHE
(hanno seme giallo) ma
GENOTIPICAMENTE le seconde
hanno l’informazine per esprimere il
carattere “seme verde” quindi sono
GENOTIPICAMETE DIFFERENTI.
Genotipo e fenotipo
I Sintesi:
Il FENOTIPO dipende dal GENOTIPO ma FENOTIPI
identici possono avere GENOTIPI diversi!
Outline
•
•
•
•
•
•
•
Il flusso dell’informazione genica
Le proteine – natura ed informazione
Il codice genetico
La traduzione (sintesi proteica)
Cenni sul folding delle proteine
Genotipo e fenotipo
Mutazioni e polimorfismi
Mutazioni e polimorfismi
Come abbiamo detto le mutazioni sono
variazioni della sequenza di basi nel DNA.
Le mutazioni possono avere diversi effetti a
seconda:
• Della loro natura (tipo di mutazione)
• Della loro posizione (dove avvengono)
Mutazioni e polimorfismi
Mutazioni puntiformi
Le mutazioni di più piccola entità sono le
mutazioni puntiformi:
Sono caratterizzate dalla sostituzione di un
nucleotide con un altro
ACTGTTGCTACTGGCGCGTT
ACTGTTGCTAATGGCGCGTT
Sono definite:
transizioni qualora vi è un scambio di una purina con altra purina (A ↔ G) o di una
pirimidina con un'altra pirimidina (C ↔ T)
transversioni quando lo scambio è di una purina con un a pirimidina o viceversa
(C/T ↔ A/G).
Mutazioni e polimorfismi
Inserzioni e delezioni (indel)
Le mutazioni più gravi sono le mutazioni indel:
Sono caratterizzate dalla inserzione o delezione
di uno o più nucleotidi
ACTGTTGCTACTGGCGCGTT
ACTGTTGCTACATGGCGCGTT
Possono causare uno “spostamento della fase di lettura” (frameshift):
ACTGTTGCTACTGGCGCGTT
ACTGTTGCTACATGGCGCGTT
Tutta la zona a valle della mutazione verrà influenzata. La probabilità di formare
codoni di stop prematuri è elevata (proteina troncata)
Mutazioni e polimorfismi
La posizione della mutazione
Le mutazioni possono cadere:
• In una regione genica (compresa tra
l’inizio e la fine di un gene)
• In una regione intergenica
La mutazione in una regione intergenica, di solito, non ha nessun effetto sul
fenotipo, e sono quindi maggiormente tollerate dalla selezione naturale. Tuttavia in
alcuni rari casi le mutazioni possono interferire con il riconoscimento del DNA da
alcune proteine regolatrici ed interferire con alcuni processi cellulari essenziali.
Mutazioni e polimorfismi
Mutazioni al’interno della regione genica
Se la mutazione avviene in questa regione si possono
avere diverse eventualità:
• La mutazione è avvenuta nella regione
codificante: l’informazione trascritta nell’mRNA
maturo cambia.
• La mutazione è avvenuta in un introne:
l’informazione trascritta nell’mRNA maturo non
cambia (almeno, non sempre)
• La mutazione è avvenuta in una regione
regolatrice (promotore, enhancer, silencer): la
regolazione (produzione di mRNA) può essere
influenzata.
Mutazioni e polimorfismi
Mutazioni nella regione codificante
L’mRNA viene alterato.
Se si tratta di una mutazione puntiforme un solo codone verrà cambiato in un
altro. Esistono tre tipi di mutazioni puntiformi:
• mutazioni sinonime: quando la mutazione determina un codone diverso ma che
codifica per lo stesso amminoacido (questo è possibile grazie alla ridondanza
del nostro codice genetico ). Non si avrà alcun cambiamento nel prodotto
genico.
• mutazioni di senso errato: quando un codone viene sostituito con uno che
codifica per un altro amminoacido. Se quest'ultimo avrà le stesse
caratteristiche chimiche (dimensione, carica...) allora la sostituzione sarà
conservativa altrimenti non conservativa. E' chiaro che il secondo caso rende
più probabile una variazione nella funzionalità del prodotto.
• mutazioni non senso: quando la mutazione determina la formazione di un
codone di stop all'interno della sequenza. Questo provoca, se il prodotto è una
proteina, un'interruzione precoce della sua sintesi nella traduzione. In generale
maggiore sarà il frammento non tradotto maggiore sarà il rischio di una
mutazione svantaggiosa.
Se si tratta di una mutazione indel tutti i codoni a valle delle mutazione verranno
cambiati.
Mutazioni e polimorfismi
Mutazioni in un introne
Gli introni vengono di solito alterati, quindi la
mutazione potrebbe non avere alcun effetto però:
• Lo splicing alternativo potrebbe considerare come
esone l’introne in cui è avvenuta la mutazione con
conseguente possibilità di variazione nel prodotto
proteico (vedi caso precedente)
• Se la mutazione avviene in corrispondenza dei siti
accettore o donatore di splicing questo processo
potrebbe non avvenire correttamente.
Mutazioni e polimorfismi
Mutazioni in regione regolatrice
La regolazione del gene potrebbe essere
alterata:
- Mancata produzione di mRNA
- Ridotta produzione di mRNA
- Aumentata produzione di mRNA

similar documents