Post on 02-May-2015
Adriana Maggi
DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHECORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO
AA 2011/2012Lezione 4
Le sfide per il futuro del progetto genoma umano
• comprendere le componenti strutturali e funzionali del genoma• capire come le reti di geni e proteine contribuiscono alla
definizione del fenotipo• comprendere cosa determina le variazione nella trasmissione
dei caratteri genetici• identificare le varianti genetiche che contribuiscono al
mantenimento dello stato di salute• determinare strategie per identificare il rischio di malattia• stabilire strategie per l’identificazione del contributo del
genoma nella determinazione delle patologie e delle risposte alla terapia
• utilizzare le conoscenze genetiche per lo sviluppo di farmaci innovativi
Il progetto Genoma Umano si è focalizzato sulla generazione di mappe
genomiche tramite mappe di concatenazione e mappe fisiche.
Una mappa genomica indica l’ordine in cui i geni e i marcatori genici si trovano
nei singoli cromosomi
Nella ricerca del gene malattia, i ricercatori in genere trovano
un marcatore specifico che indica il segmento di DNA nelle vicinanze del gene di interesse,
con clonaggi posizionali e analisis di sequenze si possono individuare I geni responsabili
della patologia
GENOMATICA FUNZIONALE
Studio di funzione genica
LA RICERCA DELLA FUNZIONE DEI GENI
La tradizione: ricerca di di mutazioni per identificare perdite o acquisizione di funzioniI metodi della genetica all’incontrario:Analisi mutazionale in organismi modello: Generare nuovi organismi geneticamente modificati per studiare perdita o acquisizione di funzioni
Metodologie innovative:Studio comparativo di popolazioni di prodotti genici
La tradizione:
ricerca e analisi di mutazioni e polimorfismi (es RFLP; SNP) del genoma stesso
Siti polimorfici • 99.99 % della sequenza del DNA di due individui e’ identica
• la maggioranza delle differenze (0.01%) coinvolgono singole sostituzioni
Polimorfismi al taglio con enzimi di restrizione (RFLP)
Single nucleotide polymorphysm (SNP)
Polimorfismi al taglio con enzimi di restrizione (RFLP)
Allele 1 Allele 2*
Polimorfismi al taglio con enzimi di restrizione (RFLP)
associazione RLFP-patologia
Famiglia Patol.
sani
variab nella popol.
The Lod (log of odds) score is used to calculate the probability of a pedigree arising randomly or by genetic linkage. The test was developed by Newton and Morton
In practice, linkage is declared if the LOD score is equal to or greater than 3 (i.e. the likelihood of observing the result if the two loci are not linked is less than 1 in 1000). On the other hand, linkage can be completely excluded if the LOD score is strictly below -2.
LOD = log Probability of birth sequence with a given linkage value
Probability of birth sequence with no linkage
Studio di funzione genica Localizzazione posizionale di geni/malattia
Studio di linkage familiare con polimorfismi
Ereditarietà – autosomica dominante : penetranza 100% Frequenza - circa 1/10,000 natiManifestazione clinica: 35 - 45 anni di etàLa manifestazione in età adulta ne ha causato l’espandersi della malattia
Gli studi delle basi molecolari della malattia sono iniziati con la identificazione di famiglie di grandi dimensioni i cui membri fossero viventi: questo è stato possibile grazie al registro Nazionale dei Pazienti con Huntington USA presso l’Università dell?Indiana e alla scoperta di una famiglia presso il lago Maracaibo in Venezuela in cui diversi membri erano affetti dalla malattia
Da diverse famiglie sono state prelevate cellule ematiche per la Generazione di cellule immortalizzateOgni famiglia è stata seguita da neurologi e la paternità dei pazienti è stata opportunamente verificata
Huntington, la malattia ideale per position cloning
1981 - Gusella's group started with a group of anonymous probes that uncovered RFLPs - very few available.
the 12th probe they tried -called G8 - indicated linkage. Disease associated with the A haplotype in the American family and the C haplotype in the Venezuelan family.
LOD Scores 1983 - G8 (also called D4S10) mapped approximately 4 cM from the HD locus. It took 10 more years to clone the gene.
1986-87 DNA markers were used and D4S10 was localized by in situ hybridization and somatic cell genetics to chromosome region 4p16.3; Further linkage studies for isolating HDIdentification of Putative Coding Sequences Exon Trapping; Use trapped exons to identify candidate genes from cDNAs; Four transcripts were analyzed; IT15 - Huntingtin
Dall’osservazione:Gusella JF, Wexler NS, Conneally PM, Naylor SL, Anderson MSA, Tanzi RE, Walkins PC, et al (1983) A polymorphic DNA marker genetically linked to Huntington's disease. Nature 306:234-238
Al brevetto:Huntingtin DNA, protein and uses thereof
US Patent Issued on November 11, 1997 Inventor(s): Marcy E. MacDonald; Christine M. Ambrose; Mabel P. Duyao; James F. GusellaAssignee: The General Hospital CorporationApplication: No. 246982 filed on 1994-05-20
Metodologie innovative:
Studio comparativo di popolazioni di prodotti genici
• genomatica comparativa• generazione di arrays per lo studio
comparato di espressione genica
analisi basata sulla omologia di geni codificanti proteine a funzione nota
Genomatica comparata:
Genomatica comparata
Utile per:
• Identificare similarità/dissimilarità tra speci diverse• Studiare evoluzione della specie• Identificare geni codificanti e loro funzione• Identificare regioni funzionali nei genomi
Ortologo e paralogo
• Ortologhi – geni omologi con la stessa funzione in organismi diversi
• Paraloghi – geni all’interno dello stessoorganismo derivanti da duplicazione genica
Geni ortologhi o paraloghi
Allineamento di sequenze
generazione di arrays per lo studio comparato di espressione genica
ARRAY
MACROARRAY
MICROARRAY
DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto
rapresentante un singolo gene immobilizzati su un supporto (vetro,
plastica o silicone) mediante legami di tipo irreversibile.
Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA
mRNA or gene expression profiling
Clustered Image Maps
Drugs x CellsGenes x Cells
Genes x Drugs
I LIMITI DELLA ANALISI GENOMICA:
RIPRODUCIBILITA’
ANALISI NON QUANTITATIVA
I mRNA NON RIFLETTONO ESATTAMENTELE PROTEINE PRESENTI NELLA CELLULA
Come classificare la materia vivente per comprenderla?
Il progetto GENE ONTOLOGY
Gene Ontology http://www.geneontology.org/index.shtml
Un progetto atto a costruire un vocabolario strutturato pensato per descrivere i geni e i loro prodotti in qualsiasi tipo di organismo
Questo vocabolario serve per dare un unico nome a un specifico prodotto in modo che questi così compaia nelle diverse banche dati e possa venire rapidamente ritrovato
L'ontologia, una delle branche fondamentali della
filosofia, è lo studio dell'essere in quanto tale,
nonché delle sue categorie fondamentali.
Il termine deriva dal greco ὄντος, òntos (genitivo
singolare del participio presente ὤν di εἶναι, èinai,
il verbo essere) più λόγος, lògos, letteralmente
"discorso sull'essere”
Gene Ontology (GO, ontologia genica): un
vocabolario controllato e strutturato per
la descrizione di prodotti genici in termini
• di funzione molecolare,
• di ruolo biologico e
• di ubicazione cellulare
Le Ontologie differiscono dalle terminologie controllate (Lexicon) poiché si tratta di una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse,le regole, gli assiomi, ed i vincoli specifici del dominio; mentre le terminologie controllate semplicemente restringono l’insieme di parole usate per descrivere il dominio.
Gene Ontology http://www.geneontology.org/index.shtml
Ogni gene/proteina si contraddistingue per un numero identificativo unico (GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita, trasduttore del segnale).
Ogni termine viene assegnato a una o più delle tre suddivisioni della banca (ontology):
1.Funzioni molecolari2.Componenti cellulari3.Componenti I processi biologici
Esempio di annotazione:
Il prodotto genico della citocromo-C-ossidasi puo’ essere descritto in GENE ONTOLOGY tramite:
La sua funzione molecolare: attività ossidoreduttasicaIl componente cellulare nel quale è presente: la matrice mitocondriale o la membrana interna del mitocondrioIl processo biologico che causa: fosforilazione ossidativa e induzione di morte cellulare
DAG (Grafico Acilico Diretto)
Il grafico Acilico Diretto è la forma rappresentativa usata in GO.
Il DAG è una forma di grafico che differisce da una normale gerarchia poichè ogni termine può avere più padri e in cui possono esistere molteplici percorsi da un termine qualsiasi al termine radice Ciascun vocabolo della GO rappresenta un nodo del DAG al quale è associato un identificativo (GO ID).
Grafico Acilico Diretto
un termine di gene ontology molto “generico” contiene al suo interno” più termini di gene ontology via via più specifici. Questo fa sì che man mano che si va “verso il basso” le definizioni diventino sempre più precise ed i geni che soddisfano a quella descrizione sempre meno. Questo albero può quindi essere “letto” a più livelli, da quelli più generali, che stanno alla radice, a quelli via via sempre più specifici che stanno sulle foglie.
POSSIBILI UTILIZZI DI GENE ONTOLOGY
La categorizzazione con GENE ONTOLOGY può avere diversi scopi finali:
1) comprendere in che processo/funzione/componente in cui è coinvolto un gene2) categorizzazione di un set di dati (gene e proteine); in formato normale o usando un Goslim per avere una visione d'insieme dei dati3) categorizzare un set di dati e valutare eventuali sovra-rappresentazioni (“gene enrichment”) che non siano fruttto del caso4) estrazione dei geni (sequenze) che sono coinvolte in un processo, funzione, componente