ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE … · ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE...

22
ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA MÓDULO 1: CONCEPTOS GENERALES DE GENÉTICA HUMANA TÍTULO DE EXPERTO UNIVERSITARIO EN MEDICINA GENÉTICA Y GENÓMICA 2019 Material didáctico: Módulo 1- Clase1 Material didáctico creado por Mar Benito, MSc https://www.linkedin.com/in/marbenito/

Transcript of ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE … · ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE...

ESTRUCTURA DEL GENOMAHUMANO Y MECANISMOS DE

EXPRESIÓN GÉNICAMÓDULO 1: CONCEPTOS GENERALES DE GENÉTICA HUMANA

TÍTULO DE EXPERTO UNIVERSITARIO EN MEDICINA GENÉTICA Y GENÓMICA 2019

Material didáctico: Módulo 1- Clase1

Material didáctico creado por Mar Benito, MSc https://www.linkedin.com/in/marbenito/

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

MÓDULO 1: CONCEPTOS GENERALES DE GENÉTICA HUMANA

1.1- ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA.

Profesor: Dra. Nuria Paricio Ortiz

ÍNDICE

1.-ESTRUCTURA DEL GENOMA HUMANO................………………………………………………..……........1

1.1.- Genoma mitocondrial………………………………………………………….…….........................1

1.2.- Genoma nuclear.………………………………………………………………….…….........................1

1.3.- Tipos de secuencias del genoma humano..…………………………….……........................2

2.-MECANISMOS DE EXPRESIÓN GÉNICA.................……………………………………………….……......10

2.1.-Modificaciones a nivel de transcripción..……………………………..……….....................11

2.2.-Modificaciones a nivel de procesado de RNA..………………….………….......................14

2.3.-Modificaciones a nivel de traducción..………………………………….….….......................17

2.4.-Mutaciones en regiones implicadas en la expresión de genes...….…......................18

Anexo 1. Características del genoma...................……………………………………………….......................19

Anexo 2. Proyecto ENCODE..............................................................................................................................19

Anexo 3. Proyecto Epigenoma.........................................................................................................................20

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 0

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

1.-ESTRUCTURA DEL GENOMA HUMANO

El GENOMA es el contenido total de ADN presente en una célula. El genoma humano constade 2 tipos, el genoma nuclear y el genoma mitocondrial.

1.1 Genoma mitocondrial

Fue la primera parte del genoma humano de la que se conoció la secuencia, en 1981. Estegenoma incluido dentro de las mitocondrias está constituido por una molécula de ADNcircular de cadena doble y de 16.6 kb de longitud (de tamaño muy pequeño comparadocon el genoma nuclear que en total tiene 3100 millones de pb ). Contiene 37 genes, de loscuales 2 tienen información para codificar ARN ribosómico (ARNr), 22 para ARN detransferencia (ARNt), y 13 para proteínas necesarias para el funcionamiento de lamitocondria. El resto de proteínas necesarias para la mitocondria procede del genomanuclear.

Es necesario comentar que el 97% del genoma mitocondrial es codificante y tiene unatranscripción policistrónica, es decir, se transcribe en forma de un transcrito continuo. Másinformación sobre el ADN mitocondrial se puede encontrar en la página webhttp://www.mitomap.org.

En el año 1988, se descubrió que en el genoma mitocondrial existían algunas mutacionesen genes causantes de enfermedades humanas y hereditarias, como por ejemplo laNeuropatía Óptica Hereditaria de Leber (LHON). Esta es una enfermedad mitocondrialneurodegenerativa que afecta al nervio óptico y que se caracteriza por una pérdida súbitade la visión en los adultos jóvenes portadores. No se conoce con exactitud su prevalencia,pero está estimada en torno a 1/15.000 – 1/50.000 en todo el mundo. Como hemoscomentado, la LHON está causada por mutaciones en el ADN mitocondrial (ADNmt), en lasque más del 90% ocurren en las posiciones 11778, 3460 o 14484. Todas producenalteraciones en los genes MT-ND1, MT-ND4 y MT-ND6 del complejo I de la cadenarespiratoria mitocondrial, y se transmite de forma materna, ya que el ADN mitocondrial setransmite exclusivamente de esta manera.

DIAPOSITIVA 3: Estructura del genoma humano.

1.2 Genoma nuclear

El genoma nuclear se refiere al conjunto de información genética contenida en loscromosomas (22 autosomas y 2 cromosomas sexuales), que tiene una longitud de unos3100 millones de pares de bases. En los años 90 se inició el Proyecto Genoma Humano, conel objetivo de secuenciar el ADN nuclear, que culminó en 2001 con el primer borrador de lasecuencia del genoma humano, que contenía el 92% del genoma total, las regioneseucromáticas. En 2003 se publicó la secuencia completa. El primer borrador de 2001 seconsiguió por la competición entre dos grupos de investigadores, uno formado por un

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 1

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

consorcio público y otro de la empresa privada, lo que llevó a acelerar un poco el procesode su publicación, sin que la secuencia del genoma estuviera totalmente corregida. Desdeentonces hasta ahora toda la información del genoma humano ha ido actualizándoseconstantemente. En la página web http://www.ensembl.org/Homo_sapiens/index.htmlestá toda la información más actualizada sobre este proyecto, así como toda la queactualmente se posee sobre el genoma humano, por ejemplo, la secuencia de todos loscromosomas humanos, información sobre genes concretos, información sobregen/secuencia nucleotídica/estructura Exón-Intrón/número de transcritos y cuálesson/codificación de proteínas y dominios estructurales, etc. También hay informaciónsobre el genoma de organismos relacionados como el de chimpancé, el de neanderthal,ratón, etc. que sirven para hacer estudios de genómica comparativa. También se presentainformación sobre la expresión y regulación de los genes, variantes en determinadosgenes, etc. Actualmente se está trabajando con la versión 94, y la última actualización esdel 2018. La última secuencia tiene 3.1 Mb. Esta secuencia es de alta calidad, y se hanexcluido algunas regiones con repeticiones muy variables y las regionespseudoautosómicas de los cromosomas X e Y. Esta página web también nos da informaciónsobre los contajes de genes, a día de hoy hay 20.338 genes codificantes.

DIAPOSITIVAS 4 Y 5. El proyecto Genoma Humano

1.3 Tipos de secuencias del genoma humano

El genoma humano posee 20.338 genes codificantes para proteínas, 22.521 genes queespecifican ARN funcionales por sí mismos (largos > 200 nucleótidos y cortos <200nucleótidos), 2.222 miscelania (ARNs pequeños como por ejemplo los que forman partedel spliceosoma), más de 15.000 pseudogenes (copias de genes activos, que se haninactivado durante la evolución) y más de 200.000 transcritos. El porcentaje de genomahumano que codifica proteína es sólo de un 1.5-2%.

Existen dos tipos de secuencias en el genoma humano:

- <50% del ADN son secuencias de copia única, que corresponden a genes que

codifican proteínas, intrones y secuencias reguladoras.

- > 50% secuencias repetidas ó ADN repetido, en las cuales podemos encontrar dos

categorías: 1) Secuencias derivadas del proceso de transposición, elementos transponibles, 45% delgenoma: LINES, SINES, elementos similares a retrovirus y transposones de ADN.

2) Repeticiones de secuencias muy sencillas y cortas, repetidas miles de veces. Estos dostipos de secuencias no tienen una función conocida, pero se les da importancia ya que

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 2

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

ofrecen una gran fuente de variabilidad para dar lugar a la evolución, tienen relevancia enmedicina, y han servido para hacer estudios genéticos.

3) Duplicaciones segmentales, que son fragmentos de cromosomas que están repetidos enel mismo cromosoma o en otras partes del genoma.

Vamos a hablar de:- los tipos de secuencias repetidas- los genes no codificantes- los pseudogenes

DIAPOSITIVAS 6 Y 7:

Características generales del genomahumano y ADN repetido en elgenoma humano.

EL ADN repetido se puede dividir en secuencias en tándem, es decir dispuestas una al ladode la otra, o secuencias dispersas por todo el genoma (la mayoría son retrotransposones).

A) ADN repetido en tándem:

Dentro de los ADNs repetidos en tándem, vamos a hablar de tres tipos, el ADN satélite, losminisatélites y los microsatélites, cuya diferencia viene determinada por la longitud de laregión que contiene las secuencias repetidas en tándem, no por la longitud de la secuenciaque se repite.

1) ADN satélite: son aquellos ADNs cuyas repeticiones ocupan regiones que tienencientos de Kb. Se suelen encontrar asociadas a regiones heterocromáticas, en lasregiones centroméricas y pericentroméricas de los cromosomas. Existen diferentesfamilias como el satélite alfa, beta, gamma, 1, 2 y 3, y satélites localizados en elcromosoma Y.

2) ADN minisatélites: repeticiones que ocupan regiones mucho más pequeñas (0.1-20Kb). Hay dos familias, la familia telomérica, y la de los minisatélites hipervariables,que suelen estar en regiones subteloméricas.

3) ADN microsatélites: repeticiones que ocupan regiones menores de 100 bp. Lassecuencias que se repiten también son cortas 1-7 pb, y se encuentran dispersas entodos los cromosomas.

DIAPOSITIVA 8:

DNA repetido en tándem

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 3

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

1) ADN satélite:

Es el ADN más variado ya que está constituido por muchas familias tales como , ,satélite 1, 2 y 3, y algunos satélites específicos del cromosoma Y. Estas secuencias tienenuna localización bastante específica, se encuentran sobre todo en las regionescentroméricas y en las regiones pericentroméricas. La longitud del fragmento que se repitees diferente en cada familia.

En la diapositiva 9, vemos un fragmento del cromosoma 9 humano y uno del cromosoma21, donde la constricción representa el centrómero, y la mayor parte de la regióncentromérica está formada por satélites tipo (alfoide). El resto de satélites , 1, 2 y 3,están localizados en la región pericentromérica. La importancia de las secuencias alfoidesradica en que están implicadas de manera notable en la formación del centrómero, que esuna estructura esencial para la segregación cromosómica durante la mitosis y la meiosis.

La secuencia alfa tiene una longitud de 171 pb y en ella hay una región de reconocimiento(CENP-B) de una histona específica de los centrómeros, Cen H3 (variante de la HistonaH3), con la que interaccionan los microtúbulos del huso acromático, que son lasestructuras que hacen que la segregación cromosómica se de de forma correcta. En esteaspecto se recalca que las regiones que contienen estas secuencias satélites sonheterocromáticas y esto siempre se asocia con ADN silenciado (ADN que no se expresa).Pero hace unos 6 años se encontraron transcritos procedentes de regiones centroméricas ypericentroméricas del ADN satélite en ratones y en humanos. Parece ser que este ADN setranscribe en ciertas circunstancias, concretamente en los procesos de diferenciación,desarrollo, senescencia, estrés y en algunos tipos de cáncer, pero no se sabe cuál es lafunción de estos tránscritos.

DIAPOSITIVA 9:

DNA repetido en tándem: DNA satélite.

2) ADN minisatélites

Existen dos familias: la familia de minisatélites teloméricos que forma parte de lostelómeros (extremos de los cromosomas), y las secuencias denominadas ADNminisatélites hipervariables o VNTR, que pueden estar en diferentes regiones, pero quenormalmente se encuentran en regiones subteloméricas.

Los telómeros son estructuras de los extremos del cromosoma formadas por unasecuencia de 6 bp (TTAGGG) repetidas miles de veces, que tienen una longitud de 2-100Kb. Realizan principalmente dos funciones, la primera es proteger a los extremos de loscromosomas de la degradación por parte de las nucleasas, a través de su reconocimientopor un complejo proteico llamado Selterina.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 4

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

Los telómeros son secuencias de ADN de cadena doble hasta un cierto punto, que luegocontinúa con una protuberancia de cadena sencilla de 50-500 nucleótidos de largo, y ricaen Gs, extremo 3'. En el complejo de la Selterina encontramos 3 tipos de proteínas: TRF1 yTRF2 que interaccionan con el ADN de cadena doble, POT1 que interacciona con lasecuencia de cadena sencilla, y luego una serie de proteínas que hacen de puente entre losdos tipos anteriores. El reconocimiento por parte de muchos complejos de Selterinapermite la formación de unas estructuras llamadas Lazos T (teloméricos), que protegen altelómero de la degradación (ver diapositiva 10).

La segunda función de los telómeros es mantener la longitud de los cromosomas lineales,ya que estos se acortan con el tiempo debido al proceso de replicación, en las célulassomáticas. En cambio, en células germinales, células altamente proliferativas, y algunascélulas embrionarias, la enzima telomerasa alarga los cromosomas a través de estassecuencias porque contiene una secuencia de ARN de unos 150 nucleótidos,complementaria a la secuencia de cadena sencilla que sobresale de los telómeros. Latelomerasa se empareja en el extremo 3' con la secuencia complementaria al ARN de sucentro activo, y hace una copia en ADN del ARN, alargando el extremo 3' de cadenasencilla. Después una ADN polimerasa es capaz de rellenar el hueco de cadena sencilla,evitando que los cromosomas se acorten en cada proceso de replicación (ver diapositiva10).

Las secuencias hipervariables VNTR, o Variable Number of Tandem Repeats, son secuenciasde un tamaño medio, unos 60 pb, ricas en GC, que se repiten a lo largo del genoma hastaocupar una región de 20Kb, se encuentran preferentemente en las regionessubteloméricas. Son muy frecuentes (30.000 VNTR repartidos por todo el genoma) yaltamente polimórficas en cuanto a la secuencia que presentan y en cuanto al número derepeticiones. Cada uno de nosotros tenemos en nuestros cromosomas un número diferentede repeticiones, son multialélicos. Su función es desconocida, pero tienen su importanciaya que son puntos calientes de recombinación, con lo cual hacen que se incremente lavariabilidad de los genomas. Pero sobretodo sirven para la realización de estudios deIdentidad Genética (o DNA fingerprinting), ya que cada uno de nosotros posee un númerode repeticiones específico para cada uno de los locus VNTRs. Estas repeticiones son másestables que los microsatélites, pero pueden cambiar de una generación a otra.

DIAPOSITIVAS 10 Y 11:

DNA repetido en tándem: DNAminisatélite.

La detección de polimorfismos en los locus VNTR se realiza mediante la técnica SouthernBlot. Brevemente, se extrae el ADN genómico, se corta con enzimas de restricción en lasregiones flanqueantes de los loci VNTR, y ese ADN se separa por electroforesis en gel deagarosa, así los fragmentos quedan separados por tamaño. Después se transfieren a unfiltro y se hibridan con una sonda específica que reconoce esas secuencias repetidas (ver

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 5

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

diapositiva 12). Se usa principalmente para Genética Forense, y Determinación delparentesco.

En la diapositiva 12 se muestra un caso real de determinación de un agresor sexual.Tenemos el ADN de la víctima, el ADN de dos sospechosos, células de la víctima y ADNextraído del esperma que se encontró en la víctima después de la agresión. Se lleva a caboel estudio como se ha especificado y se obtiene un patrón de bandas diferente para cadaindividuo analizado. El patrón del ADN del esperma coincide con el del sospechoso1. Loque se puede asegurar es que el otro sospechoso no es el culpable, para determinar que elculpable es el sospechoso1, se tienen que hacer estudios estadísticos teniendo en cuenta lafrecuencia de ese alelo en la población.

Se ha visto que hay VNTRs que se encuentran en diferentes lugares del genoma pero quetienen secuencias muy relacionadas, de forma que con una sola sonda se pueden detectarvarios loci a la vez, a estas se les denomina sondas multilocus. Las que solo reconocen unasecuencia VNTRs son las monolocus. Las sondas multilocus son útiles porque al obtenersevarias bandas por individuo, es más difícil que dos individuos coincidan en todas estasbandas. En la diapositiva 12 también se pone un ejemplo de este tipo, aquí se ve que laprueba recogida en la escena del crimen coincide con el patrón del sospechoso1. En estecaso es más probable que el sospechoso1 sea el culpable, porque tenemos un rastro debandas que coinciden.

DIAPOSITIVA 12:

DNA repetido en tándem: DNA minisatélite.

3) ADN microsatélites

También denominados STR o SSR (Short Tandem Repeats o Simple Sequence Repeats). Sonsecuencias más cortas (de 2-7 pb) que abarcan regiones de unos 100 pb, distribuidas portodo el genoma, polimórficas y que también se usan para experimentos de DNAfingerprinting. Se han encontrado unos 200.000 loci microsatélites en todo el genomahumano. La detección del polimorfismo se realiza mediante PCR, se amplifican las regionescorrespondientes a ese STR, con cebadores específicos para la secuencia flanqueante de larepetición. Se obtienen fragmentos amplificados de diferente longitud dependiendo delnúmero de repeticiones que tengamos. Para cada individuo también observaremos dosbandas correspondientes al alelo de cada cromosoma. Para la detección de varios loci STRa la vez, se realiza una PCR multiplex. Se usan distintos cebadores para detectar distintosSTRs, marcados con diferentes fluorocromos (fluorescencia). Se detectan los fragmentospor electroforesis capilar y por láser, pudiendo ver el perfil simultáneo de varios loci STRpara un individuo (ver diapositiva 14). Cada pico de la detección por láser representa unode los fragmentos, cuando solo vemos un pico es que el individuo es homocigoto para esemicrosatélite, y si hay dos picos es que es heterocigoto.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 6

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

Estas técnicas se utilizan más hoy en día para la identificación genética porque se necesitauna cantidad muy pequeña de ADN (nanogramos) comparado con la técnica anterior deSouthern Blot (microgramos). En una escena forense normalmente tenemos restos conmuy poca cantidad de ADN.

DIAPOSITIVAS 13 Y 14:

DNA repetido en tándem: DNAmicrosatélite.

Las secuencias microsatélite son muy relevantes en Biomedicina, ya que se ha visto quepueden estar relacionadas con enfermedades. Las regiones que contienen estas secuenciaspueden estar localizadas en genes (regiones codificantes, regiones no traducidas, intrones,etc.) de personas sanas con una longitud determinada, pero en algunas enfermedadesestos microsatélites tienen una expansión, es decir, se incrementa la longitud de dichasrepeticiones. Por ejemplo, en la enfermedad de Huntington se produce una repetición deun trinucleótido CAG en un gen que codifica para la proteína Huntingtina. Los alelosnormales tienen 6-35 repeticiones, pero cuando hay más de 36 repeticiones, el individuotienen muchas posibilidades de desarrollar la enfermedad. De 27 a 36 repeticiones elindividuo tiene un fenotipo normal, pero el triplete puede expandirse en la siguientegeneración. De 36 a 40 repeticiones se da una penetrancia incompleta, es decir, no todoslos individuos presentan los síntomas, pero en la siguiente generación seguro que semanifestará la enfermedad. Con más de 40 repeticiones se presenta la enfermedad.El triplete CAG codifica una glutamina, así, si hay muchas repeticiones encontramos unnúmero muy grande de glutaminas, lo que hace que estas proteínas se agreguen entre ellasy pierdan su función.

Las enfermedades que tienen las repeticiones en una zona codificante se llaman PoliQ. Eneste tipo de enfermedades el mayor número de repeticiones está asociado con una mayoragresividad y aparición más temprana de los síntomas.

Se han encontrado otras enfermedades provocadas por expansiones de trinucleótidos enregiones no traducidas, por ejemplo en la región 3' o 5', o en regiones intrónicas. En elsíndrome del X frágil la expansión se encuentra en una zona no traducida, en la distrofiamiotónica está en la región 3' no traducida, y en la ataxia de Friedreich está en una regiónintrónica.

También se pueden dar enfermedades producidas por repeticiones de tetranulceótidos(distrofia miotónica 2) y pentanucleótidos (ataxia espinocerebelar 10).

En la diapositiva 15 se muestra una tabla con las enfermedades producidas porexpansiones de trinucleótidos.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 7

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

DIAPOSITIVA 15:

DNA repetido en tándem: DNA microsatélite (III).

B) DNA repetido y disperso en el genoma

Elementos transponibles:

Estos elementos constituyen el 45% del genoma. Son secuencias derivadas de latransposición, que son capaces de cambiar su posición en el genoma. En la diapositiva 16vemos varios tipos de estos elementos transponibles que se han detectado en el genomahumano, y el número de copias que se han encontrado de cada uno de ellos. La mayorparte pertenece a la familia de los retrotransposones, dentro de los que se encuentran lasfamilias LINE, SINE y retrovirus-like (LTR). En el genoma humanos los LINE y los SINE sonlos únicos activos.

Un transposón de ADN es una secuencia que cambia de posición en el genoma, unretrotransposón también cambia de posición pero a través de un intermediario de ARN, esdecir, el retrotransposón se transcribe, da lugar a un transcrito, el transcrito se copia aADN mediante la acción de una transcriptasa reversa codificada por él mismo, y ese ADNes el que se inserta en una nueva región del genoma.

A los transposones de ADN en humanos se les denomina fósiles porque son incapaces dereplicarse para movilizarse en el genoma. Aunque hasta hace relativamente poco tiempohan tenido que se móviles, porque por ejemplo, de MER1 tenemos 213.000 copias en todoel genoma.

DIAPOSITIVA 16:

ADN repetido y disperso en el genoma:elementos transponibles (I).

En el genoma humano, los retrotransposones más abundantes son LINE-1 (LongInterspersed Nuclear Elements), que son muy activos y se mueven constantemente en elgenoma. Tenemos más de medio millón de copias de LINE-1 dispersas por nuestrogenoma, pero solo unas 100 son activas. Los elementos LINE-1 se mueven de la siguientemanera: primero se expresan, es decir se genera un ARNm que codifica una serie deproteínas, de las que la más importante es una transcriptasa reversa (capaz de sintetizaruna copia de ADN a partir de un ARN). El ARNm es traducido e inmediatamente es copiadopor esa transcriptasa reversa a ADN. Esa secuencia de ADN es la que se integra en otropunto del genoma por la acción de la endonucleasa (ver diapositiva 16). Lo que se integrano es el propio elemento, sino una copia que se ha generado a partir de la expresión de eseelemento.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 8

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

Otra familia importante es la de los elementos Alu, retrotransposones más cortos que hanperdido la capacidad de codificar proteínas, con lo que por ellos mismos no puedenmoverse a lo largo del genoma. Lo que hacen es utilizar la transcriptasa reversa de losLINE-1. Al ser pequeños su transposición es muy activa, tenemos más de un millón decopias en nuestro genoma.

Los elementos transponibles al insertarse en regiones del genoma pueden interrumpirgenes, provocar reordenaciones cromosómicas por recombinación homóloga entre ellos, ymovilizar algunos exones de genes que están cercanos al sitio de inserción, por lo que elexón se inserta en un gen distinto, y por tanto, crean nuevos genes. Por último estoselementos pueden también influir en la expresión de genes que estén cerca del sitio deinserción.

En la diapositiva 17 se muestra un paciente con hemofilia A causada por una inserción deuna elemento LINE-1 en la región codificante del factor de coagulación VIII.

DIAPOSITIVA 17:

ADN repetido y disperso en el genoma:elementos transponibles (II).

Pseudogenes procesados: la transcriptasa reversa de los elementos transponibles LINEpuede actuar sobre un transcrito de un gen ajeno a los retrotransposones, se genera unacopia de ADN complementario (ADNc), y se introduce en otra región del genoma,formando un pseudogen. Esto se da de forma común. Este pseudogen no tiene promotor ypor tanto no es activo, además está procesado porque no tiene ningún intrón. Pueden iracumulando mutaciones. Si estos pseudogenes procesados se insertan cerca de unpromotor de otro gen, se podrían reactivar dando lugar a lo que se llama retrogenes. En ladiapositiva 18 se muestran ejemplos de este tipo de genes.

DIAPOSITIVA 18:

Pseudogenes procesados

Pseudogenes

Son genes inactivados por la aparición de mutaciones (pseudogenes unitarios). En muchasocasiones se producen tras un proceso de duplicación genómica (pseudogenesduplicados), por lo que seguimos teniendo el gen normal activo y una copia inactiva.Siempre se había pensado que estos pseudogenes eran ADN basura, es decir que no teníanninguna función, pero recientemente se ha visto que los pseudogenes duplicados son

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 9

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

transcripcionalmente activos y son capaces de regular la expresión de los genes de los queproceden. Se han encontrado casos de pseudogenes que se transcriben en la direccióncontraria del gen original dando lugar a una regulación antisentido, también se puede darcompetencia entre los dos ARNs para disminuir los niveles de un determinado transcrito,por otra parte los transcritos de los pseudogenes pueden generar ARNs de doble cadenaque silencian genes con secuencias similares. Se han encontrado pseudogenes que puedenregular la expresión tanto de genes supresores de tumores como de protoncogenes.

DIAPOSITIVAS 19 Y 20:

Pseudogenes

Genes que especifican ARNs no codificantes

Existen más genes cuyos productos son ARNs funcionales que genes que codifican paraproteínas. Estos ARNs funcionales están implicados en la síntesis de proteínas, en lamaduración del ARN, en el control de la transposición o en el control de la expresióngénica. Los más conocidos son los microARNs y piwiARNs de cadena corta (20-30 bp),pero también existen de cadena mediana (hasta 200 bp), y los de cadena larga (long non-coding RNA >200 bp). Cabe destacar que los microARNs y piwiARNs están implicados en laregulación de la expresión génica, y que se ha visto que una desregulación de estos genesestá implicada en muchas patologías, especialmente en cáncer. La desregulación puede serpor silenciamiento o disminución de la expresión del ARN, también por mutaciones,sobreexpresión o deleciones genómicas. El ARNXIST es capaz de inactivar el cromosoma Xpara el efecto de la compensación de dosis.

DIAPOSITIVAS 21 Y 22:

Genes de ARNs no codificantes

2.-MECANISMOS DE EXPRESIÓN GÉNICA

Aquí vamos a hablar de como se expresan los genes que codifican proteínas y como se regula su expresión. Para que un gen se pueda expresar tienen que tener una región promotora, donde se va a unir la ARN polimerasa. Cada gen codificante está constituido por exones (regiones que tienen capacidad codificante) e intrones (regiones sin capacidad codificante). Los transcritos tienen que ser procesados, es decir los intrones tienen que sereliminados, a la vez que se van formando. También hay unas modificaciones necesarias

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 10

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

para que los transcritos puedan servir de molde para la traducción, que son la adición de una caperuza en 5' y la adición de una cola de poly A en 3'. Todos estos procesos suceden al mismo tiempo que se da la transcripción.

El dogma central de la biología molecular es el siguiente:

la información contenida en el ADN se transcribe a ARN, en algunos casos ese ARN ya esfuncional y en otros se traduce a proteínas. Todos estos procesos son bastante complejos yse regulan en muchos puntos.

La regulación de la expresión génica es un proceso muy complejo en el cual se producenuna serie de modificaciones a distintos niveles:

a) a nivel de la transcripción, ya que tiene que modificarse la estructura tridimensional delADN, para ello son necesarios algunos cambios epigenéticos, es decir, modificacionesquímicas de las proteínas y del ADN que forman parte de la cromatina. Una vez estasmodificaciones se han producido, se tiene que dar una interacción correcta de factores detranscripción junto con la ARN polimerasa y el ADN, y en algunos casos también ocurreninteracciones ADN-microARN.

b) a nivel de procesado del ARN, ya que se genera un mensajero primario y no maduro delcual, gracias al splicing alternativo, se pueden obtener diferentes transcritos maduros quedarán lugar a diferentes proteínas.

c) a nivel de traducción, ya que las formas de ARN mensajero generadas tienen quetraducirse a proteínas. Además ciertas proteínas deben sufrir modificaciones post-traduccionales para ser funcionales. Estas modificaciones pueden dar lugar a diferentesproteínas maduras.

DIAPOSITIVAS 24 Y 25:

Expresión génica

2.1.-Modificaciones a nivel de la transcripción

La transcripción comienza con una modificación tridimensional de la cromatina. El ADNestá unido a unas proteínas, las histonas, formando los nucleosomas, que son octámeroscon 4 tipos de histonas diferentes (H3, H4, H2A y H2B), sobre los que se enrolla el ADNdando dos vueltas (200 pb). Las histonas y el ADN interaccionan de forma muy intensa,debido a la carga positiva de estas, se han encontrado 14 puntos de interacción con el ADN,lo que hace que sea una de las estructuras más estables de la naturaleza. Además, las colasN terminales de las histonas se proyectan hacia fuera del ADN, estos residuos pueden sermodificados químicamente de muchas formas (acetilación, ubiquitinación, sumolización,fosforilación, metilación) (ver diapositiva 28), lo que puede hacer que las histonas dejen de

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 11

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

interaccionar tan fuertemente con el ADN o que interaccionen de manera todavía másfuerte, permitiendo la accesibilidad o no del ADN. Hay un patrón particular demodificación de histonas característico de genes activos o de genes inactivos, es lo que sedenomina el código de histonas. En los genes activos la unión de ADN e histonas es máslaxa, es lo que se conoce como cambios epigenéticos. Se sabe que cuando hay altos nivelesde acetilación de las histonas los genes suelen estar activos, pero lo normal es que hayauna combinación de modificaciones químicas que determinarán si el gen es activo oinactivo.

El ADN también puede sufrir directamente modificaciones químicas que lo harán más omenos accesible. La modificación más frecuente en el ADN es la metilación sobre lascitosinas de la cromatina dentro del par CG (CpG). Se estima que el 2-7% de las citosinasen mamíferos se encuentran metiladas. Cuando el ADN está muy metilado, es inactivo ypara que se produzca la activación de los genes se tiene que dar una inframetilación.Muchas veces las metilaciones en las citosinas impiden que las proteínas específicasimplicadas en la transcripción o factores de transcripción se unan a las regionespromotoras. También pueden reclutar una serie de enzimas (MBP) que hacen que no sepuedan unir los factores de transcripción, u otras que provocan modificaciones en lashistonas asociadas con ADN inactivo. La metilación en las regiones internas de los genespuede impedir el avance del aparato transcripcional.

Para que un gen se exprese el ADN tiene que estar poco metilado, y las colas de lashistonas tienen que ser propias de ADN activo, además el promotor tiene que estarexpuesto. Para ello actúan los Complejos Remodeladores de la Cromatina, que medianteconsumo de ATP modifican el estado de la cromatina desplazando los nucleosomas oalterando su estructura. Esto lo pueden llevar a cabo desenrollando el ADN de losnucleosomas, movilizando a los nucleosomas o eliminándolos, introduciendo variantes dehistonas que permiten que los nucleosomas estén relajados, etc. Cuando el gen ya se haexpresado los complejos remodeladores también pueden volver a compactar la cromatina.

En el caso de las variantes de histonas, por ejemplo, H2Z es una variante de H2A que estáasociada a genes activos, mientras que la variante H3.3 está asociada con activacióntranscripcional. Cuando estas histonas se introducen en el nucleosoma, substituyendo a lashistonas anteriores, hacen que la unión con el ADN sea más laxa y que los genes puedanexpresarse.

En la diapositiva 29 se muestra un resumen de todas las modificaciones epigenéticas quehacen que los genes se expresen o no: metilación del ADN, modificaciones de histonas eintroducción de variantes de histonas. Estas modificaciones hacen que la unión entreproteínas y ADN sea más laxa, o reclutan a proteínas que ayudan a compactar más lacromatina o a hacerla más laxa para que el complejo transcripcional pueda unirse.

Hay modificaciones de histonas asociadas con genes inactivos como la metilación de lalisina 9 o de la lisina 27, mientras que hay otras asociadas con genes activos como lametilación de la lisina 36 o la acetilación de cualquier histona.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 12

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

DIAPOSITIVAS 26-29: Transcripción: modificadores de la cromatina

La importancia de todo esto es que las secuencias que son necesarias para que los genes setranscriban estén accesibles para que la transcripción se pueda producir. Estas secuenciasimportantes para la transcripción son las regiones Promotoras.

El núcleo del promotor es una secuencia del ADN a la cual se une la ARN polimerasa II encolaboración con factores de transcripción generales (TFIID, TATA binding protein, etc.)que la reclutan a esa zona. En los promotores de genes humanos puede haber diferentestipos de secuencias. La más conocida es la caja TATA, aunque la mayoría de los geneshumanos no la tienen, y las más abundantes son las islas CpG (regiones ricas en C y G), enlas que las citosinas pueden estar o no metiladas. Estas secuencias se encuentran cerca delpunto de inicio de la transcripción, 40 pb por delante o por detrás de este.

También se necesitan elementos proximales, localizados como mucho a 100 pb del iniciode transcripción, que forman el promotor regulador. Son secuencias reguladorasreconocidas por proteínas que aumentan la eficacia del ensamblaje del complejo detranscripción. Estas proteínas ejercen su función interaccionando con la propia ARNpolimerasa o con los factores de transcripción generales.

En la transcripción también son importantes los elementos distales, los llamadosEnhancers y Silenciadores. Son secuencias que influyen en la transcripción de los genesactuando a distancias muy amplias de dichos genes (del orden de Kb, hasta unos 50 kb dedistancia hacia 3’ o 5’ e incluso en intrones). Los Enhancers o Amplificadoresaumentan/promueven la expresión y la transcripción de los genes, aunque por sí mismosno tienen actividad promotora. Otras secuencias se denominan Silenciadores o Represoresy actúan silenciando a los genes desde la distancia como en el caso anterior.

Se han llevado a cabo una serie de experimentos para determinar como funcionan estassecuencias (ver diapositiva 31). Cuando solo hay un promotor se da la transcripción a nivelbasal (a), si no hay promotor no se da transcripción (b), si hay un enhancer sin promotortampoco hay transcripción (c), si hay un enhancer cerca o lejos de un promotor, se da latranscripción a niveles importantes.

Los enhancers actúan por la unión de proteínas específicas que forman una especie de lazopara interaccionar con la ARN polimerasa y con la maquinaria de transcripción,aumentando así la tasa y la eficiencia de este proceso. Los silenciadores tienen las mismascaracterísticas y actúan igual que los enhancers, pero inhibiendo la transcripción. Estos dostipos de elementos pueden actuar incluso estando por detrás del inicio de transcripción oen intrones, y pueden controlar varios genes de forma coordinada.

Los aislantes o insulators son secuencias que sirven para restringir o limitar la acción deenhancers y silenciadores, de manera que no influyan sobre otros genes que no son los

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 13

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

suyos (ver diapositiva 31). Los silenciadores también sirven para separar regiones activasde la cromatina, de otras no activas.

Mutaciones en las secuencias reguladoras proximales o distales o en la región promotora,harán que un gen cambie su expresión.

DIAPOSITIVA 30 Y 31:

Transcripción: Promotores, Enhancers, Silenciadores y Aislantes.

2.2.-Modificaciones a nivel de procesado de ARN

Al comienzo de la transcripción se producen unas modificaciones de los transcritos que sevan generando en el extremo 5’ y en el interior de los genes.

La primera modificación es la adición de la caperuza en 5’. Esta estructura es una guaninametilada que se añade al extremo 5’ del transcrito, y que no estaba presente en el ADNmolde. Se añade mediante un enlace entre el C 5' del primer nucleótido y el C 5' de laguanina, que quedan separados por tres grupos fosfato. Tiene una función esencial para elARN mensajero (ARNm) ya que permite que sea reconocido por el ribosoma, lo protegefrente a exonucleasas (gracias a unas proteínas que se unen a la caperuza), y ademásaumenta su eficiencia de ser transportado al citoplasma para su traducción. Esta adición seproduce al principio, cuando el transcrito tiene unos 25-30 nucleótidos de longitud. Eneste momento la transcripción para mediante la acción de las proteínas NELF y DSIF, y seda el reclutamiento de las enzimas responsables de la adición de la caperuza 5', unaguanidil transferasa y una guanina7-metiltransferasa. Estas dos enzimas se encontrabanunidas al extremo C terminal de la ARN polimerasa (dominio CTD fosforilado) desde elinicio de la transcripción. Cuando se ha añadido la metilguanosina, se recluta la proteína P-TEFb, que es una kinasa encargada de fosforilar de nuevo el dominio CTD de la ARNpolimerasa. En este momento las enzimas unidas al dominio C terminal se sueltan, a la vezque se sueltan las que paraban la transcripción, y así esta puede seguir con el proceso deelongación. Este punto es un check point o punto de control, es decir, si la adición de lacaperuza no se produce correctamente, la transcripción es abortada. Para seguir con elproceso de elongación se tiene que unir el complejo CBC.

DIAPOSITIVA 32:

Procesado de los ARNms: capping en 5’.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 14

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

La segunda modificación es la eliminación de los intrones, lo que se denomina Splicing,Ayuste o corte y empalme. Los genes eucariotas se dividen en regiones codificantes(exones) y no codificantes (intrones). Los intrones tienen secuencias que han de sereliminadas del transcrito primario para obtener el ARNm maduro. El intrón está marcadopor una serie de secuencias consenso, en el extremo 5' está la región 5' de splicing, en el 3'la secuencia 3' de splicing y en el interior del gen una secuencia de ramificación. Estassecuencias son reconocidas por un complejo llamado Espliceosoma(o procesasoma oayusteosoma), formado por ARNs muy cortos y ricos en U (U1, U2, U4, U5, U6) asociados aribo-nucleoproteínas, y a otras proteínas. Los intrones se eliminan mediante elreconocimiento de esas secuencias, permitiendo la unión de los exones en el proceso detranscripción. Esto ocurre a la vez que se va dando la transcripción, no cuando ha acabado.

DIAPOSITIVA 33:

Procesado de los mRNAs: eliminación

de intrones (splicing)

Los intrones no siempre se eliminan de la misma forma, un ARNm primario puede darlugar a varios y distintos ARNm maduros con diferentes combinaciones de exones, estoprovoca la gran variedad de proteínas existentes y se conoce como Splicing Alternativo. Seconsidera que el 90% de los genes humanos sufren splicing alternativo. Un ejemplo desplicing alternativo es el de la alfa-tropomiosina. En este caso, el ARNm es diferente segúnel tipo celular. Así, a partir de un mismo gen se obtienen diferentes proteínas (diapositiva35). Existen exones constitutivos, que se encuentran en todas las proteínas, y exonesalternativos, que solo están en algunas.

En la diapositiva 34 se muestran los diferentes tipos de splicing que se pueden dar. En ladiapositiva 35 se muestra el splicing alternativo del gen de la alfa-tropomiosina según entejido en que se vaya a expresar.

Este proceso se da por la presencia en los propios genes de una serie de secuenciasreguladoras, que pueden estar en exones (ESE, ESS) o en intrones (ISS, ISE), y que sonreconocidas por proteínas que activan o reprimen el splicing, siendo reconocidas o no porel spliceosoma. Estos sitios de reconocimiento suelen ser específicos de tejido, de estamanera en cada tipo de tejido se produciría una proteína diferente. En la diapositiva 36 semuestra como actúan estos activadores y los represores del splicing.

DIAPOSITIVAS 34- 36: Procesado de los mRNAs: splicing alternativo.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 15

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

La tercera modificación es la poliadenilación en 3’, es decir, la adición de una cola polyA.Para que esto se de, se necesitan dos secuencias fundamentales en el ARNm que se estátranscribiendo, la señal de poliadenilación AAUAAA, y una secuencia rica de Uracilos yGuaninas. El complejo Factor de Especificidad de Corte y Poliadenilación (CPSF) se une a laseñal de poliadenilación, y la secuencia rica en G y U se une al factor de estimulación decorte (CstF), también se reclutan una polimerasa poli A y varios factores de corte. Acontinuación se da un corte, unos 50 nucelótidos por detrás de la señal de poliadenilación,por parte del CPSF. En el extremo 3’ del fragmento del transcrito se añade la cola polyA(unos 200 nucleótidos de A) por la acción de una polimerasa poli-A (PAP) para que seforme el transcrito maduro. El otro fragmento se degrada por la acción de las exonucleasas(Rat1) en dirección 5'3'. Cuando esta exonucleasa llega al sitio donde todavía se estátranscribiendo el ADN, se produce el desensamblaje del complejo de transcripción y lafinalización de la misma. La poliadenilación está relacionada con el final de latranscripción. La cola Poli-A añadida permite proteger al transcrito frente a la acción de lasexonucleasas, regular la eficiencia de la traducción y además mejorar la eficiencia deltransporte del ARNm al citoplasma. No todos los ARNms presentarán cola Poli-A, porejemplo no lo presentan los ARNms que codifican para las proteínas Histonas, pero tienenotros sistemas para proteger los extremos 3'.

Según lo comentado hasta ahora, es evidente que existe un acoplamiento entre latranscripción y el procesado de los transcritos para que estos sean funcionales (verdiapositiva 38).

DIAPOSITIVAS 37 Y 38:

P r o c e s a d o d e l o s m R N A s :p o l i a d e n i l a c i ó n e n 3 ’ yAcoplamiento de transcripción yprocesado.

En el transporte del transcrito (ARNm) al citoplasma, el transcrito generado estácompletamente cubierto por proteínas, entre las que se encuentra el complejo TREX. Así, eltranscrito es dirigido al poro nuclear, por donde atravesará la membrana nuclear, mientrasque el complejo TREX se queda siempre en el núcleo. Una vez en el citoplasma, los ARNmson interceptados por unas proteínas esenciales para el inicio de la traducción, los factoresde iniciación.

DIAPOSITIVA 39:

Transporte del mRNA al citoplasma.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 16

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

2.3.-Modificaciones a nivel de traducción

La traducción de un transcrito específico se da por la acción de los ribosomas, los cualesestán formados por dos subunidades. Además se necesitan una serie de proteínasespecíficas como son los factores de iniciación, los factores de elongación y los factores determinación, y una serie de ARNt cargados con los aminoácidos necesarios. Las dossubunidades del ribosoma están normalmente separadas, y solo se ensamblan cuando seva a dar la traducción.

El proceso de iniciación de la traducción es bastante complejo y es el punto de regulaciónen la mayoría de los genes. Siempre tienen que estar presentes los siguientes elementos:un ribosoma completo y un ARNm molde con un codón de inicio (AUG) que siemprecodifica para una metionina. El ribosoma recluta un ARNt que lleva la metionina (primeraminoácido que se une a la proteína en eucariotas). Este ARNt se une a la subunidadpequeña del ribosoma (complejo de preiniciación), y se recluta el ARNm con factores deiniciación que reconocen la caperuza 5’ y la cola poli A y GTP. A continuación comienza elproceso de scanning para la búsqueda del codón de inicio de la traducción, que estáembebido en la secuencia Kozak GCCA/GCCAUGG. Así, se genera el Complejo depreiniciación abierto en el que se encuentra el ARNt, la metionina colocada encima delcodón de inicio y la subunidad pequeña del ribosoma. Una vez se añade la subunidadgrande del ribosoma el complejo de preiniciación se cierra y comienza el proceso deelongación.

DIAPOSITIVAS 40 Y 41:Traducción (I y II)

En la fase de elongación se necesitan factores de elongación, se van incorporando nuevosARNt cargados con los aminoácidos que van siendo reconocidos por los sucesivos codonesdespués del de inicio. Los aminoácidos que se van incorporando se unen a los otros porenlaces peptídicos. El ribosoma se va trasladando al extremo 3’ para ir reclutandoaminoácidos a los demás codones.

El ejemplo que ilustra los diferentes factores de elongación que participan se encuentra enla diapositiva 42. Como se puede ver hay 3 sitios activos en el ribosoma, el sitio peptidil(P), el sitio aminoacil (A) y el sitio de salida (E). El primer ARNt con la meteonina se une alsitio P, el factor de elongación EF1 alfa lleva el siguiente ARNt cargado con el aminoácidocorrespondiente al siguiente codón al sitio A, a continuación se produce un enlacepeptídico entre los dos aminoácidos que se quedan en el sitio aminoacil. Después se da unproceso de translocación y el ribosoma se mueve tres nucleótidos hacia la derecha (3') deltranscrito, quedando el sitio A vacío de nuevo. La translocación la lleva a cabo el factor de

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 17

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

elongación EF2, mediante la hidrólisis de un GTP. Ahora se puede volver a repetir el sucesoanterior para ir añadiendo aminoácidos a la nueva proteína.

La traducción termina cuando el siguiente codón que aparece dentro del ribosoma es uncodón de parada, que no especifica ningún aminoácido, por tanto no va a ser reconocidopor ningún ARNt sino por Factores de Terminación (-RF- Release Factors) de la traducción.Esto permite el desensamblaje del ribosoma y la liberación del péptido que ya estásintetizado. Para profundizar en este tema podéis consultar libros generales de Genética yBiología Molecular.

DIAPOSITIVA 42:

Traducción (III)

Las proteínas recién sintetizadas pueden sufrir modificaciones postraduccionales para ser funcionales o para ser transportadas a un compartimento celular donde ejercerán su función.

DIAPOSITIVA 43:

Modificaciones postraduccionales de lasproteínas.

En total el genoma tiene unos 20.000 genes que codifican para proteínas, y que pueden darunos 100.000 transcritos diferentes, de los que se pueden obtener 1.000.000 de proteínas diferentes.

DIAPOSITIVA 44:

Expresión génica en el genoma humano

2.4.-Mutaciones en regiones implicadas en la expresión de genes

Las mutaciones pueden ocurrir en regiones esenciales de los genes implicadas en suexpresión, por ejemplo en el promotor (importante para la expresión), en la 5’ UTR(importante para iniciar la traducción en el proceso de Scanning), en los exones (produciráuna alteración en la capacidad codificante del gen), en los intrones (se modificará su

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 18

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

eliminación), o en las señales de poliadenilación (el tránscrito no sería transportado deforma eficaz). Además estas mutaciones pueden afectar a las distintas etapas de laexpresión génica como se ilustra en la diapositiva 45. En definitiva, todas la partes del genson importantes, porque cada una tiene una función determinada.

DIAPOSITIVAS 45 Y 46:

Mutaciones

ANEXO 1

Podéis consultar las principales características del genoma humano en la diapositiva 46.

DIAPOSITIVA 47:

Principales características del genomahumano.

ANEXO 2-Proyecto ENCODE

Este proyecto se inició en el año 2003 como continuación a los resultados obtenidos en elproyecto Genoma Humano, donde se evidenciaba que sólo el 1.5-2 % del genoma humanoera codificante, y sus resultados se publicaron en 2012. Con el proyecto ENCODE(Enciclopedia de elementos de ADN) se pretendía dilucidar qué función tenía el resto degenoma “basura”. El objetivo era analizar 150 líneas celulares que crecen fácilmente en ellaboratorio, para identificar secuencias o elementos de ADN que fueran funcionales. Losexperimentos de expresión de genes eran principalmente el mapeo de regiones en las queel ADN estaba metilado, regiones con modificaciones de la cromatina (histonas), regioneshipersensibles a la ADNasa (desnudas de nucleosomas, que están siendo expresadas),sitios de unión a factores de transcripción, elementos enhancers, promotores, y todos lostranscritos que se podían generar en las líneas celulares, es decir, todos los ELEMENTOSFUNCIONALES DEL GENOMA. Se definieron los elementos funcionales del genoma comosegmentos que dieran lugar a productos detectables (proteínas o tránscritos) o a firmasbioquímicas reproducibles

Se extraen de este proyecto tan ambicioso, tres conclusiones principales:

1.- El 80.4% del genoma humano participa al menos en un proceso bioquímico asociado aARN o a cromatina en al menos un tipo celular. En el 80% del genoma hay algún elementofuncional presente, no todo es ADN basura.

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 19

ESTRUCTURA DEL GENOMA HUMANO Y MECANISMOS DE EXPRESIÓN GÉNICA

Material didáctico: Módulo 1 – Clase 1

2.- Muchos polimorfismos de nucleótido sencillo (SNPs) asociados a enfermedades porestudios a escala genómica (GWAS), que no estaban localizados en ningún gen concreto niregión codificante, se han mapeado en algunos de estos elementos funcionales del genoma.

3.- Alrededor del 75% del genoma se transcribe en algún momento y tipo celular. Por otraparte, los genes están entrelazados de forma que se sintetizan transcritos solapantes deambas cadenas de DNA. Estos descubrimientos obligan a replantear la definición de gen yde la mínima unidad de la herencia.

DIAPOSITIVAS 48 Y 49:

El proyecto ENCODE.

ANEXO 3. El proyecto Epigenoma

Los resultados de este proyecto se publicaron en 2015, y se pueden encontrar en la webhttp://www.roadmapepigenomics.org/. Se repitieron los experimentos que se habíanhecho en el proyecto ENCODE, utilizando células de diferentes tipos extraídas de muestrashumanas. En la diapositiva 51 se muestran todos los tejidos que se utilizaron. Se quería verlas diferencias epigenéticas entre las diferentes células y tejidos

La información que se obtuvo confirmó muchas cosas que ya se sabían del proyectoENCODE, en tejidos humanos.

Las conclusiones que se sacaron fueron:

Todas las células del cuerpo humano tienen el mismo genoma pero diferentesepigenomas (modificaciones del ADN y de las histonas).

Cuando las células madre se diferencian hacia un tejido cambia su epigenoma y la dinámica de las marcas epigenómicas permite establecer relaciones significativas entre tipos celulares, tejidos y linajes.

Variaciones genéticas asociadas a enfermedades, como mutaciones y polimorfismos, tienen un efecto sobre los patrones epigenéticos en tejidos relevantes para las mismas.

DIAPOSITIVAS 50 Y 51

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 20