SVILUPPO DI ALGORITMI PER LA SEGMENTAZIONE DI CROMOSOMI enrigri/Tesi/tesi_chiusso v2.1.pdf  che...

download SVILUPPO DI ALGORITMI PER LA SEGMENTAZIONE DI CROMOSOMI enrigri/Tesi/tesi_chiusso v2.1.pdf  che µe

of 48

  • date post

    20-May-2019
  • Category

    Documents

  • view

    212
  • download

    0

Embed Size (px)

Transcript of SVILUPPO DI ALGORITMI PER LA SEGMENTAZIONE DI CROMOSOMI enrigri/Tesi/tesi_chiusso v2.1.pdf  che...

SVILUPPO DI ALGORITMI PER LASEGMENTAZIONE DI CROMOSOMI IN

IMMAGINI IN METAFASE

Francesco ChiussoRelatore: Prof. Alfredo Ruggeri, Universita di Padova

Correlatore: Enrico Grisan

Aprile 2006

Indice

1 Introduzione 31.1 Analisi dei cromosomi . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.1 Il cariogramma . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Scopo della tesi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.3 Analisi automatica dei cromosomi: lavori correlati . . . . . . . . . 81.4 Struttura della tesi . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Metafasi in banda Q 112.1 Aspetto di una metafase . . . . . . . . . . . . . . . . . . . . . . . 112.2 Particolarita delle immagini . . . . . . . . . . . . . . . . . . . . . 12

3 Segmentazione dellimmagine 153.1 Lavori correlati . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2 Segmentazione multistadio . . . . . . . . . . . . . . . . . . . . . . 17

3.2.1 Descrizione dellalgoritmo . . . . . . . . . . . . . . . . . . 173.3 Osservazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4 I metodi 254.1 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.2 Thresholding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4.2.1 Il metodo adottato . . . . . . . . . . . . . . . . . . . . . . 264.3 Eliminazione nuclei . . . . . . . . . . . . . . . . . . . . . . . . . . 274.4 Estrazione dellasse . . . . . . . . . . . . . . . . . . . . . . . . . . 274.5 Conferma di cromosoma singolo . . . . . . . . . . . . . . . . . . . 29

4.5.1 Il metodo adottato . . . . . . . . . . . . . . . . . . . . . . 294.6 Curvatura e punti concavi . . . . . . . . . . . . . . . . . . . . . . 30

4.6.1 Il metodo adottato . . . . . . . . . . . . . . . . . . . . . . 304.7 Ricerca valli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.8 Ricerca sovrapposizioni . . . . . . . . . . . . . . . . . . . . . . . . 34

4.8.1 Misura degli angoli e delle distanze . . . . . . . . . . . . . 344.9 Ricerca miglior combinazione di tagli . . . . . . . . . . . . . . . . 35

5 Conclusioni 375.1 Valutazione risultati e indici . . . . . . . . . . . . . . . . . . . . . 375.2 Proposte di sviluppo . . . . . . . . . . . . . . . . . . . . . . . . . 40

A Il prototipo 42A.1 Prestazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42A.2 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3

INDICE

4

Sommario

Lanalisi del cariogramma e un esame diffuso in citogenetica. Partendo daunimmagine di cromosomi acquisita da microscopio, questi vengono ritagliati eincollati su una griglia standard in cui sono disposti e numerati secondo un criteriodi classificazione unificato. Questa disposizione aiuta gli scienziati ad identificarele alterazioni che possono portare ad un disturbo genetico.

La tesi si occupa dellautomatizzazione di questo processo, allo scopo di evitareil piu possibile il suo svolgimento manuale poiche, se ripetuto molte volte, risultaessere lungo e tedioso. In particolare tratta la segmentazione dei cromosomi nelleimmagini di metafasi in banda Q, il primo passo per la realizzazione di un sistemadi cariotipizzazione automatica. Essa include lindividuazione e lesclusione dinuclei, residui di colorazione, e altro rumore; lindividuazione e la segmentazionedi cromosomi isolati ma anche adiacenti o sovrapposti.

Lapproccio consiste in una serie di metodi applicati in successione. Limma-gine viene prima segmentata tramite thresholding per distinguere i cromosomidallo sfondo. Sui gruppi di cromosomi adiacenti o sovrapposti vengono tentatidiversi metodi di separazione basati sulla forma del contorno e sulla presenza divalli del tono di grigio.

Il sistema proposto e stato testato su trenta immagini nelle quali il 96 % deicromosomi e stato correttamente segmentato.

INDICE

2

Capitolo 1

Introduzione

I cromosomi sono corpi densi che si trovano nel nucleo delle cellule. Essi conten-gono il DNA, una lunga molecola che e estremamente attorcigliata e condensata.Un singolo tratto di sequenza DNA si chiama gene. Ciascun cromosoma contienealcune migliaia di geni.

Lanalisi dei cromosomi e utile a diagnosticare e prevenire anomalie genetiche,sia congenite, come la sindrome di Down, o altri disturbi acquisiti, come il cancroe la leucemia.

Durante la gran parte del ciclo cellulare, interfase, i cromosomi sono menocondensati e non sono visibili come oggetti singoli al microscopio. Tuttavia du-rante la divisione cellulare, la mitosi, i cromosomi si agglomerano e divengonocorpi visibili allinterno del nucleo della cellula. Per mitosi si definisce il proces-so di divisione nucleare che porta alla formazione di due identiche cellule figlieattraverso le fasi di profase, metafase, anafase, e telofase. I cromosomi sonopiu facilmente visti e identificati allo stadio di metafase della divisione cellulare.Benche non significativo dal punto di vista biologico e comune riferirsi ad unostadio intermedio di contrazione sito tra profase e metafase indicato con il nomedi prometafase.

Il numero di cromosomi nelle cellule umane e 46 con 22 coppie di autosomi(una per tipo proviene dalla madre e una per tipo proviene dal padre) e 2 cro-mosomi sessuali due cromosomi X per le femmine (uno dal padre e uno dallamadre) o un X e un Y per i maschi (X dalla madre e Y dal padre).

Il cromosoma metafasico ha una lunghezza variabile: 3 10 m. Ogni cro-mosoma e costituito da 2 subunita longitudinali, i cromatidi, uniti a livello delcentromero, detto anche cinetocore o costrizione primaria. Rispetto a un pianopassante per il cinetocore e parallelo ai cromatidi, il cromosoma ha una strutturasimmetrica.

Il centromero non occupa la stessa posizione in tutti i cromosomi e divideogni cromatide in due parti, i bracci, la cui lunghezza dipende dalla posizionedel cinetocore. Per lo piu i bracci sono di lunghezza diversa, talvolta invece sonouguali. La posizione del centromero permette di classificare i cromosomi in 4 tipi:

Acrocentrici: centromero in posizione terminale.

Telocentrici: centromero in posizione subterminale.

Submetacentrici: centromero in posizione submediana.

3

Capitolo 1. Introduzione

Metacentrici: centromero in posizione mediana.

1.1 Analisi dei cromosomi

Prima della nascita delle tecniche di bandeggio il citogenetista classificava i cro-mosomi soltanto in base alla dimensione del cromosoma e alla posizione del centro-mero. Lindividuazione del singolo cromosoma non era in questo modo possibilee i cromosomi venivano classificati soltanto in sette gruppi (AG) basandosi sulladimensione e sulla posizione del centromero:

Gruppo A (13). Cromosomi larghi, metacentrici, facilmente distinguibilidagli altri per le dimensioni e la posizione del centromero.

Gruppo B (45). Cromosomi larghi, submetacentrici. Gruppo C (612, X). Cromosomi di taglia media, metacentrici o submeta-

centrici.

Gruppo D (1315). Cromosomi di taglia media, acrocentrici, con satelliti. Gruppo E (1618). Cromosomi relativamente corti, metacentrici o subme-

tacentrici.

Gruppo F (1920). Cromosomi corti, metacentrici. Gruppo G (2122, Y). Cromosomi corti, acrocentrici, con satelliti. Y non

possiede satellite.

A partire dagli anni 70 sono state introdotte diverse tecniche di bandeggio(es. Qbanding, Gbanding, Rbanding) che hanno rivoluzionato la citogenetica.Trattando le cellule e possibile ottenere una specie di codice a barre che rendepossibile individuare ogni singolo cromosoma e rilevare anche piccoli cambiamentinella struttura cromosomica.

Esistono numerose tecniche che producono il bandeggio o banding pattern deicromosomi in metafase. Una banda e definita come quella parte di cromosomache e chiaramente distinguibile dai segmenti adiacenti, apparendo piu scura o piuchiara con una o piu tecniche di bandeggio.

Banda Q. Si utilizza un colorante fluorescente, la quinacrina. Banda G. Si trattano i cromosomi e si colorano con Giemsa 1. Le bande G

corrispondono in larga misura con le bande Q, sono caratterizzate da unamaggiore spiralizzazione della fibrilla elementare che forma il cromosoma.

Banda R. Si trattano i cromosomi con temperature elevate (87C) e si colo-rano con Giemsa. Le bande che si ottengono sono complementari alle bandeG.

Banda C. I cromosomi si colorano nelle aree vicine al centromero. Talvoltasi colorano anche aree interstiziali ricche di DNA altamente ripetitivo. Conopportune varianti e possibile colorare anche le tre frazioni di DNA satellite.

1Tipo di colorante ottenuto da una mistura di blu di metilene e di eosina in soluzione alcolica

4

Capitolo 1. Introduzione

Quando si parla di risoluzione del bandeggio, si intende il numero di bandeche e possibile distinguere in un insieme aploide, ovvero 22 autosomi piu X e Y. Idiversi tipi di risoluzione dipendono non solo dallo stato di condensazione, ovverodallo stato della mitosi al quale si trova la cellula, ma anche dalla tecnica usataper rivelare il bandeggio. Cromosomi con bandeggi Q, G, R piu lunghi mostranoun numero di bande maggiore rispetto a quelli piu corti. Le cellule in metafasepossiedono approssimativamente 450 bande e si definiscono in prometafase quan-do hanno 550 bande e oltre. Una cellula puo essere definita in profase soltantose almeno 850 bande sono visibili.

Il maggior numero di bande presente in stadi di maggiore elongazione fornisceuna descrizione con una risoluzione piu elevata della struttura del cromosoma,piu vantaggiosa ai fini dellanalisi. Lanalisi in questa fase viene tuttavia resa piudifficoltosa a c