Detection and Classification of Lesions in Mammographies ... · em homens, sendo ele o tipo de ......

7
1 Abstract— Breast cancer is a worldwide public health problem, with a high rate of incidence and mortality. The most widely used to perform early on possible abnormalities in breast tissue is mammography. In this work we aim to verify and analyze the application of classifiers based on neural networks (multilayer perceptrons, MLP, and radial bassis functions, RBF), and support vector machines (SVM) with several different kernels, in order to detect the presence of breast lesions and classify them into malignant of benign. We used the IRMA database, composed by 2,796 patch images, which consist of 128 x 128 pixels region of interest of real mammography images. IRMA database is organized by BI-RADS classification (normal, benign and malignant) and tissue type (dense, extremely dense, adipose, and fibroglandular), generating 12 classes. Each image was represented by Zernike moments extracted from the components of the two levels decomposition by morphological wavelets. Multilayer perceptrons with two layers were the successful methods, reaching an accuracy rate of 96.20%, proving the possibility of building a computer-aided diagnosis system to improve accuracy of mammogram analysis, contributing to improve prognosis as well. Keywords— Medical image classification, Breast Cancer, Artificial Neural Networks, Computer-Aided Diagnosis (CAD). I. INTRODUÇÃO CÂNCER de mama resulta da proliferação anormal das células da mama, que ocasiona um tumor com potencial de invadir outros tecidos. Sendo considerado um problema de saúde pública o câncer de mama é um grupo heterogêneo de patologias que possuem diferentes comportamentos. Devido a sua heterogeneidade ele se manifesta por diferentes apresentações clínicas e morfológicas e variadas características genéticas [1]–[3]. O câncer de mama é o tipo de câncer com maior incidência na população feminina mundial e brasileira, exceto pelos casos de câncer de pele não melanoma, e também uma das principais causas de morte por câncer, tanto em países T. N. Cruz, Departamento de Engenharia Biomédica, Centro de Tecnologia e Geociências, Universidade Federal de Pernambuco, Recife, PE, Brasil, [email protected] T. M. Cruz, Departamento de Engenharia Biomédica, Centro de Tecnologia e Geociências, Universidade Federal de Pernambuco, Recife, PE, Brasil, [email protected] W. P. Santos, Departamento de Engenharia Biomédica, Centro de Tecnologia e Geociências, Universidade Federal de Pernambuco, Recife, PE, Brasil, [email protected] Manuscrito recebido em 2 de janeiro de 2017; revisado em 3 de janeiro de 2018. Corresponding author: Wellington Pinheiro dos Santos desenvolvidos e em desenvolvimento [4], [5]. As taxas de incidência são maiores nos países desenvolvidos, embora tenham ocorrido, em alguns países, tendências para redução e estabilização na primeira década de 2000 [4], [5]. O câncer de mama corresponde a 22% dos tipos de câncer detectado anualmente, tendo sua maior incidência em mulheres do que em homens, sendo ele o tipo de câncer maligno mais frequente entre as mulheres no mundo e o primeiro que leva ao óbito indivíduos do sexo feminino. No Brasil, o Instituto Nacional de Câncer (INCA) relata uma média de 57 casos a cada 100.000 mulheres, onde 13.345 óbitos foram contabilizados em 2014 [5]–[7]. O exame mais utilizado hoje em dia para se realizarem de forma precoce, possíveis anormalidades no tecido mamário é a mamografia [5], [8]–[10]. Para categorização de lesões mamárias das mamografias, é utilizado atualmente no Brasil um sistema baseado no BIRADS (Breast Imaging Reporting and Data System), que teve origem no Colégio Americano de Radiologia (EUA) e foi traduzida para o Brasil pelo Colégio Brasileiro de Radiologia. Esse método de categorização realiza a padronização do laudo de lesões mamárias e ainda sugere quais as condutas precisam ser tomadas em cada caso [5], [11]–[15]. O aprendizado de máquina pode facilitar a detecção e classificação de lesões mamárias quando não há alterações na textura ou na morfologia, tal como nas imagens utilizadas neste trabalho, com exemplos na Figura 1, quando se tem apenas o recurso de investigação visual humano. Na Figura 1 têm-se exemplos de regiões de interesse sob suspeição de lesão, que podem não conter lesões ou possuir lesões malignas ou benignas, podendo o tecido mamário ser adiposo, fibroglandular, denso, ou muito denso. Este trabalho tem como objetivo investigar o uso de wavelets morfológicas e máquinas de aprendizado conexionistas para classificar regiões suspeitas de lesão de mama em mamografias digitais, independente do tecido mamário. A importância desse tipo de classificação se dá pelo fato de que os sistemas de saúde pública nacionais têm considerado apenas a aquisição de imagens mamográficas de mamas adiposas, para as quais, por conseguinte, existe suficiente conhecimento especialista para o diagnóstico por imagem. Dessa forma, sistemas de apoio ao diagnóstico do câncer de mama que independam da natureza do tecido mamário podem contribuir para a melhora do diagnóstico precoce e, por consequência, do prognóstico de pacientes portadoras de lesão maligna. Este trabalho está organizado como segue: na seção II são apresentados trabalhos relacionados; na seção III são apresentados aspectos metodológicos, as ferramentas de software utilizadas e a base de imagens IRMA, empregada na construção e validação do método desenvolvido; na seção IV O Detection and Classification of Lesions in Mammographies Using Neural Networks and Morphological Wavelets T. N. Cruz, T. M. Cruz, and W. P. Santos 926 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

Transcript of Detection and Classification of Lesions in Mammographies ... · em homens, sendo ele o tipo de ......

1Abstract— Breast cancer is a worldwide public health problem, with a high rate of incidence and mortality. The most widely used to perform early on possible abnormalities in breast tissue is mammography. In this work we aim to verify and analyze the application of classifiers based on neural networks (multilayer perceptrons, MLP, and radial bassis functions, RBF), and support vector machines (SVM) with several different kernels, in order to detect the presence of breast lesions and classify them into malignant of benign. We used the IRMA database, composed by 2,796 patch images, which consist of 128 x 128 pixels region of interest of real mammography images. IRMA database is organized by BI-RADS classification (normal, benign and malignant) and tissue type (dense, extremely dense, adipose, and fibroglandular), generating 12 classes. Each image was represented by Zernike moments extracted from the components of the two levels decomposition by morphological wavelets. Multilayer perceptrons with two layers were the successful methods, reaching an accuracy rate of 96.20%, proving the possibility of building a computer-aided diagnosis system to improve accuracy of mammogram analysis, contributing to improve prognosis as well.

Keywords— Medical image classification, Breast Cancer,

Artificial Neural Networks, Computer-Aided Diagnosis (CAD).

I. INTRODUÇÃO

CÂNCER de mama resulta da proliferação anormal das células da mama, que ocasiona um tumor com potencial

de invadir outros tecidos. Sendo considerado um problema de saúde pública o câncer de mama é um grupo heterogêneo de patologias que possuem diferentes comportamentos. Devido a sua heterogeneidade ele se manifesta por diferentes apresentações clínicas e morfológicas e variadas características genéticas [1]–[3].

O câncer de mama é o tipo de câncer com maior incidência na população feminina mundial e brasileira, exceto pelos casos de câncer de pele não melanoma, e também uma das principais causas de morte por câncer, tanto em países

T. N. Cruz, Departamento de Engenharia Biomédica, Centro de Tecnologia

e Geociências, Universidade Federal de Pernambuco, Recife, PE, Brasil, [email protected]

T. M. Cruz, Departamento de Engenharia Biomédica, Centro de Tecnologia e Geociências, Universidade Federal de Pernambuco, Recife, PE, Brasil, [email protected]

W. P. Santos, Departamento de Engenharia Biomédica, Centro de Tecnologia e Geociências, Universidade Federal de Pernambuco, Recife, PE, Brasil, [email protected]

Manuscrito recebido em 2 de janeiro de 2017; revisado em 3 de janeiro de 2018.

Corresponding author: Wellington Pinheiro dos Santos

desenvolvidos e em desenvolvimento [4], [5]. As taxas de incidência são maiores nos países desenvolvidos, embora tenham ocorrido, em alguns países, tendências para redução e estabilização na primeira década de 2000 [4], [5]. O câncer de mama corresponde a 22% dos tipos de câncer detectado anualmente, tendo sua maior incidência em mulheres do que em homens, sendo ele o tipo de câncer maligno mais frequente entre as mulheres no mundo e o primeiro que leva ao óbito indivíduos do sexo feminino. No Brasil, o Instituto Nacional de Câncer (INCA) relata uma média de 57 casos a cada 100.000 mulheres, onde 13.345 óbitos foram contabilizados em 2014 [5]–[7]. O exame mais utilizado hoje em dia para se realizarem de forma precoce, possíveis anormalidades no tecido mamário é a mamografia [5], [8]–[10].

Para categorização de lesões mamárias das mamografias, é utilizado atualmente no Brasil um sistema baseado no BIRADS (Breast Imaging Reporting and Data System), que teve origem no Colégio Americano de Radiologia (EUA) e foi traduzida para o Brasil pelo Colégio Brasileiro de Radiologia. Esse método de categorização realiza a padronização do laudo de lesões mamárias e ainda sugere quais as condutas precisam ser tomadas em cada caso [5], [11]–[15].

O aprendizado de máquina pode facilitar a detecção e classificação de lesões mamárias quando não há alterações na textura ou na morfologia, tal como nas imagens utilizadas neste trabalho, com exemplos na Figura 1, quando se tem apenas o recurso de investigação visual humano. Na Figura 1 têm-se exemplos de regiões de interesse sob suspeição de lesão, que podem não conter lesões ou possuir lesões malignas ou benignas, podendo o tecido mamário ser adiposo, fibroglandular, denso, ou muito denso.

Este trabalho tem como objetivo investigar o uso de wavelets morfológicas e máquinas de aprendizado conexionistas para classificar regiões suspeitas de lesão de mama em mamografias digitais, independente do tecido mamário. A importância desse tipo de classificação se dá pelo fato de que os sistemas de saúde pública nacionais têm considerado apenas a aquisição de imagens mamográficas de mamas adiposas, para as quais, por conseguinte, existe suficiente conhecimento especialista para o diagnóstico por imagem. Dessa forma, sistemas de apoio ao diagnóstico do câncer de mama que independam da natureza do tecido mamário podem contribuir para a melhora do diagnóstico precoce e, por consequência, do prognóstico de pacientes portadoras de lesão maligna.

Este trabalho está organizado como segue: na seção II são apresentados trabalhos relacionados; na seção III são apresentados aspectos metodológicos, as ferramentas de software utilizadas e a base de imagens IRMA, empregada na construção e validação do método desenvolvido; na seção IV

O

Detection and Classification of Lesions in Mammographies Using Neural Networks and

Morphological Wavelets T. N. Cruz, T. M. Cruz, and W. P. Santos

926 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

são exibidos e comentados os resultados, apresentando-se conclusões parciais; por fim, na seção V, são apresentadas as conclusões gerais e discutidas perspectivas de trabalhos futuros.

(a1) (b1) (c1)

(a2) (b2) (c2)

(a3) (b3) (c3)

(a4) (b4) (c4)

Figura 1. Imagens de regiões de interesse com suspeita de lesão de imagens mamográficas digitais com alterações na morfologia e na textura que dificultam a identificação visual por parte de um especialista, separadas por diagnóstico, i.e. sem lesão (a), com lesão benigna/circunscrita (b), ou maligna/espiculada (c), e por densidade mamária, i.e. mama adiposa (1), fibroglandular (2), densa (3), e muito densa (4).

II. REVISÃO DA LITERATURA

A. Sistemas inteligentes e diagnóstico por imagem Sistemas inteligentes para auxílio ao diagnóstico por

imagem têm sido utilizados com sucesso para otimizar o diagnóstico precoce do câncer de mama [16]–[24]. Esses sistemas têm utilizado com frequência máquinas de aprendizado conexionistas, comumente baseadas em máquinas de vetor de suporte com diferentes kernels e arquiteturas diversas de redes neurais artificiais [25]–[28], podendo atingir acurácias elevadas na detecção e classificação de lesões mamárias em imagens mamográficas, especialmente quando combinam métodos de representação de imagens na etapa de extração de atributos ou mesmo combinados a arquiteturas específicas de redes neurais, tais como os métodos baseados em séries e transformadas de wavelets [25], [29]–[31].

Em [32] se propõe um método para classificação de regiões de interesse de mamografias utilizando decomposição em

séries de wavelets lineares e classificadores polinomiais. Foram utilizadas 360 imagens da base DDSM. No trabalho é mostrado que se pode conseguir resultados consideravelmente altos de acurácia de diagnóstico, de 90,12% em média para wavelets Daubechies-8, mas o consumo de memória é razoavelmente alto, dado que as instâncias têm como atributos os próprios pixels das regiões de interesse de imagens de mamografia. Além disso, o trabalho se restringiu ao esforço de classificação de lesão entre maligna e benigna.

Em [33] é proposto um método para detecção e classificação de regiões de interesse de mamografias utilizando decomposição em séries de wavelets lineares e representação por momentos de Zernike. Os classificadores foram baseados em redes de aprendizado extremo (Extreme Learning Machines, ELM) e máquinas de vetor de suporte, buscando variar os kernels dessas máquinas de aprendizado. Também foi investigado o uso do classificador kNN e de árvores de decisão. Na extração de atributos também foi investigado o uso do espectro morfológico. Foram utilizadas 355 imagens de mama adiposa da base IRMA, sendo 233 instâncias sem lesão, 72 com achados benignos, e 83 achados malignos. O foco desse trabalho foi maximizar a acurácia e minimizar o tempo de treinamento. A melhor configuração foi a máquina de vetor de suporte com kernel linear, com extração de atributos baseada na decomposição em wavelets Symlet-8 e momentos de Zernike, atingindo 94,11% de acurácia e sendo, na média, 50 vezes mais rápida que as configurações propostas por [32].

Neste trabalho se procura generalizar a abordagem de [33] para imagens também da base IRMA, mas não somente de mama adiposa, mas sim também de tecido fibroglandular, denso e muito denso, buscando construir um método de detecção e classificação de lesões de mama em mamografias que independa da natureza do tecido mamário e, portanto, da faixa etária da paciente. Também se busca neste trabalho investigar o uso de wavelets morfológicas na etapa de extração de atributos [34], [35].

B. Wavelets Morfológicas Uma wavelet unidimensional !(!) é um sinal que obedece

às seguintes condições:

! ! !" = 0,!!

!! (1)

0 < |! ! |!!" < +∞.!!

!! (2)

A wavelet !(!) é chamada de wavelet mãe. As wavelets

filhas !!,!(!) são geradas a partir de translações b e mudanças de escala a [36], [37], de forma que:

!!,! ! = 1!!

! − !! . (3)

Assim, dado um sinal no tempo !(!), sua transformada de

wavelets !(!, !) é dada por:

! !, ! = ! ! !!,!∗ ! !",!!

!!

(4)

DA CRUZ et al.: DETECTION AND CLASSIFICATION 927

onde * representa o conjugado [36], [37].

O Algoritmo de Mallat considera que a decomposição de wavelets pode ser considerada como uma sequência de filtros passa baixas e passa altas, de forma que, para um sinal no tempo !(!), tem-se, para um único nível [36], [37]:

! ! ≈ !! ! + !! ! , (5)

onde !!(!) são os coeficientes de detalhes, enquanto !!(!) são os coeficientes de aproximação. Generalizando para n níveis, tem-se:

! ! ≈ !! ! + !! ! ,!

!!! (6)

onde !! ! = !! ! ∗ ℎ!"#(!), para ! ≥ 1, !! ! = !!!! ! ∗ℎ!"#(!), para ! ≥ 2, e !! ! = ! ! ∗ ℎ!"#(!), onde !!(!) e !!(!) são os coeficientes de aproximação e detalhes para o i-ésimo nível, respectivamente, e ℎ!"#(!) e ℎ!"#(!) são expressões no tempo de filtros passa altas e passa baixas, nesta ordem. * é o operador convolução.

Para uma imagem normalizada !: ! → [0, 1], onde ! ⊆ ℤ!, a decomposição em wavelets em n níveis é dada por:

! ! ≈ !! ! + !!,! ! + !!,! ! + !!,! ! ,!

!!! (7)

onde !!(!) é o coeficiente de aproximação do n-ésimo nível, e !!,!(!), !!,!(!) e !!,!(!) são os i-ésimos coeficientes de detalhes horizontais, verticais e diagonais, respectivamente, para !!: ! → [0, 1], !!,!: ! → [0, 1], !!,!: ! → [0, 1], !!,!: ! → [0, 1], onde

!!,! ! = !! ! ∗ ℎ! ! , (8)

!!,! ! = !! ! ∗ ℎ! ! , (9)

!!,! ! = !! ! ∗ ℎ! ! , (10)

e

!! ! = !!!! ! ∗ ℎ! ! , 2 ≤ ! ≤ !, (11)

!! ! = ! ! ∗ ℎ! ! , (12)

para 1 ≤ ! ≤ ! e ! ∈ !. A máscara ℎ!: ! → [0, 1] é de um filtro passa baixas passivo que não privilegia direção, enquanto ℎ!: ! → [0, 1], ℎ!: ! → [0, 1] e ℎ!: ! → [0, 1] são máscaras de filtros passa altas de detalhes horizontais, verticais e diagonais, nesta ordem.

As wavelets morfológicas são baseadas nas operações básicas de erosão !!(!)(!) e dilatação !!(!)(!) da Morfologia Matemática [34], [35], onde !: ! → [0, 1] é a imagem de entrada e !: ! → [0, 1] é o elemento estruturante, ! ! = 1 − !(!), ! ⊆ ℤ! e ! ∈ ! [33]. Assim, por definição, os coeficientes da decomposição em wavelets morfológicas para n níveis são dados por:

!!,! ! = !!! !! ! , (13) !!,! ! = !!! !! ! , (14) !!,! ! = !!! !! ! , (15)

e !! ! = !!! ⋅ !!! ⋅ !!! !!!! ! , 2 ≤ ! ≤ !, (16)

!! ! = !!! ⋅ !!! ⋅ !!! ! ! , (17) Onde

!! ! ! = !! ! ! − !! ! ! (18) é o gradiente morfológico,

!! ! ! = !! ⋅ !! ! ! (19) é o operador fechamento morfológico e

!! ! ! = !! ⋅ !! ! ! (20)

é a abertura morfológica, para 1 ≤ ! ≤ ! e ! ∈ !.

A definição de wavelet morfológica é bastante flexível, de forma que outras wavelets diferentes podem ser criadas, variando os elementos estruturantes, usando outros gradientes que não o gradiente morfológico, tais como a borda interna ou a borda externa, ou mesmo usando outro filtro passa baixas, tal como o filtro !"! ao invés do !"! aqui apresentado. É também possível combinar operações morfológicas com filtragens lineares. No entanto, neste trabalho se preferiu adotar as definições anteriormente apresentadas.

C. Redes neurais artificiais e máquinas conexionistas As redes neurais artificiais buscam modelar problemas

utilizando uma estrutura baseada na rede de neurônios do cérebro humano. São sistemas dotados de paralelismo e cujo processamento é distribuído em unidades básicas e interconectadas, responsáveis por executarem funções. A estas unidades dá-se o nome de neurônio artificial, ou simplesmente nodo [38]. Os nodos podem ser distribuídos na rede em várias camadas, sendo que, em geral, a entrada de dados também é representada como uma camada da rede, sendo considerados neurônios fictícios cuja única função é distribuir os dados de entrada para os nodos da camada seguinte.

As redes perceptron multicamadas foram um avanço muito importante para o fim da estagnação das pesquisas em RNAs, devido à possibilidade de, utilizando neurônios McCulloch- Pitts e arquitetura multicamadas, resolver problemas não linearmente separáveis. Elas utilizam um algoritmo chamado algoritmo de retropropagação, que consiste em uma generalização do algoritmo de treinamento do perceptron de camada única através da estimação dos erros !!

(!) de uma camada k a partir dos erros !!

(!!!) da camada superior k + 1. É possível provar que, para modelagem de funções, é possível modelar qualquer função contínua com uma rede perceptron de duas camadas de neurônios, enquanto qualquer função pode ser modelada usando um perceptron de três camadas de

928 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

neurônios, diferente das redes de camada única, que só conseguem modelar funções contínuas e lineares [38].

Tabela I

ORGANIZAÇÃO DA BASE IRMA DE ACORDO COM A NATUREZA DO TECIDO E DO ACHADO.

Código Tecido Achado

I-1-0 Adiposo Normal I-2-4 Adiposo Benigno I-5-5 Adiposo Maligno II-1-0 Fibroglandular Normal II-2-4 Fibroglandular Benigno II-5-5 Fibroglandular Maligno III-1-0 Denso Normal III-2-4 Denso Benigno III-5-5 Denso Maligno IV-1-0 Muito denso Normal IV-2-4 Muito denso Benigno IV-5-5 Muito denso Maligno

As redes de função de base radial são redes supervisionadas

que realizam uma transformação não-linear no vetor de entrada, gerando um novo vetor pertencente a um espaço de maior dimensionalidade [39]. Elas têm geralmente duas camadas. A primeira camada é constituída por neurônios que implementam funções de base radial. Esta camada é responsável pela transformação não-linear e pela expansão do espaço de atributos e consiste em uma rede não-supervisionada onde seus neurônios implementam funções gaussianas [38], [39]. A segunda camada é composta por um perceptron de camada única, responsável pela implementação das funções discriminantes lineares para o problema de classificação no espaço de alta dimensionalidade gerado pela primeira camada.

As máquinas de vetor de suporte são máquinas de aprendizado conexionistas similares às redes neurais. A camada de saída é composta por nodos com kernel linear, como um perceptron de camada única, enquanto as camadas escondidas são compostas de nodos com kernels que podem ser variados, podendo calcular desde funções lineares e polinomiais a funções de base radial gaussianas, como nas redes de função de base radial. Seu treinamento é comumente realizado usando um algoritmo de otimização, como o SMO (Sequential Minimal Optimization) [39].

III. MATERIAL E MÉTODOS

A. Base de imagens Neste trabalho foi utilizada a base de dados IRMA (Image

Retrieval in Medical Applications), do Departamento de Informática Médica da Universidade de Aachen (RWTH Aachen), Alemanha [40]–[44]. Essa base é formada por regiões de interesse de imagens de mamografias digitalizadas de mama, de tamanho 128 x 128 pixels. Ela é composta ao todo de 2.796 imagens, sendo 2.576 oriundas da base DDSM (Digital Database for Screening Mammography), 1 da base LLNL (Lawrence Livermore National Laboratory), 69 da base RWTH, e 150 proveniente da base MIAS (Mammographic Image Analysis Society).

A base IRMA é composta de 12 classes, organizadas de acordo com a densidade do tecido mamário (I: adiposa, II: fibroglandular, III: densa, e IV: extremamente densa), a classificação BI-RADS (1: inexistente, 2: benigna, e 5:

maligna), e o tipo de lesão (0: sem lesão, 4: massa circunscrita, e 5: massa espiculada), conforme a Tabela I.

B. Extração de Atributos Neste trabalho, para fins de comparação, foi utilizada a

mesma abordagem de extração de atributos utilizada em de [33]: os atributos foram gerados a partir da extração dos momentos de Zernike dos termos da decomposição de cada imagem usando Wavelets Morfológicas, com decomposição em dois níveis. Como a cada nível se tem uma componente de aproximação e três de detalhes, na decomposição em dois níveis se tem, portanto, seis componentes de detalhes e a última aproximação, resultando sete imagens. Assim, como são extraídos 32 momentos de Zernike para cada imagem, a base de conhecimento construída foi organizada em (1 + 2 x 3) x 32 = 224 atributos e 12 classes.

As imagens de massa circunscrita são comumente associadas a lesões benignas, enquanto as lesões espiculadas são consideradas malignas. No entanto, outras condições podem levar à formação de lesões de mama espiculadas benignas e circunscritas malignas. Dessa forma, como isso poderia aumentar a confusão e, portanto, reduzir a acurária para situações que exigem um conhecimento do histórico da paciente, o que não é incluído em sistemas de apoio ao diagnóstico por imagem, essas imagens foram descartadas. Para compensar o descarte dessas imagens, foi realizado um balanceamento por meio da inserção de instâncias sintéticas por meio da combinação linear de vetores de atributos da mesma classe, como realizado em [33]. Cada uma das 12 classes ficou com 233 imagens.

Para gerar a base de conhecimento foi utilizada uma biblioteca de processamento de imagens e visão computacional em Object Pascal que faz uso de paralelismo. A base foi armazenada em formato ARFF, para posterior estudo de arquiteturas e configurações de máquinas de aprendizado para detecção e classificação de lesões de mama.

C. Arquiteturas e configurações de classificadores Os experimentos focaram na investigação de máquinas de

aprendizado conexionistas, dada sua predominância na literatura relacionada. Todos os parâmetros foram definidos empiricamente, buscando maximizar a acurácia. Foram investigados os seguintes classificadores: MLP: Perceptron Multicamadas (Multi-Layer Perceptron,

MLP), com 12 neurônios na camada de saída, 50 neurônios na camada escondida, momento de 0,2, máximo de 500 épocas e taxa de aprendizado de 0,3 e 0,03;

RBF: Rede de Função da Base Radial (Radial Basis Function, RBF), com 12 neurônios na camada de saída, 50 neurônios na camada escondida;

SVM: Máquina de Vetor de Suporte (Support Vector Machine, SVM), com kernel RBF e parâmetro de folga C de 0,1.

IV. RESULTADOS E DISCUSSÃO Na Tabela II são apresentados os resultados obtidos nos

experimentos computacionais descritos na seção anterior, a saber, a taxa de acerto (%), o índice ! (Kappa), e a área da curva ROC, para os classificadores perceptron multicamadas

DA CRUZ et al.: DETECTION AND CLASSIFICATION 929

(MLP), para taxa de aprendizado ! de 0,3 e 0,03; rede de função de base radial (RBF); e máquina de vetor de suporte (SVM).

Tabela II MÉTODOS DE CLASSIFICAÇÃO E SEUS RESPECTIVOS RESULTADOS,

PARA UM TOTAL DE 2796 INSTÂNCIAS. Classificador Acurácia (%) Índice κ Área ROC

MLP (η = 0, 3) 54,76 0,5064 0,516 MLP (η = 0, 03) 96,21 0,9586 0,962 RBF 55,08 0,5099 0,530 SVM 93,53 0,9294 0,937

A partir dos resultados obtidos expostos na Tabela II, percebe-se uma significativa melhoria do desempenho da rede MLP quando se muda a taxa de aprendizado de 0,3 para 0,03, produzindo-se um aumento da taxa de acerto de 54,76% para 96,21%, o que é praticamente o dobro do obtido com a taxa de aprendizado inicial. Isso indica que o problema de classificação das imagens de regiões de interesse de mamografia sofre com mínimos locais e, por conseguinte, a redução da taxa de aprendizado permitiu a redução do passo de atualização dos pesos dos neurônios de forma que a área explorada pode se avizinhar da solução ótima. Isso é corroborado pelos resultados da rede RBF e da SVM.

Na rede RBF obteve-se uma taxa de acerto praticamente igual à da MLP com taxa de aprendizado 0,3, o que confirma a hipótese de forte influência de mínimos locais. Já a SVM, por ser construída baseando-se no princípio de buscar otimizar a fronteira de decisão tornando-a equidistante das classes e definindo hiperplanos sobre vetores obtidos diretamente do conjunto de treino (os chamados vetores de suporte), obteve resultado muito próximo daquele da rede MLP: 93,53%. Os resultados do índice ! e da área da curva ROC são condizentes com esses resultados comentados.

Contudo, quando se compara os tempos de aprendizado das redes MLP com taxa de aprendizado 0,03 e SVM, obtém-se para a primeira em média 2 horas, 51 minutos e 59 segundos, enquanto para a segunda apenas 15,52 segundos. Isso mostra que a SVM tem larga vantagem em termos de tempo de treinamento em relação à MLP. Contudo, a diferença de quase 3% da MLP para a SVM ainda aponta para a MLP como melhor método, uma vez que o processo de treinamento não será feito em tempo real, ou seja, o classificador será treinado uma vez e, obtendo-se os melhores parâmetros, será carregado na solução de apoio ao diagnóstico. Além disso, o custo computacional do processo de decisão, ou seja, da execução das redes, é praticamente o mesmo, podendo ser avaliado em milissegundos.

V. CONCLUSÃO Neste trabalho foi apresentado um método para detecção e

classificação de lesões de mama em imagens de mamografia, usando decomposição de imagens de 128 x 128 pixels de regiões suspeitas de lesão em série de wavelets morfológicas de dois níveis, resultando em sete imagens componentes, representadas por sua vez pelos momentos de Zernike. Foi utilizada a base de imagens IRMA, composta por 2.796 imagens clínicas reais de regiões suspeitas de mamografias, organizadas por diagnóstico clinicamente validado (sem lesão,

com lesão maligna e com lesão benigna) e por densidade do tecido mamário (mama adiposa, fibroglandular, densa e muito densa), correspondendo a 12 classes.

Os valores de acurácia de diagnóstico e índice ! obtidos para classificadores baseados no perceptron multicamadas e em máquina de vetor de suporte com kernel de função de base radial mostraram que essas máquinas de aprendizado conexionistas, combinadas à decomposição das regiões de interesse de mamografia em séries de wavelets morfológicas, podem ser robustos o suficiente para integrar ferramentas de apoio ao diagnóstico do câncer de mama por imagem que independam da faixa etária das pacientes de mamografia.

Tendo em vista que usualmente os sistemas públicos de saúde indicam a mamografia para mulheres a partir dos 35 anos, como no caso brasileiro, ou mesmo dos 40 anos, quando a substituição natural do tecido mamário de fibroso para adiposo já está praticamente completa, sistemas inteligentes de apoio ao diagnóstico por imagem do câncer de mama que sejam independentes da natureza do tecido mamário podem vir a contribuir para a detecção cada vez mais precoce da doença, mesmo quando a mama é muito densa, como no caso de pacientes pré-adolescentes e jovens adolescentes, quando também não há conhecimento especialista suficiente para interpretar adequadamente os achados em mamografias por meio da investigação visual. Além disso, a detecção precoce não somente do câncer de mama, mas de outros tipos de câncer, contribui para a melhora do prognóstico, das técnicas de tratamento e até de eventual cura, e da qualidade de vida das pacientes.

AGRADECIMENTOS Os autores agradecem à CAPES, Coordenação de

Aperfeiçoamento de Pessoal de Nível Superior, pelo financiamento parcial da pesquisa, e ao Prof. Dr. Thomas Deserno, do Departamento de Informática Médica da Aachen University of Technology, Aachen, Alemanha, por gentilmente ter fornecido acesso à base de dados IRMA.

REFERÊNCIAS [1] R. B. Bergamasco and M. Angelo, “Câncer de mama: Como o

diagnóstico é experienciado pela mulher,” Revista Brasileira de Cancerologia, vol. 47, no. 3, pp. 277–82, 2001.

[2] A. Barros, V. Carvalho, M. Franco, M. Kovács, R. Liberato, R. d. C. Macieira, and M. Veit, “Câncer de mama,” Temas em psico-oncologia, pp. 40–45, 2008.

[3] A. B. Pinheiro, D. S. Lauter, G. C. Medeiros, I. R. Cardozo, L. M. Menezes, R. M. B. d. Souza, K. Abrahão, L. Casado, A. Bergmann, and L. C. S. Thuler, “Câncer de mama em mulheres jovens: análise de 12.689 casos,” Rev. bras. cancerol, vol. 59, no. 3, pp. 351–359, 2013.

[4] B. W. Stewart and C. Wild, “World cancer report 2014. international agency for research on cancer,” World Health Organization, vol. 505, 2014.

[5] J. d. A. G. d. Silva, Diretrizes para a detecção precoce do câncer de mama no Brasil. Instituto Nacional de Câncer / Ministério da Saúde, 2015.

[6] T. Facina, “Estimativa 2014–incidência de câncer no brasil,” Rev Bras Cancerol, vol. 60, p. 63, 2014.

[7] J. G. Gonçalves, A. D. S. E. Siqueira, I. G. de Almeira Rocha, E. F. F. de Lima, L. da Silva Alves, B. O. da Silva, P. E. X. de Mendonça, E. E. Merhy, and M. G. P. Land, “Evolução histórica das políticas para o controle do câncer de mama no brasil,” DIVERSITATES International Journal, vol. 8, no. 1, 2016.

[8] H. G. Welch, P. C. Prorok, A. J. O’Malley, and B. S. Kramer, “Breast-

930 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018

cancer tumor size, overdiagnosis, and mammography screening effecti- veness,” New England Journal of Medicine, vol. 375, no. 15, pp. 1438– 1447, 2016.

[9] J. E. Cott Chubiz, J. M. Lee, M. E. Gilmore, C. Y. Kong, K. P. Lowry, E. F. Halpern, P. M. McMahon, P. D. Ryan, and G. S. Gazelle, “Cost- effectiveness of alternating magnetic resonance imaging and digital mammography screening in brca1 and brca2 gene mutation carriers,” Cancer, vol. 119, no. 6, pp. 1266–1276, 2013.

[10] N. Mittmann, N. K. Stout, P. Lee, A. N. Tosteson, A. Trentham-Dietz, O. Alagoz, and M. J. Yaffe, “Total cost-effectiveness of mammography screening strategies,” Health reports, vol. 26, no. 12, p. 16, 2015.

[11] F. Schwab, K. Redling, M. Siebert, A. Schötzau, C.-A. Schoenen- berger, and R. Zanetti-Dällenbach, “Inter-and intra-observer agreement in ultrasound bi-rads classification and real-time elastography tsukuba score assessment of breast lesions,” Ultrasound in Medicine & Biology, vol. 42, no. 11, pp. 2622–2629, 2016.

[12] J. L. Koning, K. P. Davenport, P. S. Poole, P. G. Kruk, and J. E. Grabowski, “Breast imaging-reporting and data system (bi-rads) clas- sification in 51 excised palpable pediatric breast masses,” Journal of pediatric surgery, vol. 50, no. 10, pp. 1746–1750, 2015.

[13] M. Wang, Z. Yang, C. Liu, J. Yan, W. Zhang, J. Sun, and G. Cui, “Differential diagnosis of breast category 3 and 4 nodules through bi-rads classification in conjunction with shear wave elastography,” Ultrasound in Medicine & Biology, 2016.

[14] R. Pijnappel, P. Peeters, J. Hendriks, and W. T. M. Mali, “Reproducibility of mammographic classifications for non-palpable suspect lesions with microcalcifications,” The British journal of radiology, 2014.

[15] E. Regini, G. Mariscotti, M. Durando, G. Ghione, A. Luparia, P. P. Campanino, C. C. Bianchi, L. Bergamasco, P. Fonio, and G. Gandini, “Radiological assessment of breast density by visual classification (bi– rads) compared to automated volumetric digital software (quantra): implications for clinical practice,” La radiologia medica, vol. 119, no. 10, pp. 741–749, 2014.

[16] A. Jalalian, S. B. Mashohor, H. R. Mahmud, M. I. B. Saripan, A. R. B. Ramli, and B. Karasfi, “Computer-aided detection/diagnosis of breast cancer in mammography and ultrasound: a review,” Clinical Imaging, vol. 37, no. 3, pp. 420–426, 2013.

[17] K. Ganesan, U. R. Acharya, C. K. Chua, L. C. Min, K. T. Abraham, and K.-H. Ng, “Computer-aided breast cancer detection using mammograms: a review,” IEEE Reviews in Biomedical Engineering, vol. 6, pp. 77–98, 2013.

[18] K. Doi, “Current status and future potential of computer-aided diagnosis in medical imaging,” The British Journal of Radiology, 2014.

[19] A. Karahaliou, S. Skiadopoulos, I. Boniatis, P. Sakellaropoulos, E. Li- kaki, G. Panayiotakis, and L. Costaridou, “Texture analysis of tissue surrounding microcalcifications on mammograms for breast cancer di- agnosis,” The British Journal of Radiology, 2014.

[20] B. Zheng, J. H. Sumkin, M. L. Zuley, D. Lederman, X. Wang, and D. Gur, “Computer-aided detection of breast masses depicted on full- field digital mammograms: a performance assessment,” The British Journal of Radiology, 2014.

[21] F. R. Cordeiro, W. P. d. Santos, and A. G. Silva-Filho, “Analysis of supervised and semi-supervised growcut applied to segmentation of masses in mammography images,” Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, vol. 5, no. 4, pp. 297–315, 2017.

[22] F. R. Cordeiro, W. P. Santos, and A. G. Silva-Filho, “A semi-supervised fuzzy growcut algorithm to segment and classify regions of interest of mammographic images,” Expert Systems with Applications, vol. 65, pp. 116–126, 2016.

[23] ——, “An adaptive semi-supervised fuzzy growcut algorithm to segment masses of regions of interest of mammographic images,” Applied Soft Computing, vol. 46, pp. 613–628, 2016.

[24] F. Cordeiro, W. Santos, and A. Silva-Filho, “Segmentation of mammography by applying growcut for mass detection.” Studies in health technology and informatics, vol. 192, p. 87, 2013.

[25] J. Dheeba, N. A. Singh, and S. T. Selvi, “Computer-aided detection of breast cancer on mammograms: A swarm intelligence optimized wavelet neural network approach,” Journal of biomedical informatics, vol. 49, pp. 45–52, 2014.

[26] A. T. Azar and S. A. El-Said, “Performance analysis of support vector machines classifiers in breast cancer mammography recognition,”

Neural Computing and Applications, vol. 24, no. 5, pp. 1163–1177, 2014.

[27] D. Lévy and A. Jain, “Breast mass classification from mammograms using deep convolutional neural networks,” arXiv preprint arXiv:1612.00542, 2016.

[28] B. Sridhar, K. Reddy, and A. Prasad, “Detection of lesions in medical image using an artificial neural networks and morphological filters.” Computer Science & Telecommunications, vol. 43, no. 3, 2014.

[29] D. C. Pereira, R. P. Ramos, and M. Z. Do Nascimento, “Segmentation and detection of breast cancer in mammograms combining wavelet analysis and genetic algorithm,” Computer methods and programs in biomedicine, vol. 114, no. 1, pp. 88–101, 2014.

[30] S. Beura, B. Majhi, and R. Dash, “Mammogram classification using two-dimensional discrete wavelet transform and gray-level co-occurrence matrix for detection of breast cancer,” Neurocomputing, vol. 154, pp. 1– 14, 2015.

[31] K. Ganesan, U. R. Acharya, C. K. Chua, L. C. Min, and T. K. Abraham, “Automated diagnosis of mammogram images of breast cancer using discrete wavelet transform and spherical wavelet transform features: a comparative study,” Technology in cancer research & treatment, vol. 13, no. 6, pp. 605–615, 2014.

[32] M. Z. Do Nascimento, A. S. Martins, L. A. Neves, R. P. Ramos, E. L. Flores, and G. A. Carrijo, “Classification of masses in mammographic image using wavelet domain features and polynomial classifier,” Expert Systems with Applications, vol. 40, no. 15, pp. 6213–6221, 2013.

[33] S. M. de Lima, A. G. da Silva-Filho, and W. P. dos Santos, “Detection and classification of masses in mammographic images in a multi-kernel approach,” Computer Methods and Programs in Biomedicine, 2016.

[34] W. W. Azevedo, S. M. L. Lima, I. M. M. Fernandes, A. D. D. Rocha, F. R. Cordeiro, A. G. da Silva-Filho, and W. P. dos Santos, “Fuzzy morphological extreme learning machines to detect and classify masses in mammograms,” in 2015 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), Aug 2015, pp. 1–8.

[35] ——, “Morphological extreme learning machines applied to detect and classify masses in mammograms,” in 2015 International Joint Conference on Neural Networks (IJCNN), July 2015, pp. 1–8.

[36] S. Mallat, A wavelet tour of signal processing. Academic press, 1999.

[37] ——, A wavelet tour of signal processing: the sparse way. Academic press, 2008.

[38] A. P. Braga, A. C. P. L. F. Carvalho, and T. B. Ludermir, Redes Neurais Artificiais: Teoria e Aplicações. São Paulo: LTC, 2000.

[39] S. Haykin, Redes Neurais: Princípios e Prática. Porto Alegre: Bookman, 2001.

[40] J. E. De Oliveira, A. M. Machado, G. C. Chavez, A. P. B. Lopes, T. M. Deserno, and A. d. A. Araújo, “Mammosys: a content-based image retrieval system using breast density patterns,” Computer methods and programs in biomedicine, vol. 99, no. 3, pp. 289–297, 2010.

[41] J. E. de Oliveira, A. d. A. Araújo, and T. M. Deserno, “Mammosyslesion: a content-based image retrieval system for mammographies,” in 17th International Conference on Systems Signals and Image Processing, 2010.

[42] T. Deserno, M. Soiron, J. Oliveira, and A. Araujo, “Towards computer- aided diagnostics of screening mammography using content-based image retrieval,” in 2011 24th SIBGRAPI Conference on Graphics, Patterns and Images. IEEE, 2011, pp. 211–219.

[43] J. E. Oliveira, M. O. Gueld, A. d. A. Araújo, B. Ott, and T. M. Deserno, “Towards a standard reference database for computer-aided mammography,” in Medical Imaging. International Society for Optics and Photonics, 2008, pp. 69 151Y–69 151Y.

[44] T. M. Deserno, M. Soiron, J. E. de Oliveira, and A. d. A. Araújo, “Computer-aided diagnostics of screening mammography using content- based image retrieval,” in SPIE Medical Imaging. International Society for Optics and Photonics, 2012, pp. 831 527–831 527.

Thaís Nayara da Cruz é Bacharel em Enfermagem (2014) e Mestre em Engenharia Biomédica (2017) pela Universidade Federal de Pernambuco, Recife, Brasil. Seus principais interesses de pesquisa são câncer de mama, análise digital de imagens mamo- gráficas, extração de atributos, seleção de atributos utilizando métodos evolucionários e bioinspirados e

apoio ao diagnóstico por imagem.

DA CRUZ et al.: DETECTION AND CLASSIFICATION 931

Thamyris Mayara da Cruz é Bacharel em Terapia Ocupacional pela Universidade Federal de Pernambuco (2016), Recife, Brasil. Atualmente é Terapeuta Ocupacional do Núcleo de Assistência Multidisciplinar ao Neurodesenvolvimento Infantil da Associação de Proteção à Maternidade e à Infância, Vitória de Santo Antão,

Pernambuco, Brasil.

Wellington Pinheiro dos Santos Possui Graduação em Engenharia Elétrica Eletrônica (2001) e Mestrado em Engenharia Elétrica (2003) pela Universidade Federal de Pernambuco, e Doutorado em Engenharia Elétrica pela Universidade Federal de Campina Grande (2009). Atualmente é professor do Departamento de Engenharia Biomédica da Universidade Federal de Pernambuco atuando na graduação

em Engenharia Biomédica e no Programa de Pós-Graduação em Engenharia Biomédica, no qual foi um dos fundadores (2011). É também membro do Programa de Pós-Graduação em Engenharia da Computação da Escola Politécnica de Pernambuco, Universidade de Pernambuco, desde 2009. Tem experiência na área de Ciências da Computação, com ênfase em Processamento Gráfico, atuando principalmente nos seguintes temas: processamento digital de imagens, reconhecimento de padrões, visão computacional, computação evolucionária, métodos numéricos de otimização, inteligência computacional, técnica de formação de imagens, realidade virtual, game design e aplicações de Computação e Engenharia em Medicina e Biologia. É membro da Sociedade Brasileira de Engenharia Biomédica (SBEB), da Sociedade Brasileira de Inteligência Computacional (SBIC), e da International Federation of Medical and Biological Engineering (IFMBE).

932 IEEE LATIN AMERICA TRANSACTIONS, VOL. 16, NO. 3, MARCH 2018