SISTEMA PARA LA VERIFICACIÓN AUTOMÁTICA DE FIRMAS ... · sep snest dgest instituto tecnolÓgico...
Transcript of SISTEMA PARA LA VERIFICACIÓN AUTOMÁTICA DE FIRMAS ... · sep snest dgest instituto tecnolÓgico...
-
SEP SNEST DGEST
INSTITUTO TECNOLGICO DE TOLUCA
SISTEMA PARA LA VERIFICACIN AUTOMTICA DE FIRMAS
AUTGRAFAS
T E S IS
QUE PARA OBTENER EL GRADO DE MAESTRA EN:
CIENCIAS, EN CIENCIAS DE LA COMPUTACIN
PRESENTA:
LUIS MANUEL FLORES SOBERN
ASESOR:
DR. EDUARDO GASCA ALVAREZ
METEPEC, EDO. DE MXICO, OCTUBRE DE 2012
-
i
Agradecimientos
En primer lugar, agradezco a mi esposa por brindarme la paciencia, apoyo y
motivacin necesarios para poder llevar a cabo este proyecto.
A mis padres, por haber estado presentes en todo momento para guiarme y
apoyarme. Sin su ejemplo, gua y ayuda, sera simplemente impensable estar aqu y
ahora.
A mis hermanas por apoyarme incondicionalmente.
Agradezco tambin al Doctor Eduardo Gasca la confianza brindada al aceptar ser mi
asesor de tesis as como la gua que siempre estuvo dispuesto a dar para llevar a
buen puerto el desarrollo del presente trabajo.
Este perodo de tiempo me deja un gran aprendizaje, no slo acadmicamente sino
tambin personalmente y eso slo es posible por la gran calidad humana de las
personas con las que trat, tanto alumnos como profesores. Es por ello que tengo
que agradecer a mis revisores de tesis, los doctores Pacheco, Sergio y No, por
tomarse el tiempo necesario para hacer que creciera mi proyecto as como a mis
profesores, el Dr. Gasca, la Mtra. Julieta, el Dr. Pacheco, el Dr. Celso, el Mtro.
Rafael, la Dr. Citlali y la Mtra. Itzel por la amistad brindada, por compartir sus
conocimientos y experiencia en el saln de clase, por haber tenido el objetivo tan
claro de hacernos crecer acadmica y profesionalmente y, sin darse cuenta, por
haber enriquecido mi vida personal al compartir pensamientos, puntos de vista,
experiencias, ancdotas de sus vidas personales, o simplemente, por servir como
ejemplo de lo que es hacer bien las cosas.
Por ltimo agradezco a mis amigos Roco, Cesar, Jimmy y Omar con los cuales
compart esta etapa de mi vida por haberme ofrecido su amistad.
-
ii
DEDICATORIA
A mis padres, esposa e hijos que vienen en camino.
-
iii
RESUMEN
En el presente proyecto se propone y examinan los resultados de un sistema que
utiliza para la representacin de firmas autgrafas digitalizadas, una nueva
caracterstica no reportada en la bibliografa que sirve de base al presente proyecto,
la cual est formada por los coeficientes de la Transformada Wavelet obtenidos de
su aplicacin a los puntos borde de distintos trazos de la firma en conjunto con una
serie de caractersticas existentes en la literatura consultada las cuales son la
relacin altura-anchura, la entropa, la mxima, la energa, el rea de la firma, el
nmero de puntos borde y el nmero de puntos de interseccin. Como clasificador se
ha utilizado una Red Neuronal Artificial del tipo Perceptron Multicapa con una
topologa de 4 nodos en la capa oculta y 2 nodos en la capa de salida entrenada
utilizando el algoritmo BackPropagation con un valor de 0.7 como razn de
aprendizaje y 0.9 como momento.
Las caractersticas existentes utilizadas, han sido tomadas de distintos trabajos en
los que las han utilizado de manera individual o en conjunto con caractersticas no
presentadas en el presente proyecto, es decir, la combinacin de caractersticas
existentes utilizadas no ha sido reportada en la literatura consultada, por su parte, la
nueva caracterstica propuesta se basa en los puntos iniciales y finales de los trazos
tomados en cuenta por la grafoscopa siendo stos de inters por su dificultad para
ser falsificados. Como se ya se mencion, para la representacin de estos ltimos,
se utiliza la Transformada Wavelet.
Los experimentos realizados dieron mejores resultados para el uso exclusivo de la
combinacin de caractersticas ya existentes que cuando se hizo uso de las
caractersticas obtenidas por medio de la Transformada Wavelet.
-
iv
Abstract
In this project it is proposed and analyzed the results of a system that represents the
written signatures using a new feature that does not exist in the literature that was
consulted. This new feature uses the coeficients of the Wavelet Transform applied to
the final points of the different strokes of the signature. This new feature is also used
in combination with a set of existing features such as height to width ratio (aspect
ratio), entropy, maximum, energy, signature area, number of final points and the
number of intersection points. As a classifier, an Artificial Neural Network Multilayer
Perceptron was used with a topology of 4 hidden units and two output units using
BackPropagation Algorithm to train it with a value of 0.7 as learning rate and 0.9 as
momentum.
The existing features have been taken from different papers, this means that they
haven't been used in combination before. The new feature proposed, is based on the
start and end points of the signature strokes used in graphology. These points are of
interest because of the difficult to be counterfeited. As already mentioned, these
points are represented using the Wavelet Transform.
The different experiments show better results using exclusively the set of existing
features than those results showed when including the new proposed feature.
-
v
NDICE TEMTICO
1 CAPTULO I ......................................................................................................... 1
1.1 INTRODUCCIN ........................................................................................... 1
1.2 OBJETIVOS ................................................................................................... 6
1.3 CONTRIBUCIN............................................................................................ 7
1.4 ORGANIZACIN............................................................................................ 8
2 CAPTULO II ........................................................................................................ 9
2.1 MARCO TERICO......................................................................................... 9
2.2 WAVELETS .................................................................................................... 9
2.2.1 Wavelet Daubechies .............................................................................. 11
2.3 RECONOCIMIENTO DE PATRONES ......................................................... 13
2.3.1 Enfoque estadstico ............................................................................... 14
2.4 REDES NEURONALES ARTIFICIALES ...................................................... 17
2.4.1 Modelo Biolgico ................................................................................... 19
2.4.2 Neurona Artificial ................................................................................... 21
2.4.3 Perceptron Simple ................................................................................. 23
2.4.4 Perceptron Multicapa ............................................................................. 26
2.5 PROCESAMIENTO DE IMGENES DIGITALES ........................................ 28
2.5.1 Binarizacin ........................................................................................... 29
2.5.2 Esqueletizacin ...................................................................................... 30
2.5.3 Correlacin ............................................................................................ 34
2.6 GRAFOSCOPA ........................................................................................... 36
-
vi
2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE FIRMAS ................... 43
2.7.1 Caractersticas ....................................................................................... 45
2.7.2 Clasificador ............................................................................................ 54
3 CAPTULO 3 ...................................................................................................... 56
3.1 MTODO ..................................................................................................... 56
3.1.1 Base de Datos ....................................................................................... 58
3.1.2 Formacin de los Patrones .................................................................... 59
3.1.3 Definicin de Topologas de las RNA .................................................... 71
3.1.4 Mtodos de Evaluacin de las RNA ...................................................... 72
4 CAPTULO 4 ...................................................................................................... 77
4.1 EXPERIMENTOS ......................................................................................... 77
4.1.1 Experimento #1: Uso de una sola RNA con dos clases para todas las
firmas 77
4.1.2 Experimento #2: Uso de una sola RNA con dos nodos de salida por firma
77
4.1.3 Experimento #3: Uso de una RNA con dos nodos de salida por firma .. 78
4.1.4 Experimento #4: Uso de una RNA con dos nodos de salida por firma
usando nicamente la combinacin de caractersticas existentes ..................... 78
4.2 RESULTADOS ............................................................................................. 79
4.2.1 Experimento #1: Uso de una sola RNA con dos clases para todas las
firmas 79
4.2.2 Experimento #2: Uso de una sola RNA con dos nodos de salida por firma
80
4.2.3 Experimento #3: Uso de una RNA con dos nodos de salida por firma .. 82
-
vii
4.2.4 Experimento #4: Uso de una RNA con dos nodos de salida por firma
usando nicamente la combinacin de caractersticas existentes ..................... 83
4.3 SISTEMA PROPUESTO .............................................................................. 85
5 CAPTULO 5 ...................................................................................................... 93
5.1 CONCLUSIONES......................................................................................... 93
5.2 TRABAJOS FUTUROS ................................................................................ 94
6 APNDICES ...................................................................................................... 96
6.1 APNDICE A - MatLab ................................................................................ 97
6.2 APNDICE B - NeuroSolutions .................................................................... 98
6.3 APNDICE C - Microsoft Visual Studio ........................................................ 99
7 REFERENCIAS BIBLIOGRFICAS ................................................................. 100
-
viii
NDICE DE FIGURAS
FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN WAVELET
MADRE DAUBECHIES 20 ........................................................................................ 10
FIGURA 2.2. WAVELET MADRE DAUBECHIES ...................................................... 12
FIGURA 2.3. FRONTERA DE DECISIN ................................................................. 15
FIGURA 2.4. NEURONA BIOLGICA ...................................................................... 19
FIGURA 2.5. NEURONA ARTIFICIAL. ...................................................................... 21
FIGURA 2.6. FUNCIN DE ACTIVACIN LINEAL .................................................. 22
FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN .............................................. 23
FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE ............................................. 23
FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA ......................... 26
FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA .......... 29
FIGURA 2.11. ESQUELETO DE LA LETRA H. ......................................................... 30
FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES ........................... 33
FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4 ................. 34
FIGURA 2.14. IMAGEN DE 4x5 ................................................................................ 34
FIGURA 2.15. MSCARA DE 3x3 ............................................................................ 35
FIGURA 2.16. APLICACIN KERNEL ...................................................................... 35
FIGURA 2.17. PROCESO SIGNATRIZ ..................................................................... 37
FIGURA 2.18. PUNTO DE ATAQUE RECTO ........................................................... 40
FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO .............................................. 41
FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE ........................................... 41
FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P. ........................................ 43
FIGURA 2.22. FACULTAD HOMOTETICA ............................................................... 47
-
ix
FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA DIGITAL ..... 47
FIGURA 2.24. ENTROPA EN IMAGEN DE UN SOLO COLOR ............................... 50
FIGURA 2.25. ENTROPA EN IMAGEN CON DOS COLORES ............................... 50
FIGURA 2.26. MXIMA ............................................................................................. 51
FIGURA 2.27. RESULTADOS DE APLICAR EL ALGORITMO DE MXIMA A UNA
FIRMA ....................................................................................................................... 52
FIGURA 2.28. PUNTOS BORDE .............................................................................. 53
FIGURA 2.29. PUNTOS DE INTERSECCIN. ......................................................... 53
FIGURA 3.1. EJEMPLOS DE FIRMAS DE LA BASE DE DATOS. ........................... 59
FIGURA 3.2. DIAGRAMA DE ALTO NIVEL DEL PROCESO DE EXTRACCIN DE
CARACTERSTICAS. ................................................................................................ 60
FIGURA 3.3. IMAGEN EN ESCALA DE GRISES. .................................................... 62
FIGURA 3.4. IMAGEN BINARIZADA CON UMBRAL 0.8.......................................... 62
FIGURA 3.5. IMAGEN BINARIZADA CON UMBRAL 0.95........................................ 62
FIGURA 3.6. IMAGEN BINARIZADA CON UMBRAL 0.91........................................ 63
FIGURA 3.7. IMAGEN EN ESCALA DE GRISES Y SU ESQUELETO ..................... 65
FIGURA 3.8. MSCARA APLICADA PARA OBTENER PUNTOS BORDE Y DE
INTERSECCIN. ...................................................................................................... 66
FIGURA 3.9. EJEMPLOS DE ENTROPA EN 4 DIFERENTES IMGENES ............ 67
FIGURA 3.10. EJEMPLO DE OBTENCIN DE PUNTOS BORDE .......................... 68
FIGURA 3.11. COEFICIENTES DE DAUBECHIES 2 DE UNA IMAGEN DE 20 POR
20 PIXELES .............................................................................................................. 69
FIGURA 3.12. DIAGRAMA DE VALIDACIN CRUZADA ......................................... 73
FIGURA 3.13. ERRORES COMETIDOS POR LA RED EN LOS CONJUNTOS DE
ENTRENAMIENTO Y DE VALIDACIN CRUZADA ................................................. 75
-
x
FIGURA 4.1. DIAGRAMA DE FLUJO DEL SISTEMA ............................................... 86
FIGURA 4.2. ARQUITECTURA DE ALTO NIVEL DEL SISTEMA ............................ 86
FIGURA 4.3. EJEMPLO DE CONFIGURACIN DEL CATLOGO DE FIRMAS DEL
SISTEMA................................................................................................................... 88
FIGURA 4.4. PANTALLA INICIAL DEL SISTEMA DE VERIFICACIN DE FIRMAS 89
FIGURA 4.5. DROP DOWN DE FIRMAS DEL CATLOGO ..................................... 90
FIGURA 4.6. EJEMPLO DE IMAGEN DE MUESTRA ACTUALIZADA AL CAMBIAR
LA SELECCIN DE FIRMA DEL CATLOGO ......................................................... 90
FIGURA 4.7. EJEMPLO DE SELECCIN DE IMAGEN A VERIFICAR .................... 91
FIGURA 4.8. IMAGEN A VERIFICAR SE MUESTRA EN LA PARTE DERECHA DE
LA PANTALLA DEL SISTEMA .................................................................................. 91
FIGURA 4.9. PANEL DE RESULTADOS ACTUALIZADO ........................................ 92
-
xi
NDICE DE TABLAS
TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES .......... 12
TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA ..................................................... 48
TABLA 2.3. EJEMPLO 2: CLCULO ENTROPA ..................................................... 49
TABLA 2.4. EJEMPLO 3: CLCULO ENTROPA ..................................................... 49
TABLA 3.1. TOPOLOGAS DE RNA A EVALUAR .................................................... 72
TABLA 3.2. EJEMPLO DE EXPERIMENTOS DE VALIDACIN CRUZADA ............ 74
TABLA 3.3. EJEMPLO DE MATRIZ DE CONFUSIN .............................................. 76
TABLA 3.4. MATRIZ DE CONFUSIN DE EJEMPLO PARA CLCULO DE FAR Y
FRR ........................................................................................................................... 76
TABLA 4.1. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO C1
EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES ................................. 79
TABLA 4.2. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO C2
EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES ................................. 79
TABLA 4.3. MATRIZ DE CONFUSIN OBTENIDA EN LOS PRIMEROS 4
EXPERIMENTOS ...................................................................................................... 80
TABLA 4.4. MATRIZ DE CONFUSIN TOPOLOGAS 7 y 8 SEGUNDO
EXPERIMENTO ........................................................................................................ 80
TABLA 4.5. MATRIZ DE CONFUSIN TOPOLOGA 3 SEGUNDO EXPERIMENTO
.................................................................................................................................. 81
TABLA 4.6. MATRIZ DE CONFUSIN TOPOLOGA 4 SEGUNDO EXPERIMENTO
.................................................................................................................................. 81
TABLA 4.7. MATRIZ DE CONFUSIN TOPOLOGAS 1,2,5 y 6 USANDO UNA RNA
POR FIRMA .............................................................................................................. 82
-
xii
TABLA 4.8. DESVIACIONES ESTNDAR EXPERIMENTO VALIDACIN SIN
WAVELETES ............................................................................................................ 83
TABLA 4.9. RESULTADOS FINALES ....................................................................... 83
TABLA 4.9. RESULTADOS FINALES (Continuacin) ............................................... 84
-
xiii
LISTADO DE ACRNIMOS
A continuacin se listan los acrnimos utilizados a lo largo de este documento:
Acrnimo Significado
IA Inteligencia Artificial
RP Reconocimiento de Patrones
RNA Red Neuronal Artificial
FRR False Rejection Rate (Porcentaje de Falsos Rechazos)
FAR False Acceptance Rate (Porcentaje de Falsas
Aceptaciones)
HMM Hidden Markov Model (Modelos Ocultos de Markov)
VC Validacin Cruzada
VCM Validacin Cruzada Modificada
DLL Dynamic Link Library
GUIDE Graphical User Interface Development Environment
NS NeuroSolutions
PB Punto Borde
PI Punto de Interseccin
ET Entropa
A rea
EV Energa Vertical
-
xiv
EH Energa Horizontal
W Width
H Height
RHV Relacin entre Energa en Diagonal Izquierda-Derecha y
Relacin entre Energa en Diagonal Derecha-Izquierda
CW Coeficiente Wavelet
-
1
1 CAPTULO I
1.1 INTRODUCCIN
Las computadoras se han utilizado desde sus inicios para asistir al ser humano en la
realizacin de tareas repetitivas que, realizadas por el ser humano, resultan tardadas
y propensas a errores.
Con el paso del tiempo, ciencias como la Electrnica, Computacin, Fsica y
Matemticas, entre otras, avanzan permitiendo utilizar la computadora para realizar
tareas cada vez ms diversas. Adems del desarrollo que se da en la capacidad de
almacenamiento y procesamiento por parte de las computadoras, se da tambin un
avance muy importante dentro de diversas ramas del rea del software como lo son
la teora de compiladores, bases de datos, grficas por computadora, algoritmos y
estructuras de datos y computacin cientfica entre otras.
En la dcada de los 40 y 50, surgen los primeros programas que simulan el
razonamiento humano, originando con ello, el surgimiento de la Inteligencia Artificial
(IA) [Jones08]. El principal reto de la IA es construir programas que puedan llevar a
cabo tareas que se perciben como propias del ser humano. Dos de las
caractersticas principales de los problemas que suelen ser resueltos mediante
tcnicas de IA son que presenten variabilidad y que no haya manera de expresar su
solucin como una serie de pasos secuenciales como se hace en los algoritmos de la
computacin tradicional.
El sistema descrito en el presente proyecto cae precisamente en esta rea ya que
una persona nunca realiza dos firmas idnticas por lo que requiere de tcnicas de IA
para poder ser modelado en una computadora.
Desarrollar un sistema automtico de verificacin de firmas autgrafas es importante
ya que actualmente, uno de los medios ms difundidos de identificacin personal es
-
2
precisamente la firma, la cual es utilizada ampliamente por toda la poblacin para dar
fe de acuerdo y conformidad de toda clase de documentos; contratos, recepcin y
expedicin de documentos entre otros [McCabe08] [Orellana75]. Debido a que es un
medio tan ampliamente utilizado, la verificacin de firmas para transacciones
importantes supone un gran consumo de tiempo por parte del ser humano que, al ser
automatizada, se traduce en un aumento en la productividad [McCabe08].
Los sistemas de verificacin de firmas autgrafas son estudiados en el campo de la
biometra el cual se enfoca en encontrar mtodos automticos para la identificacin
de personas basados en rasgos conductuales o fsicos intrnsecos. El trmino
proviene del griego bios vida y metron medida y la informtica recurre a ella para
encontrar mtodos de autenticacin de usuarios, como por ejemplo; lectores de
huellas digitales, lectores de iris, patrones faciales y geometra de la mano entre
otros [Vaca07].
Los sistemas de verificacin de firmas en particular, se basan en el hecho de que
cada firma contiene rasgos nicos que identifican de manera inequvoca a la persona
que la expide. Estos rasgos son principalmente conductuales pero tambin
intervienen rasgos fisiolgicos como si la persona es zurda o derecha [Kholmatov03]
[Orellana75]. Pueden funcionar dinmicamente (on-line) o estticamente (off-line),
estos ltimos con base a imgenes de firmas previamente digitalizadas. Por el primer
mtodo, se pueden obtener caractersticas de la firma que estn en funcin del
tiempo como pueden ser la velocidad, el tiempo total en el que se escribe la firma, el
cambio de presin con respecto al tiempo o a los diferentes trazos de la firma entre
otros [Leclerc94].
Por el mtodo esttico, las caractersticas dinmicas de la firma se pierden, por
ejemplo, no se puede saber cunto tiempo se tard la persona en firmar pero se
conservan caractersticas propias de la imagen como son la proporcin entre altura y
anchura, el ngulo de orientacin de la firma, entre otras [Plamondon94], sin
embargo, estos sistemas son los ms prcticos ya que no se requiere de los
-
3
dispositivos electrnicos necesarios para los sistemas en lnea. El sistema que se
estudia en esta investigacin, pertenece al grupo de sistemas off-line o estticos por
lo que requiere ser alimentado por una imagen digital.
Esta particularidad que se presenta de llevar a cabo una identificacin personal con
base en rasgos conductuales o fsicos, hace que el desarrollo de este tipo de
sistemas pueda ser tratado de manera eficiente por la rama de la IA conocida como
Reconocimiento de Patrones (RP) la cual era inicialmente tratada por la rama de la
teora estadstica pero, con la evolucin del poder de cmputo de los equipos
modernos, se increment la demanda de aplicaciones prcticas lo que desemboc
en una necesidad de nuevos desarrollos tericos. En la actualidad, el
Reconocimiento de Patrones es de gran importancia en aplicaciones de ingeniera,
medicina, minera de datos y manufactura, entre otros, es decir, el Reconocimiento
de Patrones es parte integral de la mayora de los sistemas Inteligentes
[Theodoridis08].
Las tareas de RP consisten en realizar un mapeo de un conjunto de datos de entrada
con un conjunto de posibles salidas. Por lo general, este mapeo se modela a travs
de una funcin matemtica que contiene cierto nmero de parmetros ajustables y
cuyos valores son determinados con la ayuda de datos de ejemplo denominados
muestras de entrenamiento. Existen bsicamente dos tipos de tareas de RP las
cuales se denominan de clasificacin y de regresin. En los problemas de
clasificacin, el objetivo es asignar los datos de entrada a una clase de un conjunto
discreto de posibles clasificaciones. Por su parte, en los problemas de regresin, las
posibles salidas representan valores de variables continuas. Un ejemplo de problema
de clasificacin puede ser el reconocimiento de caracteres manuscritos mientras que
un ejemplo de un problema de regresin puede ser la prediccin de la tasa de
cambio de una moneda en el futuro. El sistema descrito en el presente proyecto, cae
dentro de la categora de problemas de clasificacin.
-
4
Bsicamente, los sistemas de reconocimiento de patrones toman como entrada un
conjunto de medidas que representan las caractersticas de un objeto o
comportamiento a ser clasificado y que son obtenidas a partir de imgenes o
seales. En nuestro caso particular, debemos extraer, a partir de la imagen digital
que contiene la firma a ser clasificada, un conjunto de medidas que cuantifiquen las
caractersticas que permitan representar a la firma. Adicionalmente, los sistemas de
RP pueden realizar algn tipo de procesamiento sobre los datos de entrada de
manera que se facilite el proceso de clasificacin y por ltimo, realizan un proceso en
el cul clasifican la entrada en una clase dada.
Existen dos tipos de sistemas, los no supervisados y los supervisados; la diferencia
entre ambos es que los supervisados, para poder realizar esta clasificacin, deben
ser previamente entrenados mediante algn algoritmo de aprendizaje mientras que
los no supervisados no requieren este entrenamiento previo siendo utilizados para
descubrir relaciones entre los patrones no siempre evidentes a simple vista. Ya que
los sistemas supervisados requieren ser entrenados previamente, es indispensable
tener a la mano una serie de ejemplos con los cuales llevar a cabo dicho
entrenamiento. En el caso de nuestro sistema, se obtuvo una base de datos de
imgenes digitales de firmas autgrafas con la cual llevar a cabo el entrenamiento.
Para realizar la clasificacin, los sistemas de RP pueden utilizar distintos mtodos
como son Funciones Discriminantes Redes Neuronales Artificiales (RNA). Las RNA
intentan simular el comportamiento de los sistemas nerviosos biolgicos y son
particularmente tiles para problemas cuya solucin no puede ser expresada
mediante una serie de pasos bien definidos. Ejemplos de aplicaciones en las que las
RNA realizan un buen trabajo de acuerdo a [Heaton08] son las siguientes:
Clasificacin
Agrupamiento
Optimizacin
Prediccin
-
5
El sistema descrito en el presente proyecto, hace uso de tcnicas de RP para llevar a
cabo la clasificacin de firmas autgrafas utilizando una RNA entrenada mediante
tcnicas de Aprendizaje Supervisado.
En cuanto a la representacin de las firmas, se ha optado por utilizar una
combinacin no reportada en la literatura consultada de caractersticas ya existentes
y adems, se propone una nueva caracterstica basada en el concepto de puntos
iniciales y finales de trazos encontrada en la grafoscopa.
Para la extraccin de las primeras, se hace uso de tcnicas de Procesamiento de
Imgenes Digitales mientras que para la caracterstica nueva, se utiliza la
Transformada Wavelet.
-
6
1.2 OBJETIVOS
La diferencia en el avance que se ha dado entre los sistemas estticos y dinmicos
es muy grande. Mientras que los sistemas dinmicos han logrado resultados con
muy bajos porcentajes de error, los estticos siguen an obteniendo porcentajes de
error ms grandes lo que los hace poco prcticos para aplicaciones reales
[Leclerc94], sin embargo, son precisamente los sistemas estticos los que resultan
ms atractivos para aplicaciones prcticas debido a que son ms fciles de
implementar ya que no requieren dispositivos electrnicos especiales y slo
necesitan como entrada, una imagen digital de la firma a analizar.
De esta necesidad, surge el actual proyecto el cul se enfoca en un mtodo esttico
para la verificacin de firmas explorando el uso de la Transformada Wavelet en
conjunto con las caractersticas propias de los mtodos estticos a saber: altura,
anchura y centro entre otras. Como clasificador se emplear una Red Neuronal
Artificial.
Los objetivos planteados para este proyecto son los siguientes:
Proponer un sistema que permita clasificar una firma como autntica o falsa.
Utilizar Wavelets en la Representacin del Patrn de una Firma.
Proponer una combinacin de caractersticas existentes no reportada en la
literatura consultada.
Mezclar las caractersticas obtenidas mediante el uso de Wavelets con la
combinacin propuesta de caractersticas ya existentes.
Utilizar una Red Neuronal Artificial para llevar a cabo la clasificacin.
-
7
1.3 CONTRIBUCIN
En esta investigacin se ha realizado lo siguiente:
Se propuso encontrar los puntos borde de los diferentes trazos en la firma
como una nueva caracterstica no encontrada en la literatura revisada.
La representacin de la nueva caracterstica propuesta se realiz mediante el
uso de la Transformada Wavelet.
Se propuso una combinacin no reportada en la literatura consultada de
caractersticas ya existentes.
Se combin la nueva caracterstica con la combinacin propuesta de
caractersticas tradicionales encontradas en la literatura revisada.
Se hizo uso de una RNA para llevar a cabo la clasificacin utilizando, en
concreto, una red de tipo Perceptron Multicapa entrenada mediante el
algoritmo BackPropagation.
En resumen, en este documento se describe cmo se consigui implementar la
nueva caracterstica, utilizarla en conjunto con las dems caractersticas ya
existentes en la literatura consultada para llevar a cabo la clasificacin de firmas
autnticas o falsas mediante el uso de una Red Neuronal Artificial.
-
8
1.4 ORGANIZACIN
En el captulo dos se encuentra la teora que soporta la presente investigacin la cual
comienza con una breve introduccin a las wavelets, definiendo en particular, las
wavelets de la familia de Daubechies. El captulo contina exponiendo de manera
breve lo que es el Reconocimiento de Patrones seguido por la teora de las Redes
Neuronales Artificiales donde se introduce la red ms sencilla conocida como
Perceptron para dar paso al modelo ms complejo del Perceptron Multicapa. A
continuacin se trata el Procesamiento de Imgenes Digitales explicando los
conceptos de binarizacin, filtrado lineal por correlacin y esqueletizacin; en
particular, describiendo el mtodo propuesto en [Zhang84] para obtener el esqueleto
de una imagen. Al finalizar con el tema de Procesamiento de Imgenes Digitales, se
describen los principios de la disciplina de la Grafoscopa y por ltimo, se da una
introduccin a los Sistemas de Verificacin Automtica de Firmas.
En el captulo tres y cuatro, se describe el mtodo seguido en la presente
investigacin as como los resultados obtenidos y la descripcin del sistema
desarrollado mientras que el captulo cinco, por su parte, presenta las conclusiones y
sugiere una serie de propuestas para continuar con el proyecto.
Al final se puede encontrar una serie de apndices donde se describe el software
utilizado para la realizacin del sistema propuesto.
-
9
2 CAPTULO II
2.1 MARCO TERICO
En este captulo se expone la teora que fundamenta la presente investigacin
comenzando con una breve introduccin a las wavelets seguida por la teora de RNA
utilizada para llevar a cabo este proyecto. El resto del captulo est dedicado al
Procesamiento de Imgenes Digitales, Grafoscopa y Sistemas Automticos de
Verificacin de Firmas.
2.2 WAVELETS
Las expansiones trigonomtricas surgieron en el siglo 18 durante estudios de
vibracin de cuerdas y otros fenmenos similares pero no fueron tratadas de una
manera sistemtica sino hasta que, en 1808, Jospeh Fourier escribi "Thorie
Analytique de la Chaleur" (Teora Analtica del Cal or) , donde realiz un estudio
detallado de las series trigonomtricas las cuales utiliz para resolver varios
problemas relacionados con la conduccin de calor. Su trabajo fue controversial en
su momento y, an despus de dos siglos, las series de Fourier son importantes,
tanto prctica como tericamente y siguen siendo objeto de investigacin.
Una expansin trigonomtrica de una funcin f(x) est dada por una sumatoria o
serie del tipo:
)()cos()( 0 kxsenbkxaaxf kk k ++=
Mediante la expansin de una seal en su serie trigonomtrica es posible
manipularla llevando a cabo diversas tareas. Una tarea comn en el anlisis de
seales es la eliminacin del ruido de alta frecuencia. Un enfoque para llevar esto a
cabo es expresar la seal como una serie trigonomtrica y poner a cero los
coeficientes de las frecuencias altas. Otra tarea es la compresin de datos. Aqu el
-
10
enfoque puede ser, expresar la funcin en trminos de una expansin trigonomtrica
y conservar slo aquellos trminos cuyos coeficientes sean mayores que algn
umbral de tolerancia.
A pesar de que la transformada de Fourier ha sido el pilar del procesamiento de
imgenes basado en transformadas desde la dcada de los aos 50, a finales de los
aos 80's surgi otro tipo de Transformada llamada Transformada Wavelet con la
cual es ms fcil realizar tareas de compresin, anlisis y transmisin de imgenes
[Gonzles08].
Una wavelet es una funcin en forma de "onda" con una duracin limitada y con un
valor promedio de 0. A diferencia de las funciones sinusoidales que, tericamente se
extienden de - a +, las wavelets tienen un principio y un fin [Fugal09]. La figura 2.1
muestra la diferencia entre la funcin coseno y una wavelet Daubechies 20.
FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN WAVELET MADRE
DAUBECHIES 20
A diferencia de la transformada de Fourier que slo provee informacin en el dominio
frecuencial, la Transformada Wavelet proporciona informacin tanto en el dominio
frecuencial como en el temporal, es decir, puede detectar anomalas o caractersticas
de inters en la seal y, al mismo tiempo, indicar cundo suceden [Gonzles08].
-
11
Existen diversas familias de wavelets, cada una con diferentes caractersticas que las
hacen ms o menos adecuadas para diferentes tareas. En general, la transformada
Wavelet est dada por la siguiente ecuacin:
=
=kj
jjk kxbxf
,
)2()( (1)
Siendo:
b Coeficiente a calcular.
Wavelet Madre.
j y k Factores de escalamiento y traslacin respectivamente.
Cada familia de wavelets cuenta con una wavelet madre la cual es aplicada a lo largo
de la seal en diferentes posiciones y en diferentes escalas. La escala y la posicin
de la seal donde ha de ser aplicada la wavelet vienen especificadas por los valores
en j y k .
2.2.1 Wavelet Daubechies
La wavelet madre para la familia de wavelets de Daubechies se define mediante la
siguiente ecuacin:
)2/()( 2/2/ Ni
Ni
N ePe = (2)
NP es un polinomio de grado N donde N indica el tipo de wavelet de Daubechies a
utilizar, por ejemplo: Db2, Db3 Db50 y viene dado por:
=12
2
1:)(
N
k
kkN zpzP (3)
kp , por su parte, toma valores de la Tabla 2.1.
-
12
N se encuentra definida por la siguiente ecuacin:
=
=1
2/ )(2
1)(
j
iNN
j
eP
(4)
TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES
kp 1=N 2=N 3=N 4=N
0p 1 0.683013 0.470467 0.325803
1p 1 1.183013 1.141117 1.010946
2p 0 0.316987 0.650365 0.892200
3p 0 -0.183013 -0.190934 -0.039575
4p 0 0 -0.120832 -0.264507
5p 0 0 0.049817 0.043616
6p 0 0 0 0.023252
7p 0 0 0 -0.014987
En la figura 2.2, se muestra la wavelet madre de Daubechies.
FIGURA 2.2. WAVELET MADRE DAUBECHIES
-
13
2.3 RECONOCIMIENTO DE PATRONES
Podemos definir el trmino patrn como la representacin de un objeto y el trmino
Reconocimiento de Patrones, de acuerdo a [Tou74], como la tarea de detectar y
extraer rasgos comunes que describen los objetos pertenecientes a una misma clase
de patrones y reconocer este patrn en cualquier nuevo ambiente para clasificarlo
como un miembro de dicha clase.
Existen varios enfoques para el estudio de las tareas de RP siendo el estadstico y el
sintctico los que mayor atencin han recibido.
El enfoque sintctico intenta encontrar los elementos bsicos de los patrones para
describirlos as como un conjunto de reglas sintcticas o gramtica que especifique
la forma en la que estas primitivas se pueden combinar para dar lugar a un patrn
legtimo dentro de una clase de inters [Gasca10].
El enfoque estadstico, por su parte, reconoce la naturaleza probabilstica tanto de la
informacin que se busca procesar como de la forma en la que los resultados se
deberan representar [Bishop95] y se considera que el problema de decidir si un
patrn pertenece o no a una clase puede ser tratado por la teora estadstica de la
decisin.
Este enfoque supone que los patrones se pueden representar mediante vectores y
que en la mayora de los problemas reales, existe un solapamiento inevitable en la
distribucin de las clases lo que subraya su naturaleza inherentemente probabilstica.
Esto mismo hace que sea necesario tratar las variables medidas como cantidades
aleatorias y obliga a aceptar que no siempre es posible una clasificacin perfecta de
nuevos patrones.
Los sistemas de RP tienen tres etapas fundamentales:
-
14
Preprocesamiento.- Durante esta etapa se trata la informacin original para
mejorar su calidad.
Seleccin de variables.- Aqu se trata de elegir las variables con mayor poder
discriminatorio para reducir la dimensin del problema y mejorar la precisin
del clasificador.
Clasificacin.- Esta etapa se considera, en el enfoque estadstico, como un
problema que, dado el carcter multidimensional de la informacin utilizada,
se puede resolver utilizando mtodos de anlisis multivariado como lo es el
anlisis discriminante.
2.3.1 Enfoque estadstico
De acuerdo a [Gasca10], se le atribuye por primera vez a Chow, en 1957, la
formulacin rigurosa del problema de RP en trminos de la teora de decisin
estadstica y su objetivo es encontrar un clasificador ptimo, es decir, aqul que
tenga la menor probabilidad de cometer errores.
Para este enfoque, el patrn se representa mediante un vector ),...,,,( 321 pxxxx=X
de mediciones el cual se considera como un punto en un espacio p-dimensional y
diferentes individuos pueden producir diferentes valores para una misma medicin
sin importar que pertenezcan a la misma clase.
Como ya se mencion en la Introduccin, el RP se puede formalizar
matemticamente como una funcin, definida con dominio en el espacio de las
mediciones o atributos y con imagen en el conjunto de clases presentes en el
problema que se estudia por lo que la entrada al sistema de RP es un conjunto de p
mediciones y la salida es la etiqueta o cdigo que identifica a una de las clases que
se consideran. Por lo anterior, se acostumbra representar la entrada como un vector
X conocido como vector patrn [Gasca10].
-
15
El mapeo entre el vector patrn y las clases dadas se lleva a cabo mediante una
funcin de la forma:
)(X=c (5)
donde ),...,2,1( mc es la etiqueta correspondiente a una de las m clases
consideradas en el problema y )(X es la funcin de decisin.
Se trata entonces de poder dividir el espacio de variables en regiones de decisin,
correspondiendo cada una de esas regiones a una clase dada. El borde o frontera
entre cada regin se conoce como frontera de decisin y el objetivo de )(X , por lo
tanto, es asignar X a la clase asociada a una regin dada. En la figura 2.3 se ilustra
grficamente este concepto utilizando un espacio bidimensional:
FIGURA 2.3. FRONTERA DE DECISIN
Si no se conoce la clasificacin correcta de los patrones disponibles se utilizan
mtodos no supervisados o algoritmos de clustering para encontrar relaciones no
conocidas de antemano entre ellos. Si por el contrario, se conoce la clasificacin de
un conjunto de patrones disponibles, se pueden utilizar mtodos supervisados y el
conjunto de patrones disponibles previamente clasificados se conoce entonces como
Muestra de Entrenamiento y es utilizada para entrenar el clasificador. Existen dos
tipos de mtodos de entrenamiento supervisados:
-
16
Paramtricos.- Se conoce o se supone que se conoce la funcin de densidad
del modelo y, mediante la muestra de entrenamiento, se busca ajustar los
parmetros de la funcin para que se ajuste al modelo.
No Paramtricos.- Estos son independientes de cualquier supuesto sobre la
estructura probabilstica.
-
17
2.4 REDES NEURONALES ARTIFICIALES
La importancia de las RNA en el contexto mencionado en la seccin anterior, es que
ofrecen un mtodo muy poderoso y flexible de representar mapeos no lineales desde
varias variables de entrada hacia varias variables de salida donde la forma del
mapeo, como se ver ms adelante, se encuentra gobernada por un nmero de
parmetros ajustables [Bishop05].
Las RNA, son un paradigma de aprendizaje y procesamiento automtico inspirado en
el sistema nervioso de los animales. Se puede ver como un sistema de interconexin
de neuronas colaborando para producir un estmulo de salida el cual tiene diversas
ventajas sobre mtodos de procesamiento de informacin convencionales como lo
son:
No linealidad.- La respuesta puede ser lineal o no lineal. Esto es importante ya
que la mayora de los fenmenos en el mundo real no se comportan de
manera lineal.
Flexibilidad.- Maneja bien el ruido en la seal de entrada.
Auto-organizacin.- Esta propiedad permite a la red distribuir el conocimiento
en toda la estructura de la red permitiendo que no haya elementos con
informacin especfica.
Aprendizaje adaptativo.- Son capaces de aprender a travs de la presentacin
repetitiva de una serie de ejemplos previamente clasificados sin requerir de un
modelo previo.
Tolerancia a Fallos.- Puede continuar funcionando an cuando partes de la
red no funcionen correctamente debido a que la informacin se guarda de
manera redundante.
De acuerdo a [Gurney97], podemos definir el trmino de Red Neuronal Artificial
como:
-
18
"Un ensamble interconectado de elementos simples de procesamiento, unidades o
nodos, cuya funcionalidad est vagamente basada en la neurona animal. La
habilidad de procesamiento de la red, se encuentra ubicada en la fuerza de la
interconexin entre unidades, o pesos, obtenidos mediante un proceso de adaptacin
hacia, o aprendizaje desde, un conjunto de patrones de entrenamiento."
Las unidades o nodos se refieren a las neuronas artificiales o computacionales que
se encuentran organizadas jerrquicamente en capas y se comunican entre ellas
mediante conexiones ponderadas por pesos que definen la importancia de la
conexin particular entre neuronas.
La manera en la que se estructura la RNA, es decir, el nmero de capas, el nmero
de neuronas por capa y sus conexiones, define su topologa o arquitectura
permitiendo categorizar a las neuronas en tres tipos; de entrada, salida y ocultas. Las
neuronas de entrada tienen como funcin principal obtener los valores del patrn de
entrada con los que se alimenta la red para pasarlas a las neuronas de las siguientes
capas. Una caracterstica de este tipo de neuronas es que no realizan procesamiento
alguno sobre los valores de entrada y se limitan a pasar lo que reciben a las
neuronas de las siguientes capas. Las neuronas ocultas se encuentran en capas
intermedias, es decir, no tienen contacto con el ambiente externo a la red y por
ltimo, las de salida, toman como entrada las salidas de las neuronas de las capas
ocultas y se encargan de notificar la salida de la red al exterior [Gasca11].
El conocimiento se guarda en los pesos de las conexiones entre neuronas los cuales
son inicializados de manera aleatoria y, mediante un proceso de entrenamiento, se
van modificando hasta que la red aprende la tarea para la que ser utilizada. A estos
procesos de entrenamiento se les denomina Aprendizaje y puede ser Supervisado o
No Supervisado.
En el Aprendizaje Supervisado, un conjunto de patrones, previamente clasificados,
es presentado a la red a lo largo de una serie de iteraciones a travs de las cuales,
se modifican los pesos utilizando una regla de aprendizaje cuyo objetivo es minimizar
-
19
una funcin de error, por ejemplo, el error cometido en el valor real de salida de la
red con respecto al valor deseado.
2.4.1 Modelo Biolgico
Las RNA se inspiran en el modelo biolgico del cerebro por lo cual, necesitamos
tener un entendimiento del funcionamiento bsico del cerebro para poder
comprender la formulacin de las RNA.
Los sistemas nerviosos poseen diferentes arquitecturas de diversas complejidades
pero todos ellos estn formados, de manera similar, por bloques bsicos de clulas
llamadas neuronas. Existen varios tipos de neuronas, morfolgicamente distintas
dependiendo de las funciones que realizan, sin embargo, todas ellas tienen en
comn que poseen una gran capacidad de comunicacin [Rojas96].
El funcionamiento bsico de las neuronas es recibir una seal de entrada y producir
una seal de salida. En la figura 2.4, se muestra la estructura general de una
neurona:
FIGURA 2.4. NEURONA BIOLGICA
Las Dendritas son los canales de transmisin a travs de los cuales, la neurona
recibe informacin. En el Soma, o ncleo de la clula, se procesa produciendo o no,
-
20
una seal de salida que es enviada a travs del Axn mediante un impulso elctrico
a otras Dendritas. Las Dendritas no tocan fsicamente el Axn, ms bien, se
comunican por medio de una regin llamada sinapsis a travs de la cual se
transmiten sustancias qumicas denominadas neurotransmisores [Gasca11].
Nuestro cuerpo est formado de una gran cantidad de agua, encontrndose el 55%
de ella dentro del cuerpo de las clulas y el restante 45% alrededor de ellas por lo
que las clulas mantienen sus componentes biolgicos aislados del resto del cuerpo
mediante una capa protectora o membrana. En el fluido extracelular e intracelular,
existen especies inicas de sales como cloruro-, sodio+ y potasio+ que juegan un
papel fundamental en el intercambio de informacin entre neuronas. Las membranas
de las clulas cuentan con canales inicos que estn formados por macromolculas
con formas y cargas especficas para dejar pasar determinadas cantidades de iones
de un lado a otro de la membrana. Diferentes grados de permeabilidad a elementos
especficos en la membrana, permiten que haya diferencias en la distribucin entre
los elementos inicos que se encuentran dentro y fuera de la membrana haciendo
que exista una diferencia de carga entre el fluido intracelular y el extracelular. A esta
diferencia de carga se le conoce como potencial en reposo [Rojas96]. Cuando se
transmite la informacin a travs de la sinapsis, se genera una variacin en este
potencial conocida como potencial de accin el cual genera una variacin en la
permeabilidad de la membrana permitiendo el intercambio de los neurotransmisores.
Las sinapsis pueden ser excitadoras o inhibidoras. Las primeras producen
disminuciones de potencial, ocasionando con esto la generacin de impulsos. Las
segundas, por su parte, estabilizan el potencial inhibiendo la generacin de impulsos
[Gasca11].
Ya que la neurona, a travs de sus dendritas, recibe informacin de varias neuronas,
la seal total de entrada es la suma ponderada de cada una de las seales recibidas.
Si el total rebasa cierto umbral, la neurona se activa [Gasca11].
-
21
Es en base al modelo expuesto anteriormente, que surge dentro del rea de la IA la
teora de las RNA.
2.4.2 Neurona Artificial
Una RNA, est formada por nodos que mantienen conexiones con otros nodos o con
su ambiente externo. Cada uno de estos nodos es una neurona artificial y cada una,
recibe una entrada y genera una salida [Russell96].
Con base al modelo de la neurona biolgica, en la figura 2.5, se muestra el modelo
tpico de una neurona artificial:
FIGURA 2.5. NEURONA ARTIFICIAL.
El modelo est formado por una serie de conexiones a travs de las cuales la
neurona recibe una serie de valores de entradas, en especfico, n entradas ms una
entrada fija con valor de uno llamada bias. Cada conexin se encuentra ponderada
por un peso y, la entrada neta que recibe la neurona, es la sumatoria de la
multiplicacin de cada peso por el valor de salida del nodo de la capa anterior como
se muestra en la siguiente ecuacin:
-
siendo w el vector de pesos aumentado y
anterior. Se dice que los vectores son aumentados por que incluyen los valores del
bias.
La neurona cuenta tambin con una funcin de activacin la cual recibe la
neta de la neurona y decide si la neurona se activa o no. Por lo general, las funciones
de activacin son funciones no lineales que producen valores de salida en el rango
de 0 a 1, sin embargo, existen diversas funciones de activacin [Selene09].
Algunas funciones de activacin son:
Lineal.- yxf =)( (Figura
Escaln.- 0=y si
Sigmoide.- xf =)(
FIGURA
=
=n
iijij ownet
0
el vector de pesos aumentado y o el valor de salida del nodo de la capa
anterior. Se dice que los vectores son aumentados por que incluyen los valores del
La neurona cuenta tambin con una funcin de activacin la cual recibe la
neta de la neurona y decide si la neurona se activa o no. Por lo general, las funciones
de activacin son funciones no lineales que producen valores de salida en el rango
de 0 a 1, sin embargo, existen diversas funciones de activacin [Selene09].
Algunas funciones de activacin son:
(Figura 2.6)
si 0
-
FIGURA
FIGURA
2.4.3 Perceptron Simple
El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblat
1958 [Russell96]. Su topologa est
salida [Gasca11].
FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN
FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE
Perceptron Simple
El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblat
96]. Su topologa est formada por dos capas, una de entrada y una de
23
ESCALN
FUNCIN DE ACTIVACIN SIGMOIDE
El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblatt en
formada por dos capas, una de entrada y una de
-
24
El Perceptron simple, separa los patrones de entrada en dos categoras.
Geomtricamente, estas categoras se pueden ver como regiones en un espacio n-
dimensional que son separadas por una lnea, plano o hiperplano [Gurney97]. Cada
patrn, por lo tanto, se puede ver como un punto en ese espacio n-dimensional,
usando sus valores como coordenadas, es decir, para n entradas, se tendr un
espacio de n dimensiones.
Como ya se mencion anteriormente, las neuronas de la capa de entrada no realizan
ningn procesamiento sobre los valores de entrada por lo que su salida es la misma
que su entrada. Para cualquier otro nodo, su entrada se determina mediante el
clculo del valor neto descrito mediante la Ecuacin 6.
Este valor neto de entrada, es en realidad una combinacin lineal de los elementos
de entrada y los pesos de las conexiones como se muestra en la siguiente ecuacin:
=
++=n
jjjj wxwy
11 1* (7)
1+jw es el peso del elemento bias cuyo valor de salida siempre es 1 y corresponde en
la interpretacin geomtrica del Perceptron al trmino constante de la ecuacin de la
recta, plano o hiperplano, que separa el espacio de observacin en dos. Si no fuera
por este trmino, la recta, plano o hiperplano, pasara siempre por el origen.
Como ya se mencion, por razones de simplicidad podemos incluir el bias en los
vectores de pesos y en el vector de entrada, generando as los vectores aumentados
de pesos y de valores de entrada. Si definimos w como el vector de pesos
aumentado, tendramos que:
[ ]Tnn wwww 121 ,,..., +=w (8)
Si definimos el vector aumentado de entrada como z tendramos que:
-
25
[ ]Tnxxx 1,,..., 21=z (9) Con estos dos vectores, podemos redefinir la funcin discriminante lineal como:
zwT =y (10)
El resultado es entonces evaluado por regla de decisin:
es decir, cuando d= 1, el patrn pertenece a la clase A de lo contrario, pertenece a la
clase B.
La regla de aprendizaje para el Perceptron Simple, la cual ajusta los pesos, es la
siguiente:
iiiii dt zww )(1 += (11)
donde t es la salida real de la red en la iteracin i ,
d es la salida deseada en la
iteracin i y es un constante llamada razn de aprendizaje.
El principal problema del Perceptron Simple es que solamente es eficiente en
problemas con dos clases que sean linealmente separables, lo que lo hace poco
prctico para la mayora de aplicaciones reales las cuales tienden a ser de ms de
dos clases y no linealmente separables.
-
26
2.4.4 Perceptron Multicapa
El Perceptron Multicapa es la unin de varios perceptrones simples [Selene09].
Mediante estas uniones, el Perceptron Multicapa es capaz de resolver los problemas
con los que se enfrenta el Perceptron Simple pudiendo tratar con problemas no
separables linealmente. La figura 2.9 ilustra la arquitectura del Perceptron Multicapa.
FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA
Adems de la diferencia en topologa entre el Perceptron Simple y el Multicapa, el
algoritmo de aprendizaje es diferente. La diferencia radica en que, en este modelo,
se deben ajustar los pesos de las conexiones de los nodos de las capas ocultas,
tratando de determinar la influencia que tuvo cada uno, en el error total de la salida
de la red [Gurney97]. A este problema se le conoce como el problema de la
Asignacin de Crditos y se puede resolver si se cuenta con una funcin de error
diferenciable con respecto a los pesos, pudiendo as, evaluar las derivadas del error
con respecto a los pesos y utilizarlas para encontrar los valores de los pesos que
minimicen el error con algn mtodo como el de gradiente descendente [Bishop95].
Un algoritmo muy popular que implementa esta solucin es el algoritmo
BackPropagation que pertenece tambin a la clase de mtodos supervisados, es
decir, se requiere una muestra de entrenamiento previamente clasificada. Se llama
as porque propaga el error de adelante hacia atrs a travs de los nodos de la red.
-
27
El algoritmo se lleva a cabo en dos fases: En la primera, se evala el error de la red y
en la segunda, se calcula la derivada del error con respecto a los pesos para calcular
su ajuste de manera que se minimice la funcin de error.
Este algoritmo utiliza el error cuadrtico medio como funcin de error:
2
12
1 )(=
=S
S
N
i
piNE (12)
siendop
i :
)( pip
ip
i sd = (13)
es decir, el error cometido definido como la diferencia entre la salida deseada pid y la
salida real de la red pis para el p-simo patrn en la i-simo nodo de la capa de salida.
sN es la cantidad de nodos de la capa de salida.
Una vez obtenido el error cuadrtico medio, los pesos se ajustan mediante el uso del
algoritmo de gradiente descendente:
)1()( += twEtw pw (14)
Donde es la razn de aprendizaje, pwE es el gradiente de la funcin de error con
respecto a los pesos, es el momento y t es el nmero de iteraciones.
-
28
2.5 PROCESAMIENTO DE IMGENES DIGITALES
Ya que el sistema propuesto en este proyecto toma como entrada imgenes
digitales, el procesamiento de stas juega un papel fundamental en el mismo. Una
imagen se puede ver como una funcin de dos variables f(x,y) donde x y y son
coordenadas espaciales y el valor de f, para cualquier par de coordenadas x y y es la
intensidad o nivel de gris de la imagen en ese punto [Gonzles04].
La imagen digital, en los sistemas computacionales, se puede representar y
manipular a travs de una matriz de M x N donde cada elemento de la matriz
representa un pixel y su posicin se conoce como coordenada del pixel. Las
posiciones van de 0 a M-1 y a N-1. A continuacin se ilustra este concepto a travs
de la siguiente matriz [Gonzles04]:
(15)
Un pixel p con coordenadas (x,y), puede tener hasta 8 pixeles vecinos como se
muestra a continuacin:
RELACIN DE UN PIXEL CON SUS PIXELES VECINOS
-
29
Estas relaciones son importantes, ya que muchas de las tareas de procesamiento de
imgenes digitales se pueden llevar a cabo mediante mscaras o filtros que se
aplican directamente sobre un pixel dado para encontrar cul es la relacin que
existe entre el valor del pixel central con respecto al de sus vecinos.
Existen muchas operaciones aplicables a las imgenes digitales para facilitar su
posterior procesamiento o anlisis, sin embargo, para los fines de este proyecto, nos
limitaremos a exponer la binarizacin, la obtencin del esqueleto de una imagen y la
aplicacin de filtros a imgenes digitales conocida como Correlacin.
2.5.1 Binarizacin
La binarizacin es el proceso mediante el cual se asigna uno de dos posibles valores
(blanco o negro) a cada pixel de la imagen de manera que un color sea usado para
los pixeles que representen el fondo de la imagen y el otro para aquellos que sean
parte del primer plano de la misma. Un mtodo comn para llevar esto a cabo es
utilizar un umbral y considerar a todos los pixeles con valores iguales o mayores al
umbral como parte del primer plano de la imagen y a todos aquellos con valores por
debajo del umbral como parte del fondo. Los pixeles con color negro formaran parte
del fondo de la imagen, mientras que aquellos con color blanco, formaran parte de
las figuras contenidas en la imagen. La figura 2.10 muestra un ejemplo de una
imagen y el resultado de su binarizacin.
FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA
-
30
2.5.2 Esqueletizacin
El anlisis de trazos es un mtodo efectivo para reconocer ciertos patrones digitales
como caracteres alfanumricos o ideogrficos [Zhang84].
La esqueletizacin de una imagen es un tipo de operacin morfolgica de
adelgazamiento mediante la cual se pueden descubrir los pixeles fundamentales que
forman la estructura bsica de una figura en una imagen digital [Gonzles08].
Por lo regular los algoritmos de adelgazamiento se aplican a imgenes binarias,
descritas en la seccin anterior, y funcionan a lo largo de una serie de iteraciones. En
cada iteracin, se evala cada uno de los pixeles que no forman parte del fondo y,
aquellos que se determina que no forman parte de la estructura fundamental de las
figuras contenidas en la imagen son descartados. La imagen resultante es usada
como entrada para la siguiente iteracin la cual aplica el mismo procedimiento para
continuar descartando aquellos pixeles que no son fundamentales. El algoritmo
finaliza cuando pasa una iteracin completa sin que se haya podido descartar ningn
pixel. En la figura 2.11, se muestra un ejemplo tomado de [Zhang84] donde se aplica
el proceso de esqueletizacin a una imagen que contiene una figura de una letra "H"
a lo largo de tres iteraciones:
FIGURA 2.11. ESQUELETO DE LA LETRA H.
-
31
La figura 2.11(c) es el resultado final donde ya se descartaron todos aquellos pixeles
de los cuales se puede prescindir sin que se pierda la informacin esencial que
transmite la imagen.
[Zhang84] propone el siguiente algoritmo:
1. Obtener Imagen Binaria I:
2. Sub-iteracin 1: Para cada pixel p de la imagen I que no forma parte del fondo:
2.1. Evaluar las siguientes condiciones:
2.2. Si se cumplen las condiciones mencionadas anteriormente, marcarlo para ser
borrado posteriormente.
3. Si no existe ningn pixel qu borrar, finalizar el algoritmo.
4. Borrar en I todos los pixeles marcados en el paso 2.2.
5. Sub-iteracin 2: Para cada pixel p de la imagen I resultante del paso 4 que no
formen parte del fondo:
5.1. Evaluar las condiciones:
-
32
5.2. Si cumple con las condiciones mencionadas anteriormente, marcarlo para ser
borrado posteriormente.
6. Si no existe ningn pixel qu borrar, finalizar el algoritmo.
7. Borrar en I todos los pixeles marcados en el paso 5.2.
8. Repetir desde el paso 2 tomando como entrada la imagen I resultante del paso 7
)( 1PB es el nmero de vecinos que forman parte de la imagen, es decir, que tienen
como valor un 1. Esta condicin permite asegurar que no se borren pixeles que sean
puntos finales o que sean parte central de las figuras contenidas en la imagen.
)( 1PA es el nmero de ocurrencias del patrn "01" en el conjunto ordenado
76,5432 ,,,, PPPPPP y 8P .
nP , por su parte, se refiere a la ubicacin de los pixeles mostrados en la siguiente
matriz:
Dicha matriz da la relacin de pixeles usada para evaluar condiciones del algoritmo
de Zhang Suen.
Cabe destacar que el pixel 1P es el pixel p que se est evaluando.
-
33
A continuacin se ilustra un ejemplo donde )( 1PA dara como resultado 2 ya que el
patrn "01" se presenta dos veces:
EJEMPLO DE EVALUACIN DE CONDICIN A(P1)
Esta condicin nos permite verificar que no borremos pixeles que se encuentren en
medio de dos puntos finales.
La figura 2.12 nos da tres ejemplos en los que las condiciones 1 y 2, nos ayudan a
no eliminar pixeles de puntos finales o que son parte central del esqueleto:
FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES
Las letras A y C indican pixeles finales que no deben ser borrados. La condicin 1
nos impide borrarlos. La letra B indica un pixel central que es conservado gracias a la
condicin 2.
-
34
Las condiciones 3 y 4, para ambas sub-iteraciones, nos permiten evaluar pixeles que
forman parte de bordes en las esquinas noroeste, sureste, suroeste o noreste de
acuerdo a la figura 2.13:
FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4
Contando con el esqueleto de una firma, se pueden obtener varias de las
caractersticas utilizadas en este proyecto para la formacin del patrn de la firma de
una manera sencilla.
2.5.3 Correlacin
La Correlacin es una tcnica de filtrado lineal de imgenes que consta en aplicar
una mscara o filtro a cada pixel en conjunto con sus pixeles vecinos para obtener la
suma ponderada de los valores de cada uno de los pixeles a ser evaluados. La
matriz de pesos es precisamente la mscara o filtro aplicada y se conoce como
kernel o filtro.
A manera de ejemplo, la figura 2.14 muestra los valores de los pixeles de una
imagen de 4x5 y la figura 2.15 los valores de una mscara de 3x3.
FIGURA 2.14. IMAGEN DE 4x5
-
35
FIGURA 2.15. MSCARA DE 3x3
La figura 2.16 muestra cmo se aplicara el kernel o mscara al pixel en la fila 2 y
columna 4 con valor 14:
FIGURA 2.16. APLICACIN KERNEL
El resultado sera: 1*8 + 8*1 + 15*6 + 7*3 + 14*5 + 16*7 + 13*4 + 20*9 + 22*2=585.
-
36
2.6 GRAFOSCOPA
La grafoscopa es la disciplina que estudia la autenticidad o autora de grafismos
como la escritura o la firma. Surge desde 1776 pero no es sino hasta mediados del
siglo pasado cuando comienza a tomar un carcter cientfico [Orellana75].
La firma autgrafa es uno de los medios ms aceptados para la verificacin de la
identidad personal y es utilizada en toda clase de documentos oficiales como licencia
de conducir y credencial de elector entre otros. La firma es consecuencia de una
accin grfica producto de un reflejo condicionado cuyo mecanismo se encuentra
dirigido en gran medida por nuestro inconsciente [Orellana75], por ello, no slo se
asocia con informacin relacionada con el nombre del firmante sino que a partir de
ella, se pueden encontrar caractersticas psicolgicas del mismo las cuales estn
relacionadas especficamente con el sistema psicomotor, motivo por el cual se
considera como la representacin grfica de la identidad de un individuo y se acepta
como elemento til para la validacin y autorizacin en diversos tipos de operaciones
como lo son las financieras y legales entre otras [Baez06].
Un acto reflejo se produce cada vez que se dan las condiciones de estmulo
adecuadas, siendo stas para el caso de la firma, tctiles, visuales y fonticas. En
cuanto se toma la decisin de firmar, se pone en marcha el proceso "signatriz" que
desencadena un conjunto de desenvolvimientos grficos cuyo resultado es la firma.
La figura 2.17 muestra el proceso signatriz.
[CMGC08] define el proceso signatriz como la sucesin de eventos que se producen
dentro y fuera de nosotros cuando deseamos ejecutar nuestra firma y que finaliza en
la ejecucin propiamente dicha.
-
37
FIGURA 2.17. PROCESO SIGNATRIZ
Existen seis etapas dentro del proceso signatriz [GMGC08]:
1. Informacin del consciente al inconsciente del deseo de firmar.- Este proceso
se desencadena con el simple hecho de querer firmar ocasionando que el
inconsciente tome el mando y verifique que existan los elementos necesarios
para pasar a la accin, por ejemplo, cuando la persona automticamente
busca un lpiz y papel para firmar.
2. Examen de estmulos materiales.- Los estmulos materiales son analizados a
travs del tacto, por ejemplo, al tomar un lpiz, de manera inconsciente se
examina el grosor, peso y talla del mismo y si se consideran aptos, el
inconsciente transmite una sensacin de comodidad que permite seguir con el
proceso normal de firmado.
3. Examen de estmulos grficos.- En cuanto se tienen los elementos fsicos, el
inconsciente ordena que se verifique si existen marcas grficas que den gua y
orientacin a la firma como una lnea o un rectngulo en el rea de firmado.
Los estmulos grficos ms importantes son los bordes del papel cuando est
en blanco, lnea expresa para firmar, recuadros especficos para la firma, texto
-
38
que diga "firma" y marcas especiales como cruces, puntos y seales
especficas.
4. Ejecucin de los reflejos condicionados.- Cuando un estmulo grfico es
conocido, se ejecuta el reflejo condicionado de manera inconsciente como
cuando firmamos en un rectngulo reducido e inmediatamente se calcula y
reduce la dimensin de la firma para ajustarse al espacio disponible. Por el
contrario, cuando un estmulo grfico no es conocido, se requiere mayor
informacin por lo que el control vuelve al consciente para conseguirla y
continuar con el proceso. Un ejemplo de lo anterior es cuando no est claro
dnde firmar y el firmante tiene que preguntar dnde hacerlo para poder
continuar.
5. Proceso motriz.- Los diseos de la firma estn grabados en la memoria motriz
bajo impulsos sinpticos llamados imgenes motrices. Cuando las imgenes
motrices se convierten en sus correspondientes movimientos fsicos, se
produce la accin signatriz cuyo resultado da la firma. Las imgenes motrices
contienen toda la informacin necesaria para producir la firma: movimiento de
los msculos, presin sobre el lpiz o pluma, velocidad y tiempo en el que
deben ejecutarse los movimientos entre otros. Esta informacin se usa para
almacenar en la memoria motriz la actividad cintica y la cantidad exacta de
energa que precisan los msculos para llevar a cabo los desenvolvimientos
fsicos necesarios.
6. Emplazamientos prefijados o colocacin.- Aqu se da la materializacin del
reflejo grfico condicionado, es decir, la realizacin de la firma.
La importancia de cada uno de los elementos grficos constitutivos de la firma se
mide por el valor que estos adquieren cuando se quiere verificar si la firma es
autntica o no. Los elementos fundamentales son rara vez percibidos por el
falsificador por lo cual no los reproducir y, en caso de intentarlo, lo ms probable es
que sean reproducidos de manera errnea ya que slo el titular de la firma tiene la
capacidad de reproducirlos de manera espontnea y con las mismas caractersticas.
-
39
La particularidad ms importante de los elementos fundamentales es que son
numerosos y aparecen todos casi en el mismo momento. Por ejemplo, al firmar, el
lapicero se desplaza sobre el papel y la firma aparece, a simple vista se ve el
lapicero recorriendo el papel, lo que no se ve es la cantidad de presin que imprime
la mano sobre el lapicero o bien, los saltos en el aire del lapicero que generan trazos
separados.
Los elementos fundamentales se dividen en visibles e invisibles. Los elementos
visibles son aquellos que de manera relativamente sencilla, pueden ser observados a
partir de los trazos que quedan en el papel como son la proporcin, los enlaces, los
desenvolvimientos (la direccin de los diferentes trazos que forman la firma), la
velocidad y la presin.
Cada uno de estos elementos, aporta informacin valiosa a la hora de determinar la
autenticidad de una firma, por ejemplo, la velocidad rpida nos informa que su autor
realiza la firma sin la participacin de su estado consciente y hace presumir su
autenticad. La presin se encuentra inversamente relacionada con la velocidad, la
presin intercalada en el desarrollo de los diferentes trazos es caracterstica de las
firmas autnticas. Una firma con una presin constante a lo largo de todos sus trazos
indica que es muy probable que la firma sea falsa.
Los elementos invisibles son difciles de ver y se clasifican en puntos de referencia
intrnsecos y extrnsecos.
Los puntos de referencia extrnsecos son un conjunto de referencias exteriores a la
firma en s, es decir, no forman parte de la firma y sin embargo, influencian la manera
en la que la firma es llevada a cabo y se dividen en materiales y grficos; los
materiales son generalmente percibidos a travs del tacto como por ejemplo la silla
donde se debe sentar el firmante, la mesa o el papel donde se debe firmar. Ejemplos
de puntos de referencia grficos son el formato del formulario, rectngulos
destinados para la firma o inclusive el color del papel.
-
40
Los puntos de referencia intrnsecos son puntos de referencia que se les toma como
indicadores fiables de la autenticidad o falsedad de la firma y que se encuentran
escondidos dentro de los desenvolvimientos o trazos de una firma como son la
configuracin y ubicacin de los puntos de ataque, la forma y direccin de los rasgos
finales de cada trazo y caractersticas de los signos ortogrficos de puntuacin.
Para los fines de este proyecto, nos limitaremos a exponer la importancia de los
puntos de ataque y de los rasgos finales de cada trazo; segn sea el dinamismo del
movimiento no graficado inicial, ser la configuracin que adopte el primer contacto
del lapicero con el papel el cual es conocido como punto de ataque. De igual manera,
cada vez que termina un movimiento graficado queda una marca del estilo de la
finalizacin. La forma que adquieren los rasgos finales o de remate, dependen del
tipo de movimiento no graficado final. Lo anterior quiere decir que la manera en la
que el firmante mueve su brazo y mano en el aire antes y despus de hacer contacto
con el papel para realizar un trazo determina la forma inicial y final del mismo.
Ejemplos de puntos de ataque son los rectos, los cuales se denominan as porque su
inicio es un segmento de recta como se muestra en la figura 2.18 :
FIGURA 2.18. PUNTO DE ATAQUE RECTO
Los puntos de ataque redondeados son aquellos en los cuales el movimiento inicial
no graficado es lento. El detenimiento del lapicero en el papel no es tan prolongado y
la presin no es fuerte. La figura 2.19 muestra un ejemplo de punto de ataque
redondeado:
-
41
FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO
Otro ejemplo de punto de ataque son los imperceptibles en los cuales, el movimiento
no graficado inicial es muy veloz y la punta del lapicero toca el papel muy
suavemente haciendo difcil determinar dnde termina el movimiento no graficado
inicial y dnde comienza el movimiento graficado. Este inicio es uno de los ms
difciles de imitar por que el falsificador tendra que imitar el movimiento no graficado
y el grado de velocidad y presin del movimiento graficado. La figura 2.20 muestra un
ejemplo de punto de ataque imperceptible:
FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE
Aunque la escritura y la forma de la firma presentan caractersticas nicas y propias
de cada persona, estas pueden cambiar tanto voluntaria como involuntariamente
[Baez06]. Para cambios voluntarios, basta el deseo de la persona para modificar el
diseo de la firma o de su escritura tanto parcial como totalmente mientras que para
cambios involuntarios puede haber diversas causas como las naturales,
determinadas por el proceso vital de la persona como decadencia fsica por ejemplo,
o bien, causas afectivas como la depresin, emociones o pasiones.
-
42
Segn [Baez06], la grafoscopa cuenta con diversas tcnicas para llevar a cabo la
verificacin de una firma:
Mtodo morfolgico de comparacin.- Se trata de realizar cotejos o
comparaciones entre las letras.
Mtodo grafolgico.- La grafologa permite identificar en la escritura gestos
idiosincrsicos personales llegando con ello al estudio psicolgico del hombre,
es decir, consiste en trazar un retrato grafolgico para determinar el origen de
una firma. Lo anterior quiere decir que a partir del anlisis grafolgico de una
firma, se puede identificar las caractersticas psicolgicas de una persona
como lo son su temperamento o sus cualidades intelectuales y artsticas,
validando con base en ellas, la autenticidad de una firma o bien, la
identificacin de su autor [Baez06].
Mtodo grafomtrico.- Consiste en la medicin de diferentes caractersticas de
los trazos como ngulos y espesores utilizando herramientas como reglillas
micrmetros.
-
43
2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE
FIRMAS
Los sistemas de reconocimiento o verificacin de firmas, en su forma general,
presentan la estructura bsica de los sistemas de reconocimiento de patrones
mostrada en la figura 2.21, esto es, un sensor o medio de entrada, un proceso de
extraccin de caractersticas y un clasificador [Azzopardi06] [Blumenstein07]
[Drouhard96] [Leclerc94] [Papamarkos01] [Plamondon94].
FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P.
Actualmente los sistemas de reconocimiento de firmas tienen dos vertientes bien
conocidas; la primera basada en la imagen esttica de la firma (el resultado de
firmar) y la segunda en el proceso dinmico involucrado (el proceso de firmar en s
mismo). A estos mtodos se les conoce como sistemas off-line o estticos y on-line o
dinmicos respectivamente [Leclerc94].
El enfoque esttico es considerado ms difcil debido a que los mtodos
desarrollados con un enfoque dinmico han obtenido mejores resultados en trminos
de errores de tipo I y tipo II. Los errores de tipo I, tambin conocidos por sus siglas
en ingls FRR (False Rejection Rate), se refieren al porcentaje de firmas vlidas que
son rechazadas por el sistema. Los errores de tipo II, tambin conocidos como FAR
(False Acceptance Rate), se refieren al porcentaje de firmas falsas aceptadas por el
sistema [Leclerc94].
-
44
El objetivo principal de estos sistemas es diferenciar las firmas originales de las
falsificadas. Aunque son ya al menos dos dcadas de trabajo continuo en esta rea,
no existe en realidad un estndar que defina y clasifique los tipos de falsificaciones
pero, en general, de acuerdo al nivel de habilidad en la falsificacin bien, de
acuerdo a la semejanza de las firmas, se aceptan las siguientes categoras [Babu06]:
Falsificacin Aleatoria: Puede ser la firma genuina de cualquier persona, la
intencin del firmante no es falsificar otra firma, simplemente, la firma contra la
cual se compara no es la suya.
Falsificacin Simple o Falsificacin Casual: Este tipo de falsificacin es
producida sabiendo slo el nombre de la persona cuya firma se quiere
falsificar.
Falsificaciones especializadas.- stas son las firmas producidas por
falsificadores profesionales con experiencia.
Los artculos publicados sobre el tema mencionados a lo largo de este trabajo,
expresan sus resultados en trminos de los errores tipo I y II sobre alguno o algunos
de los diferentes tipos de falsificaciones mencionados anteriormente, siendo los
peores resultados siempre aquellos relacionados con Falsificaciones especializadas
[Plamondon94]. Cabe destacar que el presente proyecto se enfoca en distinguir
firmas autnticas de falsificaciones especializadas dejando a un lado las
falsificaciones simples y aleatorias.
Los sistemas dinmicos, utilizan como medio de entrada tabletas digitales para
capturar la informacin del proceso de la firma, por lo tanto, requieren de la presencia
del firmante a diferencia de los sistemas estticos, los cuales tienen como entrada
una imagen digital.
En los sistemas dinmicos, se tienen las siguientes fases: adquisicin, pre-
procesamiento, comparacin y evaluacin. El proceso de adquisicin es muy
importante porque la calidad de las seales es crtica para la optimizacin del
-
45
proceso de comparacin, del mismo modo, si la seal es de buena calidad, el tiempo
asociado para el pre-procesamiento ser minimizado ya que en los sistemas
dinmicos, el pre-procesamiento por lo general est destinado a corregir fallas en el
proceso de adquisicin. El conjunto de seales que pueden ser procesadas en los
sistemas dinmicos es bastante grande: las coordenadas x y y del lapicero como
funcin del tiempo, velocidad, aceleracin y presin entre otros y, por lo mismo,
muchos investigadores se enfocan exclusivamente en este proceso y proponen
equipos electrnicos especializados para el proceso de adquisicin.
Como ya se mencion, los sistemas estticos, trabajan en base a imgenes
digitalizadas de firmas. Su mayor ventaja es que requieren equipo ms econmico y
no necesitan de la presencia del firmante. Su gran desventaja es que no tienen
acceso a la informacin dinmica mencionada anteriormente, sin embargo, en los
ltimos aos se han hecho intentos de obtener caractersticas dinmicas a partir de
la imagen esttica [Blumenstein09] [Lalican00].
2.7.1 Caractersticas
Existen diversas caractersticas utilizadas segn el enfoque empleado (on-line y off-
line). Algunas de ellas pueden aplicar a ambos. Se pueden categorizar en estticas y
dinmicas y a su vez en globales y locales.
Las estticas son las que se pueden extraer de una imagen mientras que las
dinmicas son las que se pueden extraer durante el proceso de firmar y tienen que
ver principalmente con la velocidad, el tiempo y la presin ejercida al momento de
firmar [Plamondon94].
Por globales se clasifica a las caractersticas que toman informacin de la firma como
un todo, por ejemplo, la *altura de la firma en las estticas o el tiempo total del
proceso de firmado en las dinmicas mientras que las locales, se enfocan en un
punto dado de la firma, ya sea en la posicin (las estticas) o en el tiempo
(dinmicas) [Leclerc94].
-
46
Las caractersticas existentes contempladas para ser usadas en este proyecto se
listan a continuacin junto con una breve descripcin y se da una descripcin ms
profunda y detalla en secciones subsecuentes:
Relacin Altura-Anchura.- Es la proporcin entre la altura y la anchura de la
firma.
Entropa.- Es una medida de la variacin entre los niveles de grises de la
imagen.
Mxima.- Relacin entre la distancia de dos trazos principales verticales u
horizontales con respecto a la altura y anchura.
Energa.- Algoritmo propuesto por [Blumenstein09] para cuantificar la energa
requerida para realizar los diferentes trazos de la firma a partir de una imagen
esttica.
rea de la firma.- Nmero de pixeles dentro de la imagen que pertenecen a la
firma.
Nmero de Puntos Borde.- Nmero de pixeles pertenecientes a la firma que
representan el inicio o fin de un trazo.
Nmero de Puntos de Interseccin.- Nmero de pixeles que representan la
unin de dos o ms trazos.
De igual forma, se propone la siguiente caracterstica no reportada en la bibliografa
consultada hasta el momento:
Wavelets de Puntos Borde.- Con esta caracterstica se pretende representar
los puntos de ataque y de remate descritos en la seccin 2.6.
Relacin Altura-Anchura
Es una caracterstica global que considera la proporcin entre la altura y anchura de
la firma [Karsligil10]. Se obtiene dividiendo la altura entre la anchura. Mientras que
entre firma y firma la altura y anchura pueden variar, la relacin entre estas dos se
mantiene proporcional. En las firmas digitalizadas, bsicamente se mide la relacin
-
47
entre la anchura y altura en pixeles de la firma. Se inspira la facultad homottica que
tiene el ser humano de cambiar el tamao de la firma sin alterar de manera
significativa dicha proporcin [Orellana75], este concepto se ilustra en la figura 2.22:
FIGURA 2.22. FACULTAD HOMOTETICA
A continuacin se muestra de manera grfica cmo se obtienen los valores de la
altura y anchura de una firma en una imagen digital:
FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA DIGITAL
Entropa
Corresponde a una medida de la variacin entre niveles de grises de la firma. El
trmino Entropa proviene de la teora de la informacin de Shannon. En el
procesamiento de imgenes digitales, se utiliza para medir la aleatoriedad o
-
48
incertidumbre en los niveles de grises. La frmula de la entropa est dada por la
siguiente ecuacin:
=
=
k
i ii p
pxH1
2
1log)( (16)
El trmino ip es la probabilidad de que ocurra el evento i , en nuestro caso, de que
ocurra el nivel de gris i , por lo tanto,
ip
1
es conocido como "factor sorpresa" o
simplemente como "sorpresa", es decir, a mayor probabilidad de un evento o nivel de
gris, menor sorpresa y viceversa. Al resultado de la ecuacin anterior, se le conoce
como bits de incertidumbre.
Ejemplo 1:
Suponiendo que tuviramos una imagen donde fuera posible encontrar 4 diferentes
niveles de grises A,B,C y D y todos ellos tomaran el valor de B, tendramos la
siguiente distribucin de probabilidad:
TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA
Nivel de Gris A B C D
Probabilidad 0 1 0 0
Aplicando la frmula de la Entropa tendramos que:
0)0
1(