MODELO PARA LA COMPARACI“N DE DATOS...

download MODELO PARA LA COMPARACI“N DE DATOS oa.upm.es/5973/2/TESIS_MASTER_JUAN_ALFONSO_LARA_TORRALB  ID3,

If you can't read please download the document

  • date post

    07-Oct-2018
  • Category

    Documents

  • view

    213
  • download

    0

Embed Size (px)

Transcript of MODELO PARA LA COMPARACI“N DE DATOS...

  • FACULTAD DE INFORMTICA

    UNIVERSIDAD POLITCNICA DE MADRID

    TESIS DE MSTER

    MSTER DE INVESTIGACIN EN TECNOLOGAS PARA EL

    DESARROLLO DE SISTEMAS SOFTWARE COMPLEJOS

    MODELO PARA LA COMPARACIN DE DATOS

    POSTUROGRFICOS ESTRUCTURALMENTE

    COMPLEJOS

    AUTOR: JUAN ALFONSO LARA TORRALBO

    TUTORES: AURORA PREZ PREZ

    JUAN PEDRO CARAA-VALENTE HERNNDEZ

    FEBRERO, 2008

  • A mis padres, por ser los mejores

    y a Dios, por drmelos.

  • AGRADECIMIENTOS

    En primer lugar, me gustara dar las gracias a mis padres, ya que gracias a su enorme esfuerzo

    y sacrificio se ha podido lograr todo esto. Sin ellos hubiera sido imposible llegar hasta aqu.

    Muchas gracias por renunciar a tantas cosas.

    Tambin me gustara agradecerle todo lo que ha hecho, a una persona muy especial para m,

    mi abuela Juana. Muchas gracias por mimarme tanto y por cocinar tan bien. Un recuerdo para

    mis abuelos Alfonso, Juan y Dolores, que ya se fueron. Tampoco puedo olvidarme de mis tos

    y de mis primos que me han apoyado enormemente. Gracias.

    A mis amigos les agradezco haber estado ah animndome y ayudndome en todo lo posible.

    Al Departamento de Lenguajes y Sistemas Informticos e Ingeniera del Software, por darme

    la oportunidad de desarrollar esta Tesis. En especial, gracias a Aurora Prez y Juan Pedro

    Caraa, mis tutores, por su paciencia y comprensin. Me gustara tambin agradecer su apoyo

    a mis compaeros del laboratorio, en especial, a Guillermo.

    Un recuerdo especial para los que ya no estn.

  • Modelo para la comparacin de datos posturogrficos estructuralmente complejos

    ndice

    i

    NDICE

    11 IINNTTRROODDUUCCCCIINN .................................................................................................................................................................................................................................. 11

    1.1 MARCO DE LA TESIS..........................................................................................................4

    1.2 OBJETIVO DE LA TESIS......................................................................................................7

    1.3 BENEFICIOS ESPERADOS ...................................................................................................7

    1.4 ORGANIZACIN DE LA TESIS ............................................................................................8

    22 EESSTTAADDOO DDEELL AARRTTEE .................................................................................................................................................................................................................. 1111

    2.1 INFORMTICA Y MEDICINA ............................................................................................13

    2.2 POSTUROGRAFA .............................................................................................................16

    2.2.1 INTRODUCCIN........................................................................................................16

    2.2.2 ANTECEDENTES HISTRICOS ...................................................................................17

    2.2.3 TCNICAS DE POSTUROGRAFA ACTUALES ...............................................................19

    2.2.4 EJEMPLOS DE APLICACIN DE LA POSTUROGRAFA ..................................................21

    2.3 DESCUBRIMIENTO DE CONOCIMIENTO EN BASES DE DATOS Y DATA MINING .............22

    2.3.1 CLASIFICACIN .......................................................................................................22

    2.3.1.1. CART ..................................................................................................... 22

    2.3.1.2. ID3, C4.5 y C5.0..................................................................................... 24

    2.3.1.3. Clasificacin Bayesiana (Nave Bayes).................................................. 27

    2.3.1.4. M5........................................................................................................... 29

    2.3.1.5. Redes Neuronales ................................................................................... 30

    2.3.1.6. Clasificacin de objetos usando series temporales................................. 32

    2.3.2 CLUSTERING ............................................................................................................33

    2.3.2.1. K-medias................................................................................................. 33

    2.3.2.2. Mapas Autoorganizados. Kohonen. ....................................................... 34

    2.3.2.3. EM .......................................................................................................... 36

    2.3.2.4. Clustering jerrquico ascendente............................................................ 36

    2.3.3 REGRESIN ..............................................................................................................38

  • Modelo para la comparacin de datos posturogrficos estructuralmente complejos

    ndice

    ii

    2.3.3.1. Regresin lineal.......................................................................................38

    2.3.3.2. Regresin no lineal.................................................................................38

    2.3.4 REGLAS DE ASOCIACIN ......................................................................................... 39

    2.3.4.1. Apriori .....................................................................................................40

    2.3.4.2. Apriori TID .............................................................................................41

    2.3.4.3. AprioriHybrid..........................................................................................42

    2.3.4.4. AIS ..........................................................................................................42

    2.3.4.5. SETM......................................................................................................43

    2.3.5 DATA MINING SOBRE SERIES TEMPORALES .............................................................. 43

    2.3.5.1. Tcnica basada en la Transformada de Fourier ......................................46

    2.3.5.2. Tcnicas basadas en la Transformada de Wavelet..................................47

    2.3.5.3. Comparacin basada en Landmarks .......................................................48

    2.3.5.4. Comparacin de series temporales usando las transformaciones Moving

    Average y Time Warping ........................................................................49

    2.3.5.5. Bsqueda de patrones basada en Time Warping .....................................50

    2.3.5.6. Comparacin de Secuencias usando rectngulos MBR..........................50

    2.3.5.7. Bsqueda de subsecuencias usando la distancia Time Warping .............51

    2.3.5.8. Identificacin de subsecuencias distintivas.............................................52

    2.3.5.9. Comparacin de series temporales multiatributo mediante

    desplazamiento (shift) y escalado (scale)................................................54

    2.3.5.10. Comparacin de series temporales multidimensionales con MBR.........55

    2.3.5.11. Descubrimiento de Patrones similares en series temporales...................56

    33 PPLLAANNTTEEAAMMIIEENNTTOO DDEELL PPRROOBBLLEEMMAA.................................................................................................................................................... 5599

    3.1 POSTUROGRAFA............................................................................................................. 61

    3.2 MODELIZACIN DE DATOS ............................................................................................. 74

    3.3 COMPARACIN DE DATOS............................................................................................... 76

    44 SSOOLLUUCCIINN PPRROOPPUUEESSTTAA ................................................................................................................................................................................................ 8811

    4.1 MODELO DE DATOS ........................................................................................................ 83

  • Modelo para la comparacin de datos posturogrficos estructuralmente complejos

    ndice

    iii

    4.2 BASE DE DATOS .............................................................................................................110

    4.2.1 INTRODUCCIN......................................................................................................110

    4.2.2 BASE DE DATOS PARA EL CASO DE LOS DATOS DE POSTUROGRAFA .......................111

    4.3 ARQUITECTURA DEL SISTEMA ......................................................................................116

    4.4 COMPARACIN DE PRUEBAS .........................................................................................118

    4.4.1 CLCULO DE SIMILARIDAD ENTRE ATRIBUTOS .....................................................122

    4.4.2 CLUSTERING DE ZONAS DE INTERS........................................................................123

    4.4.3 EXTRACCIN DE ZONAS COMUNES........................................................................124

    4.4.4 CLCULO DE SIMILARIDAD ENTRE SERIES TEMPORALES........................................125

    4.5 IMPLEMENTACIN..........................................................