An alisis de Correspondencias Simple.gallardo/pdf/acs13.pdf · Supongamos una Tabla Estad stica del...

24
Cap´ ıtulo 3 An´ alisis de Correspondencias Simple. Supongamos una Tabla Estad´ ıstica del tipo Tabla de Contingencia. En este tipo de tabla se miden frecuencias (en principio, hoy d´ ıa se consideran tambi´ en tablas de contingencia m´as generales en este sentido), es decir, n´ umero de individuos k ij pertenecientes a la clase i de la caracter´ ıstica I y a la clase j de la caracter´ ıstica J . Tanto I como J clasifican o particionan una misma poblaci´on. La tabla bruta inicial, pues, es del tipo (k ij ). Como ocurre en general con cualquier tipo de tabla, (de contingencia, de rangos, de medidas, booleanas, etc), la Tabla bruta inicial debe ser transformada adecuadamente, teniendo en cuenta su naturaleza y carac- ter´ ısticas, de manera que se transforme en otra sobre la que las nociones y m´ etodos generales del An´ alisis Factorial General puedan ser aplicados y sean ´ utiles para analizar la tabla respectiva. En una tabla de contingencia, por otra parte, no tiene sentido distinguir entre variables e individuos. Aqu´ ı ambos juegan un papel sim´ etrico. 3.1. Transformaci´ on de una Tabla de Contingencia Bruta. Dada un tabla de contingencia, con elementos k ij , podemos escribirla as´ ı: Modalidad I Modalidad J 1 ··· j ··· p 1 . . . . . . . . . i ··· ··· k ij ··· ··· . . . . . . n . . . Consideramos la tabla transformada siguiente, llamada a veces tabla o matriz de correspondencias: Modalidad I Modalidad J 1 ··· j ··· p Total 1 . . . . . . . . . i ··· ··· k ij K ··· ··· f i· . . . . . . n . . . Total f ·j 1 1

Transcript of An alisis de Correspondencias Simple.gallardo/pdf/acs13.pdf · Supongamos una Tabla Estad stica del...

Capıtulo 3

Analisis de Correspondencias Simple.

Supongamos una Tabla Estadıstica del tipo Tabla de Contingencia. En este tipo de tabla se midenfrecuencias (en principio, hoy dıa se consideran tambien tablas de contingencia mas generales en este sentido),es decir, numero de individuos kij pertenecientes a la clase i de la caracterıstica I y a la clase j de lacaracterıstica J . Tanto I como J clasifican o particionan una misma poblacion. La tabla bruta inicial, pues,es del tipo (kij).

Como ocurre en general con cualquier tipo de tabla, (de contingencia, de rangos, de medidas, booleanas,etc), la Tabla bruta inicial debe ser transformada adecuadamente, teniendo en cuenta su naturaleza y carac-terısticas, de manera que se transforme en otra sobre la que las nociones y metodos generales del AnalisisFactorial General puedan ser aplicados y sean utiles para analizar la tabla respectiva.

En una tabla de contingencia, por otra parte, no tiene sentido distinguir entre variables e individuos.Aquı ambos juegan un papel simetrico.

3.1. Transformacion de una Tabla de Contingencia Bruta.

Dada un tabla de contingencia, con elementos kij , podemos escribirla ası:

Modalidad I

Modalidad J1 · · · j · · · p

1...

......

i · · · · · · kij · · · · · ·...

...

n...

Consideramos la tabla transformada siguiente, llamada a veces tabla o matriz de correspondencias:

Modalidad I

Modalidad J1 · · · j · · · p Total

1...

......

i · · · · · · kijK

· · · · · · fi·...

...

n...

Total f·j 1

1

2 Analisis de Correspondencias Simple.

K =∑ij

kij (3.1)

fij =kijK

(3.2)

fi· =

p∑j=1

fij =

p∑j=1

kijK

(3.3)

f·j =n∑

i=1

fij =n∑

i=1

kijK

(3.4)

Nota: La razon, en principio, de introducir la nueva tabla transformada es la siguiente: Supongamos unatabla de contingencia bruta, inicial, en la que, por ejemplo, un punto–fila sea:

(783, 1114, 387, 4052, 497, 1464, 525, 387)

que constituye el reparto de 9209 individuos en 8 categorıas, y supongamos que, respecto de esas mismasocho categorıas, se reparten 583 individuos, obteniendose otro punto-fila:

(65, 43, 21, 294, 79, 57, 18, 6)

Si calcularamos la distancia euclıdea entre estos dos puntos-fila, su valor no harıa mas que confirmar lagran diferencia de efectivos que hay en los puntos-fila considerados; pero no medirıa la distancia entre los dostipos de comportamiento que se reflejan en dichas filas. Habrıa, pues, que hacer una transformacion sobrelos datos brutos iniciales, kij , de manera que se eliminara el efecto de los efectivos totales de cada fila. Y lomismo cabrıa decir de las columnas (puntos-columna). No olvidemos que en una tabla de contingencia, filasy columnas juegan un papel simetrico. Aquı no hay columnas-variables y filas-individuos, como por ejemploen las Tablas de Medidas tratadas por Analisis de Componentes Principales.

3.2. Nubes de puntos en Rp y en Rn.

En primer lugar, insistamos en que aunque aquı no tiene sentido distinguir entre filas y columnas desdeel punto de vista de la naturaleza de la tabla de contingencia, nos vamos a colocar en la situacion generalde una matriz de datos, n× p, supuesto entonces que hemos fijado las filas (n) y las columnas (p).

Con objeto de eliminar, como antes decıamos, el efecto de los efectivos totales, definimos los Perfiles-filay Perfiles-columna. Estos perfiles se definen ası:

Perfiles-fila:

{(fijfi·

); j = 1, . . . , p

}i

afectados de masas fi·. Hay, pues, n perfiles-filas, cada uno afectado

de la masa fi· respectiva (i = 1, . . . , n).

Perfiles-columna:

{(fijf·j

); i = 1, . . . , n

}j

, donde la masa de cada perfil es f·j .

Tenemos pues las siguientes Tablas Transformadas de perfiles:

1 · · · j · · · p Masas

1f11f1·

· · · f1jf1·

· · · f1pf1·

f1·

......

ifi1fi·

· · · fijfi·

· · · fipfi·

fi·

......

nfn1fn·

· · · fnjfn·

· · · fnpfn·

fn·

3.3 Distancias en Rp y Rn. 3

Tabla de Perfiles-Fila

1 · · · j · · · p

1f11f·1

· · · f1jf·j

· · · f1pf·p

......

ifi1f·1

· · · fijf·j

· · · fipf·p

......

nfn1f·1

· · · fnjf·j

· · · fnpf·p

Masas f·1 · · · f·j · · · f·p

Tabla de Perfiles-ColumnaAsı pues, existen dos nubes de puntos: una constituida por n puntos en Rp de coordenadas:(

fi1fi·

;fi2fi·

; · · · , fijfi·

; · · · ; fipfi·

); i = 1, . . . , n (3.5)

y la otra constituida por p puntos en Rn de coordenadas(f1jf·j

;f2jf·j

; · · · , fijf·j

; · · · ; fnjf·j

); j = 1, . . . , p (3.6)

cuyos puntos estan afectados de masas fi· y f·j respectivamente.Por otra parte, los n puntos-fila anteriores (o perfiles-fila) estan situados en realidad en un subespacio

p− 1 dimensional de Rp, ya que existe entre las coordenadas de cualquiera de ellos la relacion baricentrica:

p∑j=1

(fijfi·

)= 1 ; i = 1, . . . , n

Lo mismo cabe decir de los p puntos–columna (perfiles–columna)

n∑i=1

(fijf·j

)= 1 ; j = 1, . . . , p

de modo que, analogamente, estos p puntos en Rn, lo estan en un subespacio (n− 1) dimensional de Rn.

3.3. Distancias en Rp y Rn.

Cuando en AFG considerabamos la distancia entre puntos-fila o entre puntos-columna, se utilizaba ladistancia euclıdea habitual para medir la distancia entre puntos de Rp o de Rn respectivamente.

Como ahora, en ACS, consideramos los perfiles-fila y perfiles-columna, que siguen siendo puntos de Rp

y Rn respectivamente, pero que estan afectados de masas, la forma de medir distancias entre ellos ha demodificarse. Ası, para medir la distancia entre dos perfiles-fila, correspondientes a los individuos i e i

′, se

puede utilizar, por ejemplo, la distancia χ2 definida

d2(i, i′) =

p∑j=1

(fijfi·−

fi′ jfi′ ·

)21

f·j(3.7)

(distancia ponderada).Y en el caso de la distancia entre perfiles-columna, j y j

′:

d2(j, j′) =

n∑i=1

(fijf·j−

fij′

f·j′

)21

fi·(3.8)

4 Analisis de Correspondencias Simple.

Este tipo de distancia χ2, no es, naturalmente, la unica que cabe considerar. Tradicionalmente se vieneconsiderando como habitual en el Analisis de Correspondencias clasico y, como es sabido, entre otras ventajas,este tipo de distancia cumple lo que ya Bencekri denomino Principio de Equivalencia Distribucional,que desde luego tambien verifican otras distancias. En realidad es una cuestion de invarianza lo que implicadicho Principio: Si dos puntos-fila se confunden en uno solo, en Rp y se consideran englobados en un solopunto con masa la suma de las masas de ambos, entonces son invariantes las distancias entre los demas enRp y en Rn. (Y lo mismo si se confunden puntos en Rn)

Esta invarianza que hace cumplirse el citado principio, tiene una profunda trascendencia en el Analisis deCorrespondencias de una tabla de contingencia. En efecto, cuando se establecen las clases de las caracterısti-cas I y J que definen la Tabla, hay un grado de arbitrariedad mas o menos grande, de modo que podrıan enun principio definirse clases en I o/y en J muy proximas entre sı. Bien podrıa ocurrir entonces, que clasesdefinidas en un principio, se refundieran (o agregraran) en una sola por otros diversos motivos. En estoscasos, es claro que la distancia que utilizasemos deberıa ser lo menos sensible ante esas refundiciones declases, en el sentido de que no se alterasen las distancias entre puntos ya calculadas y que son entre puntosa los que no afectan en principio esas refundiciones. La distancia χ2 dada por (3.7) y (3.8) cumple estascualidades.

Esta distancia χ2 es la natural considerando el espacio de puntos de los perfiles fila (o el de las columnas)

como un espacio euclıdeo ponderado con metrica definida por la matriz D−1c = diag

(1

f·j

), estando los

puntos del correspondiente espacio afectados por las masas (ponderaciones) asociadas a cada punto, antesindicadas.

3.3.1. Sobre el Principio de equivalencia distribucional en Analisis de Corres-pondencias.

En el desarrollo del ACS que hemos realizado, la distancia adoptada entre puntos-fila o puntos-columna,en Rp y en Rn respectivamente, dotados de masas, habida cuenta del manejo a traves de los respectivosperfiles que de ellos hacemos, viene dada por la metrica χ2 en Rp y Rn respectivamente (expresiones (3.7) y(3.8) del parrafo 3.3):

d2(i, i′) =

p∑j=1

(fijfi·−

fi′ jfi′ ·

)21

f·j

d2(j, j′) =

n∑i=1

(fijf·j−

fij′

f·j′

)21

fi·

(3.9)

En un lenguaje propio de la teorıa de Espacios Euclıdeos Ponderados, estas distancias al cuadrado no sonmas que, obviamente, las distancias al cuadrado entre puntos de los espacios euclıdeos Rp y Rn ponderados,respectivamente, dadas por:

d2(i, i′

) = (i− i′

)′D−1

Rp (i− i′

) ; DRp = diag (f·j)

d2(j, j′

) = (j − j′

)′D−1

Rn (j − j′

) ; DRn = diag (fi·)

Aquı i y i′

son puntos-vectores de Rp y j y j′

de Rn y D−1Rp y D−1

Rn definen las metricas en Rp y Rn

respectivamente.En el parrafo 3.3 anterior ya hemos comentado el llamado Principio de Equivalencia Distribucional y su

trascendencia en el ACS. Vamos a comprobar ahora que se verifica con las distancias de tipo (3.9).Supongamos que los puntos-fila i e i

′estan superpuestos (se confunden) en Rp. Entonces ello quiere decir

que:

fijfi·

=fi′ jfi′ ·

j = 1, . . . , p

3.3 Distancias en Rp y Rn. 5

puesto que estar superpuestos implica que tienen iguales perfiles en Rp. Por tanto, sus perfiles deben coincidircon el de un punto-fila, i∗, con un perfil superposicion de ambos, y tal que

fijfi·

=fi′ jfi′ ·

=fi∗jfi∗·

(3.10)

Obviamente, si entonces consideramos un punto-fila i∗, con masa la suma de las masas, fi· + fi′ · = fi∗·de los anteriores, ello equivale a considerar que i∗ es la suma de las dos filas de aquellos. En efecto, de (3.10)se deduce que:

fij + fi′ jfi· + fi′ ·

=fi∗jfi∗·

de modo que al ser los denominadores iguales (fi·+fi′ · = fi∗·), los numeradores han de serlo fij+fi′ j = fi∗j ,

es decir, introducir el punto i con masa la suma de las sumas de i e i′, equivale a considerar el punto-suma

de las filas correspondiente a los puntos i e i′en la matriz de correspondencias fij . Ası pues, supongamos

que sustituimos dos filas (i e i′) de la matriz original (de las fij) por la fila unica que es la suma de ambas

filas, considerando que esta fila resultante tiene la masa dada por la suma de las masas correspondientes. Lapregunta es esta: ¿La superposicion realizada altera las distancias entre puntos-fila en Rp, o/y la distanciaentre puntos-columna en Rn?

Contestemos por partes:

1. Las distancias entre puntos-fila en Rp no se ven afectadas por la superposicion. En efecto, si se con-sideran dos puntos-fila cualesquiera, la distancia al cuadrado χ2 dada por (3.7), no se altera, ya que

las ponderaciones f·j =∑i

fij no cambian si, en efecto, dos filas se han sustituido por la fila suma de

ellas.

2. En cuanto a las distancias al cuadrado en Rn ocurre lo siguiente: d2(j, j′) contiene, entre otros su-

mandos, los correspondientes a las dos filas que se han confundido en una unica (las i e i′). Estos dos

sumandos son:

1

fi·

(fijf·j−

fij′

f·j′

)2

+1

fi′ ·

(fi′ jf·j−

fi′ j′

f·j′

)2

(3.11)

Pero esta expresion es igual a

fi·

(fij

fi·f·j−

fij′

fi·f·j′

)2

+ fi′ ·

(fi′ j

fi′ ·f·j−

fi′ j′

fi′ ·f·j′

)2

=

= fi·B + fi′ ·B = (fi· + fi′ ·)B = fi∗·B

Observese que las cantidades entre parentesis son en efecto iguales dado quefijfi·

=fi′ jfi′ ·

. Pero los dos

terminos en (3.11) se reemplazan, en la superposicion, por

1

fi∗·

(fi∗jf·j−

fi∗j′

f·j′

)2

Este ultimo es, por otra parte, igual a

fi∗·

(fi∗j

fi∗·f·j−

fi∗j′

fi∗·f·j′

)2

6 Analisis de Correspondencias Simple.

que es igual a fi∗B.

Luego, en el proceso de superposicion, al calcular d2(j, j′) lo que se hace es sustituir los dos sumandos

en (3.11) por su suma y los demas sumandos de d2(j, j′) no se ven afectados por la superposicion; luego

d2(j, j′) es invariante.

Finalmente, cabe decir que un resultado analogo se puede obtener cuando la superposicion se hace en lospuntos–columna, sustituyendo dos perfiles–columna cualesquiera por una nueva columna que tiene de masala suma de las masas respectivas. Esta superposicion de puntos–columna no afecta a la geometrıa de las filas,ni al resto de distancias χ2, entre los restantes puntos columna, en Rn.

3.4. Ajustes a la nube de perfiles en Rp y en Rn.

Una vez que hemos definido las nubes de puntos perfiles (la de perfiles-fila y la de perfiles-columna, enRp y Rn respectivamente) y recordando que hemos fijado las filas y las columnas (descritas por los ındicesi y j respectivamente) y que en una tabla de contingencia los papeles desempenados por los ındices i y j(es decir, filas y columnas de la tabla) son simetricos, vamos a proceder al ajuste a ambas nubes de loscorrespondientes subespacios optimos.

Para conseguirlo, cabrıa pensar en aplicar directamente, por ejemplo a la nube en Rp, el Analisis deComponentes Principales. Pero hay una dificultad inicial para aplicar el ACP a la situacion del ACS, y esque la distancia entre perfiles-fila (perfiles-columna) no es una suma de cuadrados, ya que en ACS, Rp y Rn

no son euclıdeos sino euclıdeos ponderados.Analizamos a continuacion la forma de realizar los ajustes factoriales, primero en el caso de Rp y luego

en el de Rn.

3.4.1. Ajuste, en Rp, de la nube de perfiles-fila.

Los n puntos, perfiles-fila en Rp, que constituyen la nube respectiva, son los de coordenadas{fijfi·

; j = 1, . . . , p

}; i = 1, . . . , n

Estos puntos pueden ser tratados a traves de las coordenadas siguientes:{fij

fi·√f·j

; j = 1, . . . , p

}; i = 1, . . . , n

Estas coordenadas transformadas, son tales que la distancia euclıdea al cuadrado entre dos de esos puntos:

d2(i, i′) =

p∑j=1

(fij

fi ·√

f·j−

fi′ j

fi′ ·√f·j

)2

(3.12)

coincide con la distancia χ2 entre ellos, es decir, con la distancia segun la metrica de la que anteriormentehemos dotado al espacio Rp de perfiles-fila.

Pero ¿que significa manejar los puntos (perfiles-fila) en Rp, mediante las coordenadas transformadas?

Evidentemente, pasar de las coordenadasfijfi·

a las transformadas,fij

fi·√f·j

, no es otra cosa que realizar un

cambio de escala en los ejes de Rp

(fij −→

fij√f·j

).

Por tanto la dificultad antes planteada de que el ACP no se podıa aplicar directamente al analisis dela nube de perfiles-fila en Rp, queda obviada si manejamos dichos perfiles a traves de las coordenadas

transformadas,fij

fi·√f·j

, y la distancia euclıdea entre puntos transformados equivale a la distancia χ2 entre

perfiles-fila.

3.4 Ajustes a la nube de perfiles en Rp y en Rn. 7

Por tanto, a continuacion, vamos a aplicar el ACP a la nube de puntos dados por las coordenadastransformadas en Rp, dotado de la distancia euclıdea habitual.

Al aplicar el ACP, como previamente hemos visto, es preciso a su vez transformar adecuadamente lasituacion, trasladando el origen del sistema de referencia al centro de gravedad de la respectiva1 nube depuntos en Rp.

¿Cual es el centro de gravedad de la nube de puntos? Como estan afectados de una masa fi·,

fij

fi·√f·j−→ 1

fi·

fij√f·j

dicho centro de gravedad viene dado por:{n∑

i=1

fi·

(fij

fi·√f·j

)=√f·j ; j = 1, . . . , p

}(3.13)

Por tanto, al trasladar el origen al centro de gravedad, las coordenadas de los puntos-perfiles fila, en Rp,pasan a ser {

fij

fi·√

f·j−√f·j ; j = 1, . . . , p

}; i = 1, . . . , n (3.14)

Siguiendo la metodologıa del Analisis Factorial General, al proyectar esta nube de puntos transformadosdada por (3.14) sobre el subespacio vectorial definido por el vector unitario u, cada punto i; i = 1, . . . , n,

proporcionara una proyeccion, Ψi, dada ası:

Ψi =

p∑j=1

(fij

fi·√f·j−√

f·j

)uj (3.15)

en donde uj es la j-esima componente del vector unitario, u, en Rp. Pero el punto i-esimo esta dotado deuna masa fi·. Por tanto, la inercia de la nube (3.14), es decir, la suma ponderada por fi· de todas lasproyecciones al cuadrado, valdra:

n∑i=1

fi·Ψ2i (3.16)

por tanto, el subespacio definido por aquel vector, u, tal que se verifica

Maxu

n∑i=1

fi·Ψ2i

define la primera componente principal segun la metodologıa del AFG. Continuando dicha metodologıa, sellega a la conclusion de que la matriz de covarianzas a diagonalizar para obtener todas las componentesprincipales, Tp×p, es la de termino general

tjj′ =

n∑i=1

fi·

(fij

fi·√f·j−√f·j

) fij′

fi·√f·j′−√f·j′

(3.17)

Comentario 3.4.1 Es facil ver que esta matriz T que resuelve el problema puede ponerse como T = X′X,

donde X es una matriz n× p, con termino general xij dado por

xij =fij − fi·f·j√

fi·f·j(3.18)

En efecto, segun (3.15), se tiene para la proyeccion del i-esimo punto sobre u,

1Recuerdese que, a su vez, el ACP se resolvio aplicando el AFG, por lo tanto, ajustando subespacios vectoriales, lo querequiere obviamente el centramiento en media.

8 Analisis de Correspondencias Simple.

Ψi =

p∑j=1

(fij

fi·√f·j−√f·j

)uj =

=

(fi1

fi·√f·1−√f·1, . . . ,

fij

fi·√

f·j−√f·j , . . . ,

fip

fi·√f·p−√f·p

)1×p

(u1, . . . , up)′

p×1

Podemos considerar globalmente las proyecciones de todos los puntos, en i = 1, . . . , n, englobandolas enla expresion matricial:

f11

f1·√f·1−√f·1 · · · f1j

f1·√f·j−√

f·j · · · f1p

f1·√f·p−√f·p

.... . .

.... . .

...fi1

fi·√f·1−√

f·1 · · · fij

fi·√f·j−√f·j · · · fip

fi·√f·p−√

f·p

.... . .

.... . .

...fn1

fn·√f·1−√f·1 · · · fnj

fn·√

f·j−√f·j · · · fnp

fn·√

f·p−√f·p

u1

...uj

...up

= Hu

en donde Hn×pup×1 es el vector columna n-dimensional que contiene las n proyecciones Ψi; i = 1, . . . , n, delos n puntos de la nube de puntos. Por lo tanto, si consideramos

(Hu)′(Hu)

obtenemos la suma de los cuadrados de todas las proyecciones Ψi. Para obtener, finalmente, la expresion(3.16), es decir, la suma ponderada de las proyecciones al cuadrado que constituye la Inercia de la nube depuntos, tendremos que efectuar la operacion

n∑i=1

fi·Ψ2i =

(√fi·Hu

)′ (√fi·Hu

)= (H∗u)

′(H∗u)

en donde la matriz H∗n×p tiene por elementos:

h∗ij =

(fij

fi·√

f·j−√f·j

)√fi· i = 1, . . . , n ; j = 1, . . . , p

Observese que

h∗ij =

(fij

fi·√f·j−√

f·j

)√fi· =

fij − fi·f·j

fi·√f·j

√fi· =

fij − fi·f·j√fi·f·j

con lo que queda demostrado (3.18) con H∗ = X.

Comentario 3.4.2 Por otra parte, probemos (3.17), expresion que denota el termino general tj,j′ de lamatriz T , cuyos autovalores resuelven el problema de Componentes Principales.

Es claro que la matriz X′X, en notacion del AFG, es la matriz que ha de resolver el problema, en

donde X es la matriz final de los datos, sobre la que se realiza la tecnica factorial, obtenida despues de lastransformaciones necesarias aplicadas a la matriz inicial de datos brutos.

En el caso del ACS, la matriz X sera la H∗, de tal manera que hemos de considerar (H∗)′(H∗) en virtud

de que la inercia esta afectada por las masas de los perfiles, fi·, todo ello segun la expresion (3.16).En efecto, el termino tj,j′ de la matriz Tp×p = (H∗)

′(H∗) viene dado por:

fila j-esima de (H∗)′× columna j

′-esima de H∗ =

3.4 Ajustes a la nube de perfiles en Rp y en Rn. 9

=

(f1j

f1·√f·j−√

f·j

)√f1·

f1j′

f1·√f·j′−√f·j′

√f1· + · · ·+

+

(fij

fi·√f·j−√f·j

)√fi·

fij′

fi·√f·j′−√f·j′

√fi· + · · ·+

+

(fnj

fn·√

f·j−√f·j

)√fn·

fnj′

fn·√f·j′−√f·j′

√fn·

Esta expresion del termino (j, j′) puede ponerse en la forma

n∑i=1

√fi·√fi·

(fij

fi·√

f·j−√f·j

) fij′

fi·√

f·j′−√

f·j′

= tjj′

que coincide con la expresion (3.17), como pretendıamos demostrar.

Conclusion final:Calculados por la teorıa general los autovalores λα de la matriz simetrica T dada por (3.17), la proyeccion

de un punto, i, sobre el eje factorial α-esimo, uα, vendra dada por:

Ψαi =

p∑j=1

(fij

fi·√f·j−√

f·j

)uαj (3.19)

en donde uα es el autovector de T asociado a λα, con α = 1, . . . , p.

3.4.2. Simplificacion en los calculos de las proyecciones Ψαi.

Hay, pues, que calcular los autovalores de la matriz T = (H∗)′(H∗) ≡ X

p×nXn×p. Pueden comprobarselos hechos siguientes:

1. El vector up =(√

f·1, . . . ,√

f·j , . . . ,√f·p)′

es un vector propio de T , con respecto al autovalor 0.

En efecto, esto quiere decir que (T − λI)u = 0 es cierto para

Tp×pup(p×1) = 0p×1

Es decir

T ·(√

f·1, . . . ,√

f·j , . . . ,√f·p

)′

= 0p×1

lo cual es facilmente comprobable (ver Observacion 3.4.4).

2. El hecho de que up =(√

f·j ; j = 1, . . . , p)sea autovalor de T conlleva consecuencias interesantes que

permiten simplificar los calculos para obtener las proyecciones de los puntos sobre los ejes factoriales.En efecto, notese en primer lugar que dado cualquiera otro de los autovectores uα, y denotando poruαj a su j-esima componente, se verifica:

p∑j=1

uαj

√f·j = 0 (3.20)

10 Analisis de Correspondencias Simple.

en virtud de la ortogonalidad entre autovectores. En segundo lugar, si consideramos la proyeccion delpunto i-esimo de la nube sobre el eje α, Ψαi, dada por (3.19), esta expresion se puede simplificar. Enefecto,

Ψαi =

p∑j=1

(fij

fi·√f·j−√f·j

)uαj =

p∑j=1

fij

fi·√f·j

uαj −p∑

j=1

√f·juαj

de donde

Ψαi =

p∑j=1

(fij

fi·√f·j

)uαj (3.21)

3. Por otra parte puede comprobarse lo siguiente: si uα es autovector de T , distinto del antes denotadoup, lo es tambien de T ∗ = X∗′

X∗, donde

X∗ = (x∗ij) x∗

ij =fij√fi·f·j

(3.22)

y respecto del mismo autovalor.

Ası pues, X∗ no es centrada en contraposicion con X que sı lo es. Pero es mas facil manejar X∗, detal forma que es mas simple realizar el Analisis de Correspondencias sobre T ∗ = X∗′

X∗ que sobreT = X

′X.

Observese que hay que tener en cuenta, no obstante, que ello es cierto para todos los autovectoresexcepto para el denotado up, que lo era de T respecto del autovalor 0. Este autovector up lo es tambiende la nueva matriz, T ∗, pero en cambio lo es respecto del autovalor unidad.

Comentario 3.4.3 Si usamos x∗ij =

fij√fi·f·j

en lugar de xij =fij − fi·f·j√

fi·f·jpodemos comprobar que T ∗ =

X∗′X∗ cumple respecto de los autovectores la propiedad dicha.

Primero veamos que forma tiene T ∗.

T ∗ =

f11√f1·f·1

· · · fi1√fi·f·1

· · · fn1√fn·f·1

.... . .

.... . .

...f1j√f1·f·j

· · · fij√fi·f·j

· · · fnj√fn·f·j

.... . .

.... . .

...f1p√f1·f·p

· · · fip√fi·f·p

· · · fnp√fn·f·p

×

×

f11√f1·f·1

· · ·f1j′√f1·f·j′

· · · f1p√f1·f·p

.... . .

.... . .

...fi1√fi·f·1

· · ·fij′√fi·f·j′

· · · fip√fi·f·p

.... . .

.... . .

...fn1√fn·f·1

· · ·fnj′√fn·f·j′

· · · fnp√fn·f·p

3.4 Ajustes a la nube de perfiles en Rp y en Rn. 11

luego el termino generico tjj′ de la matriz T ∗ = X∗′X∗ se expresa ası:

t∗jj′

=f1jf1j′

f1·√f·j√

f·j′+ · · ·+

fijfij′

fi·√f·j√

f·j′+ · · ·+

fnjfnj′

fn·√

f·j√f·j′

es decir

t∗jj′

=n∑

i=1

fijfij′

fi·√f·j√f·j′

Observese que tambien puede ser expresado ası:

t∗jj′

=

n∑i=1

fijfij′

f2i·√f·j√f·j′

fi· =

n∑i=1

fi·

(fij

fi·√f·j

) fij′

fi·√

f·j′

(3.23)

Comparando con la expresion (3.17) se ve que t∗jj′

es analogo a tjj′ , salvo que no esta centrado, es decir, no

esta restado el centro de gravedad dado por las coordenadas(√f·j ; j = 1, . . . , p

)Por tanto podemos decir que X∗ es una matriz no centrada, al contrario de X que sı lo es.En segundo lugar, veamos lo siguiente: Todos los autovectores vα de la matriz T , excepto up, lo son

tambien de T ∗ y respecto de los mismos autovalores. En cambio, up es autovector tambien de T ∗ pero enlugar de serlo respecto del autovalor nulo de T , lo es del autovalor unidad de T ∗.

En efecto, supongamos un autovector uα = up, de componentes uαj . Si vα es autovector de T respectodel autovalor λα y uα lo es de T ∗ respecto del mismo autovalor, entonces

Tuα = λαuα

T ∗uα = λαuα

Luego se trata de comprobar que Tvα = T ∗uα. Ahora bien, Tuα es un vector (p×1), cuya j-esima componentese obtendra multiplicando la j-esima fila de T por el vector uα, de componentes uαj′ , o sea:

p∑j′=1

tjj′uαj′

Analogamente, se llegarıa a

p∑j′=1

t∗jj′

uαj′

como expresion de la j-esima componente del vector (T ∗uα)Por tanto se trata de comprobar que

p∑j′=1

tjj′uαj′ =

p∑j′=1

t∗jj′

uαj′ (3.24)

En efecto, utilizando (3.17) y (3.23)

p∑j′=1

n∑

i=1

fi·

[fij

fi·√f·j−√f·j

] fij′

fi·√f·j′−√f·j′

uαj′ =

12 Analisis de Correspondencias Simple.

=

p∑j′=1

n∑

i=1

fi·

[fij

fi·√f·j

] fij′

fi·√f·j′

uαj′ −n∑

i=1

fi·fij

fi·√f·j

√f·j′uαj′−

−n∑

i=1

fi·√f·j

fij′

fi·√f·j′

uαj′ +n∑

i=1

fi·√f·j√

f·j′uαj′

y permutando las sumas, queda solo el primer termino del segundo, con lo que se prueba (3.24), puesto que,aplicando la expresion (3.20),

p∑j=1

uαj

√f·j = 0

se obtiene:

1.p∑

j′=1

{n∑

i=1

fi·fij

fi·√f·j

√f·j′

}uαj′ =

p∑j′=1

{n∑

i=1

fij√f·j

√f·j′

}uαj′ =

=n∑

i=1

fij√f·j

p∑j′=1

√f·j′uαj′

= 0

2.p∑

j′=1

n∑

i=1

fi·√f·j

fij′

fi·√f·j′

uαj′ =

p∑j′=1

n∑

i=1

√f·j

fij′√f·j′

uαj′ =

=

p∑j′=1

√f·j

√f·j′

f·j′

(n∑

i=1

fij′

)uαj′ =

p∑j′=1

√f·j√f·j′uαj′ =

=√f·j

p∑j′=1

√f·j′uαj′ = 0

3.p∑

j′=1

n∑i=1

{fi·√f·j√f·j′}uαj′ =

n∑i=1

fi·√f·j

p∑j′=1

√f·j′uαj′

= 0

Comentario 3.4.4 En cuanto al estudio del vector up =(√

f·j ; j = 1, . . . , p), se tiene lo siguiente:∑

j′

tjj′√f·j′ = elemento j-esimo del vector Tup = λpup = 0

En efecto:

p∑j′=1

n∑i=1

fi·

[fij

fi·√

f·j−√f·j

] fij′

fi·√

f·j′−√

f·j′

√f·j′ =

=

p∑j′=1

n∑i=1

fi·fij

fi·√f·j

fij′

fi·√

f·j′

√f·j′ −

n∑i=1

fi·fij

fi·√f·j

√f·j′√f·j′−

3.4 Ajustes a la nube de perfiles en Rp y en Rn. 13

−n∑

i=1

fi·√f·j

fij′

fi·√f·j′

√f·j′ +

n∑i=1

fi·√f·j√

f·j′√f·j′

=

=

p∑j′=1

[n∑

i=1

fijfij′

fi·√

f·j−

n∑i=1

fij√f·j

f·j′ −n∑

i=1

fij′√

f·j +n∑

i=1

fi·√f·jf·j′

]=

=

n∑i=1

fij

fi·√f·j

p∑j′=1

fij′

− n∑i=1

fij√f·j

p∑j′=1

f·j′

−−

n∑i=1

√f·j

p∑j′=1

fij′

+n∑

i=1

fi·√f·j

p∑j′=1

f·j′

=

=n∑

i=1

fij

fi·√f·j

fi· −n∑

i=1

fij√f·j−

n∑i=1

√f·jfi· +

n∑i=1

fi·√f·j = 0

Ası pues, el vector up es autovector de T , respecto del autovalor 0. En cambio, este autovector up, que loes tambien de T ∗, lo es respecto del autovalor 1 de dicha matriz T ∗.

Es decir, se verifica:

T ∗up = up ;

p∑j′=1

t∗jj′

upj′ = upj

O sea, en virtud de (3.23),

p∑j′=1

n∑i=1

fijfij′

fi·√

f·j√f·j′

√f·j′ =

√f·j

En efecto:

p∑j′=1

n∑i=1

fijfij′

fi·√

f·j√f·j′

√f·j′ =

p∑j′=1

n∑i=1

fijfij′

fi·√f·j

=

=

n∑i=1

fij

fi·√f·j

p∑j′=1

√fij′

=

n∑i=1

fij

fi·√f·j

fi· =

n∑i=1

fij√f·j

=

=1√f·j

n∑i=1

fij =f·j√f·j

=√f·j

3.4.3. Ajuste a la nube de puntos-columna, en Rn, constituida por los perfiles-columna.

Para construir este ajuste, con la metodologıa empleada en el ajuste en Rp, basta, en ACS, efectuar unapermutacion de los ındices generales i, j a todo lo realizado en el citado ajuste en Rp. Que esto es ciertoen ACS, es obvio: estamos aplicando tecnicas factoriales (AFG o ACP) a una matriz inicial de datos queconstituye, estadısticamente hablando, una Tabla de Contingencia, en la que el papel de filas y columnas esintercambiable, y, al contrario que ocurre en otras tablas, como por ejemplo las tablas de medidas (variables-observaciones) a las que se aplica ACP, los papeles de fila y columna son intercambiables.

Comentario 3.4.5 Adviertase que al enunciar que los ındices son intercambiables, no se quiere decir queal realizar el ajuste en Rn a los perfiles–columna, aparezca el mismo ajuste. Lo que queremos decir es que,tecnicamente hablando, el ajuste en Rn se puede obtener intercambiando i y j simplemente.

14 Analisis de Correspondencias Simple.

Ahora consideramos los puntos j de la nube en Rn, que tienen por coordenadas:{fij

f·j√fi·

i = 1, . . . , n ; f·j

}j = 1, . . . , p

en donde f·j es la masa de cada punto.El centro de gravedad de los p puntos anteriores o centro de gravedad de la nube en Rn, es el punto de

coordenadas(√

fi· i = 1, . . . , n), . A partir de esta nube y centro de gravedad todo el desarrollo es paralelo

al realizado en el caso de la nube en Rp.En concreto, el AFG (o el ACP si se quiere) se aplicarıa en este caso a una matriz S (la antes denotada

T ), cuyos autovalores y autovectores resuelven la cuestion. Esta matriz S tendra como elemento generico

sii′ =

p∑j=1

f·j

[fij

f·j√fi·−√

fi·

][fi′ j

f·j√

fi′ ·−√fi′ ·

]i, i

′= 1, . . . , n

S es, evidentemente, de dimension n× n, mientras que T lo era p× p.Todo el tratamiento es analogo al del caso anterior en Rp. Ası, por ejemplo, el escribir S como producto

(de la forma X′X) ahora sera en terminos de una matriz analoga a la dada por (3.18) pero permutando i

por j, llamemosla X∗, y por otro lado, segun el AFG y/o ACP, considerando XX′en lugar de X

′X. En

definitiva:

Sn×n = H∗H∗′= X∗

n×pX∗′

p×n

Comentario 3.4.6 Notese que:

H∗n×p = ((h∗

ij)) ; h∗ij =

fij − f·jfi·√f·jfi·

= hij = xij

por lo que H∗ = X. Basta tener en cuenta la observacion 3.4.1 anterior. En definitiva, en lugar de considerarT = X

′X, consideramos S = XX

′.

Igual que en el caso de la nube en Rp, aquı puede simplificarse el calculo de autovalores y autovectores,porque, como es facil comprobar, podemos calcularlo sobre una matriz no centrada, S∗, mas facil de manejar,que tiene los mismos autovalores y autovectores que la matriz S y que es del tipo no centrado:

S∗ = X∗∗X∗∗′

en donde X∗∗ = (x∗∗ij ), siendo

x∗∗ij =

fij√fi·f·j

Comentario 3.4.7 Puesto que x∗∗ij = x∗

ij, S = X∗X∗′, en la misma forma en que T = X∗′

X∗ en laobservacion 3.4.3 anterior referida a la simplificacion en los calculos sobre la nube en Rp de perfiles-fila.

Una vez que hemos fijado las matrices sobre las que actuar para el calculo del subespacio ajustado ala nube de perfiles-columna, a saber, S = XX

′o bien S∗ = X∗X∗′

, en el caso de actuar con la matrizno centrada simplificada, se procederıa al calculo de los autovalores y autovectores de dicha matriz base delos calculos. Sean (µα; vα) las parejas de autovalores–autovectores de S. Una aplicacion obvia de lo visto alrespecto en AFG, conduce a las conclusiones siguientes:

1. Los autovalores no nulos de S coinciden con los de la matriz T (utilizada en el ajuste de los perfiles-fila).De modo que λα = µα ; α = 1, . . . , q; en donde q son los no nulos de los α = 1, . . . , p autovalores λα.

2. Los correspondientes autovectores, vα, que definen la estructura factorial ajustada a la nube de perfiles-columna en Rn, se obtendran a partir de la solucion del sistema (S − µI) v = 0 para µ = µα = λα ; α =1, . . . , p.

3.5 Relaciones entre las nubes ajustadas en Rp y en Rn. 15

3. Finalmente, a los autovalores y autovectores (µα; vα) le son aplicados respecto de las matrices S o S∗

antes definidas, todas las propiedades vistas para T y T ∗ en la observacion 3.4.3 anterior, considerandoque el autovector equivalente a up =

(√f·j ; j = 1, . . . , p

)es ahora el vector vp =

(√fi· ; i = 1, . . . , n

).

En funcion de estas consideraciones, se obtiene la siguiente conclusion final sobre el ajuste en Rn:Sean Φαj las coordenadas-proyeccion sobre el Entonces:

Φαj =

n∑i=1

(fij

f·j√fi·

)vαi (3.25)

en donde vαi es la i-esima componente del autovector vα de la matriz S, siendo vα el α-esimo vector unitariofactorial en Rncuyo soporte es el α-esimo eje factorial en Rn

Comentario 3.4.8 En el esquema adjunto se recoge sumariamente todo el proceso de calculo en Rp y Rn

que hasta aquı hemos seguido.

3.5. Relaciones entre las nubes ajustadas en Rp y en Rn.

En el parrafo anterior hemos ajustado a las nubes de puntos-fila y punto-columna, en Rp y en Rn

respectivamente, los respectivos subespacios optimos, segun la teorıa general del Analisis Factorial General(AFG) aplicada al tipo de tabla objeto del Analisis de Correspondencias Simple (ACS). Ahora, siguiendocon la adaptacion del AFG al ACS, vamos a analizar como se formulan, en este ultimo, las relaciones entrelos subespacios ajustados y las subsiguientes relaciones entre las coordenadas de los puntos-fila y puntos-columna cuando estos se refieren al sistema de referencia dado por los ejes factoriales en ambos subespaciosajustados.

3.5.1. Relaciones generales entre los dos espacios ajustados en Rp y en Rn.

Cuando se analizo este tipo de relacion en el AFG, se obtuvo el siguiente resultado general:

1. Las dos nubes ajustadas (perfiles-fila en Rp; perfiles-columna en Rn), son definidas a partir, respecti-vamente, de las matrices (X

′X)p×p y (XX

′)n×n

2. Sean (λα, uα) y (µα, vα) las parejas autovalores-autovectores de X′X y XX

′respectivamente. Re-

cuerdese del AFG que λα = µα, para todos aquellos autovalores que no son nulos.

3. Los autovectores uα y vα (que constituyen, respectivamente, vectores unitarios cuyos soportes son losejes factoriales en Rp y en Rn) estan relacionados entre sı, mediante las expresiones

uα =1√λα

X′vα vα =

1√λα

Xuα (3.26)

Se trata, pues, de ver como las expresiones (3.26) se particularizan al ACS. Recuerdese que en el parrafo3.4 hemos concluido cuales son las matrices X

′X y XX

′sobre las que se obtienen los ejes factoriales en Rp

y en Rnen ACS. Recuerdese que segun los parrafos 3.4.2 y 3.4.3, en ultima instancia, por ser mas simpleslos calculos, se actua sobre las matrices X∗′

X∗ y X∗X∗′, en donde

X∗ =(x∗ij

); x∗

ij =fij√f·jfi·

En consecuencia, las relaciones (3.26) se transcriben ası

vα =1√λα

X∗uα uα =1√λα

X∗′vα (3.27)

16 Analisis de Correspondencias Simple.

3.5.2. Relaciones entre las coordenadas de los puntos sobre los ejes factorialesen ambos espacios.

Como se vio en AFG, las coordenadas de los puntos-fila (puntos-columna) en el sistema de ejes factorialesuα (vα), establecido en Rp (Rn) vienen dadas por las relaciones Xuα (X

′vα)

En ACS, actuando con la formulacion simplificada proveniente de manejar X∗, estas coordenadas son,respectivamente, X∗uα y X∗′

vα.

Comentario 3.5.1 X∗uα es un vector n × 1 (X∗ es n × p y uα, vector unitario en Rp, es p × 1) y suscomponentes dan las coordenadas de los n puntos–fila respecto del uα que se vaya considerando. Si denotamospor Ψαi a la i–esima componente de ese vector n–dimensional, X∗uα, Ψαi indica la coordenada del i–esimopunto–fila, respecto del eje factorial α en mathbbRp.

Analogamente, X∗′vα es un vector p×1, resultado de multiplicar la matriz X∗′

, p×n, por vα, autovectorunitario segun el eje factorial α-esimo en Rnes decir un vector n×1. Las p componentes, Φαj, de ese vector,

X∗′vα, son las coordenadas del j–esimo punto–columna respecto del α–esimo eje factorial ajustado en Rn

Ası pues, las coordenadas citadas son:

Ψαi =

p∑j=1

(fij

fi·√f·j

)uαj i = 1, . . . , n (3.28)

Φαj =n∑

i=1

(fij

f·j√fi·

)vαi j = 1, . . . , p (3.29)

¿Que relacion existe entre Ψαi y Φαj? Para encontrar esta relacion el camino es obvio: las expresiones(3.28) y (3.29) dan dichas coordenadas en terminos de uα y vα respectivamente y por otro lado las relacionesentre uα y vα estan dadas por (3.27). Combinando ambas relaciones se concluye que la componente i-esimade vα, a partir de (3.27) es

vαi =1√λα

p∑j=1

(fij√fi·f·j

)uαj

de donde

vαi =1√λα

√fi·Ψαi (3.30)

Analogamente se deduce que

uαj =1√λα

√f·jΦαj (3.31)

Por consiguiente:

Ψαi =

p∑j=1

fij

fi·√f·j

1√λα

√f·jΦαj =

1√λα

p∑j=1

fijfi·

Φαj (3.32)

Y analogamente

Φαj =

n∑i=1

fij

f·j√fi·

1√λα

√fi·Ψαi =

1√λα

n∑i=1

fijf·j

Ψαi (3.33)

La conclusion es evidente: las coordenadas, por ejemplo, de los puntos–fila, Ψαi, se obtienen con la homo-

tecia1√λα

, mediante una combinacion baricentrica de coeficientesfijfi·

, de todas las coordenadas, respecto

del eje α-esimo, de los puntos-columna.

3.5 Relaciones entre las nubes ajustadas en Rp y en Rn. 17

Cuadro 3.1: Relacion entre coordenadas sobre ejes factoriales

Rp Rn Observaciones

uα =1√λα

X′vα vα =

1√λα

XuαRelaciones generales enAFG

uα =1√λα

X∗′vα vα =

1√λα

X∗uαParticularizacion al ACS conX∗

X∗uα X∗′vα

Coordenadas de los puntosfila y columna en ACS

Ψαi =

p∑j=1

fij

fi·√f·j

uαj Φαj =n∑

i=1

fij

f·j√fi·

uαi

Ψαi = coordenada del i-esi-mo punto-fila en el eje α-esimo en mathbbRp

i = 1, . . . , n j = 1, . . . , pΦαj = coordenada del j-esi-mo punto-columna en el α-esimo eje en Rn

Ψαi =1√λα

p∑j=1

fijfi·

Φαj Φαj =1√λα

n∑i=1

fijf·j

ΨαiRelaciones analıticas entrelas coordenadas

De manera similar, ello equivale a manejar la matriz de componentesfijfi·

, que en la practica suele

expresarse en porcentajes en la formafijfi·× 100, de modo que si tenemos esta expresion, dividiendola por

100, obtenemos la matriz que hay que emplear para calcular la relacion (3.33).

Por otra parte, la combinacion baricentrica

p∑j=1

fijfi·

Φαj , define el baricentro de las coordenadas Φαj de

todos los puntos-columna (j = 1, . . . , p) respecto del eje α, con la ponderacion fi· del punto-fila i-esimo delque se trate, lo que constituye el Principio Baricentrico del Calculo de las Coordenadas en ACS.

Analogamente, cabrıa razonar sobre las Φαj . Se deja al lector la correspondiente version.

Comentario 3.5.2 De las relaciones (3.27) cabe obtener la siguiente conclusion valida en ACS: Todos losautovalores λα son iguales o menores que la unidad. Recuerdese que el autovalor unidad, λ = 1, es autovalorde T ∗ = X∗′

X∗ y su autovector asociado es up = (√f·j ; j = 1, . . . , p) (segun vimos en el parrafo 3.4.2).

Por tanto, probar lo que aquı proponemos equivale a probar que el mayor autovalor de T ∗ es precisamenteλ1 = 1. Dejamos la demostracion al lector.

La tabla 3.1 resume esquematicamente lo analizado en este parrafo.

Comentario 3.5.3 En ACS se tiene

X∗ = (x∗ij) con x∗

ij =fij√f·jfi·

18 Analisis de Correspondencias Simple.

3.6. Reconstruccion de la Tabla inicial en ACS.

Como se vio en AFG, en realidad lo que pretenden las tecnicas factoriales en general es resolver, conarreglo a determinados criterios, un problema de aproximacion de la matriz inicial de datos X, a partir de laque actua la respectiva tecnica factorial en cada caso, mediante un numero menor de valores numericos. Porejemplo, en ACP y ACS, no es la matriz bruta inicial de datos sino ciertas matrices transformadas de ella.

En terminos tecnicos esta aproximacion tiene lugar mediante matrices de bajo rango, en el contexto delproblema general de obtener, mediante un criterio de mınimos cuadrados, la aproximacion de una matrizdada. Y ello se consigue, desde un punto de vista general, mediante la descomposicion de valores singulares(DVS). Este enfoque general sera analizado en otro lugar de este texto.

De una manera directa, esta cuestion fue resuelta en AFG mediante los autovalores-autovectores de X′X

y de XX′, de tal manera que X se aproxima por X∗,

X∗ =

q∑α=1

√λαvαu

α ; X(n× p) ; vα(n× 1) ; uα(p× 1) (3.34)

en donde q ≤ p, indica el numero de los primeros autovalores λ1, . . . , λq seleccionados de entre los λ1, . . . , λp

que en general tendra X′X. Recuerdese que los que no sean nulos de esos λ1, . . . , λp, digamos r de ellos (con

r ≤ mın(p;n)), tambien son autovalores de XX′.

Pero, al margen de esta aproximacion de X por X∗ en terminos de esos λ1, . . . , λq, se verifica que

X =

p∑α=1

√λαvαu

α (3.35)

lo que permite, teoricamente, la reconstruccion exacta de X a partir de los subespacios ajustados en Rp yRn

3.6.1. Formula de reconstruccion en ACS.

Veamos como la formula de reconstruccion dada por (3.35) de AFG se adecua al ACS. En este caso,continuando bajo la suposicion de que actuamos con la matriz simplificada X∗ definida en el parrafo 3.4.2,expresion (3.21), se tendra obviamente

X∗ =

p∑α=1

√λαvαu

α ; X∗ = (x∗ij) ; x∗

ij =fij√fi·f·j

(3.36)

Comentario 3.6.1 Denotamos aquı por X∗ a la matriz simplificada. No confundir con la denotada tambienX∗ en el contexto de AFG, en donde ası se ha denotado a la matriz aproximada de X, en la expresion (3.34).

Aquı pretendemos expresar X∗ mediante las coordenadas Ψαi y Φαj , coordenadas de los puntos-fila,puntos-columna, respectivamente, en los sistemas factoriales ajustados en Rp y RnPara conseguirlo, susti-tuimos en (3.36), vα y uα, por las expresiones respectivas en funcion de las coordenadas (dadas por (3.30) y(3.31) del parrafo 3.5.2).

En efecto:

x∗ij =

fij√fi·f·j

=

p∑α=1

√λα

(1√λα

√fi·Ψαi

)︸ ︷︷ ︸

vαi

(1√λα

√f·jΦαj

)︸ ︷︷ ︸

uαj

=

=

p∑α=1

1√λα

(ΨαiΦαj

)√fi·f·j

de donde

fij =

(p∑

α=1

1√λα

ΨαiΦαj

)fi·f·j (3.37)

3.6 Reconstruccion de la Tabla inicial en ACS. 19

3.6.2. Otra forma de escribir la formula de reconstruccion.

Se acostumbra a escribir la ultima expresion (3.37), simplificada, en el sentido siguiente: Como hemosvisto en la seccion 3.4.2, λ1 = 1 es el mayor autovalor de X∗′

X∗ y de X∗X∗′, lo que se puede hacer

constar de manera explıcita en la formula de reconstruccion (3.37). En tal caso, ademas, sabemos queu1 = up = (

√f·j ; j = 1, . . . , p) y v1 = (

√fi· ; i = 1, . . . , n), son los autovectores asociados a λ1 = 1 = µ1

en X∗′X∗ y X∗X∗′

respectivamente. Por lo tanto u1j =√

f·j y v1i =√fi·, con lo que

fij = fi·f·j

(1 +

p∑α=2

1√λα

ΨαiΦαj

)(3.38)

ya que, en efecto, el primer termino de la suma de (3.37) es

1√λ1

Ψ1iΦ1j = Ψ1iΦ1j

que en virtud de (3.30) y (3.31), parrafo 3.5.2, es igual a

Ψ1iΦ1j =

(v1i√λ1

1√fi·

)(u1j

√λ1

1√f·j

)= 1

de donde se obtiene la expresion (3.38). Finalmente, la expresion (3.38) se puede tambien escribir ası:

fij = fi·f·j

(1 +

p∑α=2

√λαΨαiΦαj

)(3.39)

en terminos de

Ψαi =1√λα

Ψαi Φαj =1√λα

Φαj

Ψαi y Φαj son los llamados factores normalizados de norma unidad. En efecto, consideremos el vector

constituido por todos los Ψαi, es decir, por todas las coordenadas respecto del eje factorial soporte de uα

factor de los n puntos-fila (Ψα1, . . . , Ψαn

)′

Sabemos que este vector columna n×1 es por otra parteX∗uα. Por tanto, si consideramos las coordenadasdadas por

(Ψα1, . . . ,Ψαn)′=

(1√λα

Ψα1, . . . ,1√λα

Ψαn

)′

se tiene:

(Ψα1, . . . ,Ψαn) (Ψα1, . . . ,Ψαn)′= ||Ψα||

Pero

(Ψα1, . . . ,Ψαn) (Ψα1, . . . ,Ψαn)′=

1

λα

(Ψα1, . . . , Ψαn

)(Ψα1, . . . , Ψαn

)′

=

=1

λα

(u

αX∗′)(X∗uα) =

1

λαu

αX∗′X∗uα =

1

λαλαu

αuα = 1

Es decir, ||Ψα|| = 1. De ahı que en efecto los Ψαi son normalizados a la unidad.Analogamente se procederıa para los Φαj .

20 Analisis de Correspondencias Simple.

3.7. Elementos suplementarios en ACS.

Cuando estudiabamos, como primer ejemplo de tecnica factorial, el Analisis de Componentes Principales,vimos la necesidad de, una vez realizada la aplicacion del ACP, ubicar en las nubes ajustadas de filas ycolumnas, posibles nuevos puntos-fila o puntos-columna.

En ACS el problema es analogo. Las filas o columnas suplementarias en la tabla bruta inicial conducirana puntos-fila y puntos-columna en perfiles respectivos

{k+i,j

k+i·

}; k+i· =

p∑j=1

k+ij

{k+i,j

k+·j

}; k+·j =

n∑i=1

k+ij

que corresponden, respectivamente a las situaciones siguientes

i = 1 k11 · · · · · · · · · k1p k1·...

......

......

......

......

......

......

...i = n kn1 · · · · · · · · · knp kn·i = + · · · · · · k+ij · · · k1p k+i·

(R

R+

)←− Puntos-fila suplementarios

j = +

i = 1 k11 · · · · · · · · · k1p...

......

......

...... k+ij

i = n kn1 · · · · · · · · · knp...

k·1 · · · · · · · · · k·p k+·j

←− Columnas suplementarias

(R|R+)

Dados pues los perfiles-fila o perfiles-columna correspondientes a las filas o columnas suplementarias,se procede a situarlos en sus nubes correspondientes, ajustadas en base a la tabla inicial (sin las filas y/ocolumnas suplementarias). Y la ubicacion en esas nubes se obtiene aplicando a las matrices suplementariasR+ o R+, previo su paso a las correspondientes en perfiles, las expresiones ((3.32) y (3.33), parrafo 3.5.2, demodo que, por ejemplo, aplicando (3.32) que en la tabla inicial es

Ψαi =1√λα

p∑j=1

fijfi·

Φαj

coordenadas del punto-fila i-esimo, en terminos de Φαj , y de ahı se deduce

Ψ+αi =1√λα

p∑j=1

k+ij

k+i·Φαj

para las coordenadas de las filas suplementarias.

En el caso de tener que ubicar una columna suplementaria, sus coordenadas Φ+αj se obtendran a partir

de (3.33) del parrafo 3.5.2

Φ+αj =

1√λα

n∑i=1

k+ij

k+·jΨαj

3.8 Ayudas a la interpretacion en ACS. 21

3.8. Ayudas a la interpretacion en ACS.

Desde los inicios del Analisis de Datos por Benzecri y colaboradores, al tratar cualquiera de sus tecnicas,se incluye como etapa final, una vez terminado su desarrollo, una serie de cuestiones que se engloban bajoel tıtulo generico de Ayudas a la interpretacion. Estas ayudas no son mas que una serie de consecuenciasderivadas del propio desarrollo de la tecnica correspondiente, que sirven en la practica, en efecto, de ayudapara la interpretacion de los resultados obtenidos.

En concreto, a nivel de las tecnicas factoriales asociadas al Analisis Factorial General (AFG) del Analisisde Datos, las ayudas expresan interpretaciones, normalmente expresables tambien graficamente, asociadasa ciertas propiedades de los factores deducidos en cada caso, de modo que podamos medir e interpretar laimportancia de los factores y lo que ellos significan.

En ACP, como caso especial de AFG, ya vimos una medida asociada a los factores obtenidos, que midesu importancia en la estructura factorial construida. Recordemos la tasa de inercia general de AFG y suversion en ACP, por ejemplo normalizado, en donde

p∑j=1

λα = tr(X

′X)= tr

(XX

′)=

= tr(matriz de correlaciones) =∑i

∑j

x2ij = p

de tal modo que se define la tasa de inercia asociada a los primeros q factores como:

τq =

q∑i=1

λα

p∑i=1

λα

A continuacion vamos a desarrollar esta cuestion en ACS.

3.8.1. Medidas basicas para la interpretacion en ACS.

Se manejan en la practica del ACS dos medidas dirigidas a facilitar la interpretacion de la estructurafactorial que ACS asocia al espacio de puntos-fila y al de puntos-columna. Estas dos medidas son, en ciertosentido, duales en la interrelacion punto-factor. Veamoslas a continuacion.

• Dado un eje factorial cualquiera, digamos el α-esimo, los n puntos-fila, proyectados sobre dicho eje,definen sobre el un conjunto de n valores proyectados, los Ψαi obviamente, cuya dispersion vamos a medirmediante su varianza. Esta varianza, si el origen esta en el centro de gravedad, vendra dada por la expresionreducida:

n∑i=1

fi·Ψ2αi (3.40)

Los puntos–fila son manejados por los perfiles correspondientes, de masa fi· y si el origen esta en el centrode gravedad, entonces la media (ponderada) sera:

Ψαi =n∑

i=1

fi·Ψαi = 0

En efecto:

n∑i=1

fi·Ψαi =n∑

i=1

fi·

p∑j=1

fij

fi·√

f·juαj =

p∑j=1

uαj√f·j

n∑i=1

fij =

22 Analisis de Correspondencias Simple.

=

p∑j=1

uαj√f·j

f·j =

p∑j=1

uαj

√f·j = 0

La ultima igualdad se da en virtud de lo visto en el parrafo 3.4.2. Por tanto, la varianza considerada esla dada por (3.40). Si esta expresion se calcula explıcitamente, se tendra:

n∑i=1

fi·Ψ2αi =

n∑i=1

fi·

(√λαvαi√fi·

)2

=n∑

i=1

λαv2αi = λα

n∑i=1

v2αi = λα

sin mas que tener en cuenta la ecuacion (3.30) del parrafo 3.5.2 y el hecho de ser unitario el vector vα (en ladireccion del eje factorial α-esimo).

En definitiva, en ACS, la inercia (varianza) de los puntos-fila proyectados, en el eje α-esimo, vale elrespectivo autovalor λα asociado al autovector uα que define a dicho eje. Es decir:

n∑i=1

fi·Ψ2αi = λα

Comentario 3.8.1 Comparese este resultado con el del AFG, en donde la importancia de un eje vienemedida en terminos de la varianza (inercia) asociada a dicho eje que, por otra parte, es igual al autovalorcorrespondiente. En funcion de esto definıamos la tasa de inercia explicada por cada eje, o por el conjuntode los q primeros ejes factoriales τq.

Lo anterior da pie a introducir una medida de la contribucion de un punto-fila cualquiera, el i-esimo, ala inercia asociada al eje factorial α-esimo, Caα(i), definida como el sumando debido al punto i-esimo en(3.40), esto es

Caα(i) = fi·Ψ2αi (3.41)

que suele llamarse Contribucion absoluta del elemento i-esimo, a la inercia (varianza) explicada por el ejeα-esimo. A partir de ella, se define la Contribucion relativa del elemento i-esimo, a la inercia (varianza)explicada por el eje α-esimo, CTRα(i), definida como

CTRα(i) =fi·Ψ

2αi

λα(3.42)

Una repeticion de los calculos anteriores, para el j-esimo punto–columna, de masa f·j , conduce a definirla contribucion de dicho punto–columna a la inercia asociada al α-esimo eje factorial en RnEn efecto, sinmas que tener en cuenta ahora la expresion (3.31) del parrafo 3.5.2, se llega a

Ca′α(j) = f·jΦ2αj ; CTR′

α(j) =f·jΦ

2αj

λα(3.43)

Notese quen∑

i=1

Caα(i) =n∑

i=1

fi·Ψ2αi

λα=

1

λα

n∑i=1

fi·Ψ2αi = 1

es decir, la suma de las contribuciones relativas al eje α–esimo de todos los puntos de la nube de puntos–filavale la unidad. Analogo ocurre con los puntos–columna.

Las contribuciones (3.41), (3.42) y (3.43) se suelen expresar en la practica en centesimas o porcentajes,multiplicandolas por 100, e incluso a veces en milesimas, multiplicandolas por 1000.• Con las contribuciones absolutas medimos la importancia de una fila o de una columna, a la hora de

explicar la inercia a su vez explicada por un determinado factor 2. Cabe plantear la situacion inversa, es decir,tratar de medir el efecto (contribucion) de los factores en la posicion de un punto-fila o de un punto-columnadeterminados. Estas medidas se realizan mediante unos coeficientes denominados Contribuciones relativas

2Por decirlo de otra manera, en las expresiones (3.41), (3.42) y (3.43) de las contribuciones absolutas, se fija un α y se analizavariando i o j, la contribucion de los mismos a α.

3.8 Ayudas a la interpretacion en ACS. 23

del factor α-esimo en el punto-fila i-esimo (o punto-columna j-esimo). Veamos como se construyen estascontribuciones relativas.

1. Consideremos en primer lugar la nube de puntos-fila y sea el i-esimo punto. Se sabe que el centro de

gravedad de esta nube es el punto de coordenadas(√

f·j ; j = 1, . . . , p)en Rp. Entonces la distancia

al cuadrado de dicho punto i al centro de gravedad viene dada por

d2(i; cg) =

p∑j=1

(fij

fi·√f·j−√f·j

)2

=

p∑j=1

(fijfi·− f·j

)21

f·j(3.44)

Recuerdese, parrafo 3.4.1 ,expresion (3.12), la distancia entre dos puntos–fila en Rp y la expresion(3.13) que da el centro de gravedad de la nube de puntos-fila. Definimos entonces

Crα(i) =Ψ2

αi

d2(i; cg); Rp (3.45)

que es llamada Contribucion relativa del eje factorial α-esimo al punto fila i. Se suele denotar tambienCORα(i).

Graficamente, en Rp, la situacion es

cos2(θ) =Ψ2

αi

d2(i; cg); i = fijo

de modo que Crα(i) puede interpretarse como el coseno al cuadrado del punto i con el eje α.

Por otra parte es facil probar que la suma de las contribuciones relativas de todos los ejes factorialesal punto i vale la unidad. En efecto:

p∑α=1

Crα(i) =

p∑α=1

Ψ2αi

d2(i; cg)=

1

d2(i; cg)

p∑α=1

Ψ2αi

Calculemos

p∑α=1

Ψ2αi. Segun la expresion (3.19) de 3.4.1 —la dada por (3.30) de 3.5.2 no es adecuada

aquı— se tiene

p∑α=1

Ψ2αi =

p∑α=1

p∑j=1

(fij

fi·√

f·j−√f·j

)uαj

2

=

=

p∑α=1

p∑j=1

(fij

fi·√

f·j−√f·j

)uαj

p∑j′=1

fij′

fi·√f·j′−√f·j′

uαj′

=

p∑α=1

p∑

j=1

(fij

fi·√f·j−√f·j

)2

u2αj

+

+

p∑α=1

p∑

j,j′=1

j =j′

(fij

fi·√f·j−√f·j

) fij′

fi·√f·j′−√f·j′

uαjuαj′

=

24 Analisis de Correspondencias Simple.

=

p∑

j=1

(fij

fi·√f·j−√f·j

)2

p∑α=1

u2αj+

+

p∑

j,j′=1

j =j′

(fij

fi·√

f·j−√f·j

) fij′

fi·√

f·j′−√

f·j′

p∑α=1

j =j′

uαjuαj′

Pero teniendo en cuenta que, dados los autovectores uα (unitarios en la direccion del eje factorialrespectivo Fα), estos son ortogonales (son correspondientes a raices caracterısticas distintas), entoncesla matriz que los contiene como columnas es ortogonal. Es decir

(u1|u2|, . . . , |uα|, . . . , |up) (u1|u2|, . . . , |uα|, . . . , |up)′= Ip×p

De aquı, mediante faciles calculos, se comprueba que:

p∑α=1

u2αj = 1 ;

p∑α=1

j =j′

uαjuαj′ = 0

En resumen

p∑α=1

Ψ2αi =

p∑j=1

(fij

fi·√f·j−√f·j

)2

= d2(i; cg)

Por tanto, en efecto:

p∑α=1

Crα(i) = 1

2. Analogamente, cabe actuar de manera paralela en Rn con la nube de puntos–columna. En definitiva,se establecen las contribuciones relativas de los ejes factoriales α en Rn a cada punto-columna (j =1, . . . , p):

Cr′α(j) =Φ2

αj

d2(j; cg); Rn (3.46)

con analogas interpretaciones a las de Crα(i). Aquı el centro de gravedad, cg, es el de la nube de puntos–columna y obviamente nos situamos en Rndonde los puntos–columna son los puntos considerados.

Comentario 3.8.2 Otra interpretacion de Crα(i) es como coeficiente de correlacion al cuadrado entre eleje α y el punto i-esimo fijado.

cos2 θ =Ψ2

αi

d2(i; cg)=

< i|α >

||i|| · ||α||= coeficiente de correlacion2(i;α)