La utilización de datos secundarios en la investigación social. The use of secondary data in...

43
La utilización de datos secundarios en la investigación social por Antonia Ramirez Perez se distribuye bajo una Licencia Creative Commons Atribución-NoComercial- CompartirIgual 4.0 Internacional . Antonia Ramírez Pérez Universidad Pablo de Olavide La utilización de datos secundarios en la investigación social Introducción La técnica más técnicas más frecuente para la producción de datos cuantitativos es la encuesta social. Sin embargo, ya existen muchas encuestas y están disponibles otros tipos de datos que pueden dar respuesta a preguntas de investigación planteadas por la investigadora o el investigador. Dada la abundancia de información en la actualidad, sería una pena no rentabilizar estos recursos. Este documento muestra como hacer un buen uso de estos datos que han venido a denominarse secundarios, como contraposición a la denominación de primarios. Los datos secundarios se caracterizan por ser datos que NO son producidos directa y explícitamente por el investigador o investigadora para responder a sus preguntas de investigación concretas. 1

description

La técnica más técnicas más frecuente para la producción de datoscuantitativos es la encuesta social. Sin embargo, ya existen muchas encuestasy están disponibles otros tipos de datos que pueden dar respuesta a preguntasde investigación. Este documento muestra como hacer un buen uso de datos secundarios.

Transcript of La utilización de datos secundarios en la investigación social. The use of secondary data in...

La utilización de datos secundarios en la investigación social por Antonia Ramirez Perez se distribuye bajo una

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.

Antonia Ramírez Pérez

Universidad Pablo de Olavide

La utilización de datos secundarios en la investigación social

Introducción

La técnica más técnicas más frecuente para la producción de datos

cuantitativos es la encuesta social. Sin embargo, ya existen muchas encuestas

y están disponibles otros tipos de datos que pueden dar respuesta a preguntas

de investigación planteadas por la investigadora o el investigador. Dada la

abundancia de información en la actualidad, sería una pena no rentabilizar

estos recursos.

Este documento muestra como hacer un buen uso de estos datos que han

venido a denominarse secundarios, como contraposición a la denominación

de primarios. Los datos secundarios se caracterizan por ser datos que NO son

producidos directa y explícitamente por el investigador o investigadora para

responder a sus preguntas de investigación concretas.

1

El documento que se presenta parte de la base que se cuenta con datos

válidos y fiables para llevar a cabo una investigación (independientemente de

que sea primarios, secundarios, agregados o desagregados); las técnicas de

investigación no garantizan por sí mismas que las conclusiones sean válidas.

Para que lo sean, las técnicas tendrán que aplicarse correctamente, pero,

además, los datos, sean primarios o secundarios, tienen que reunir

determinados criterios de calidad y ser relevantes para responder a una

pregunta de investigación pertinente.

Objetivos de este documento

Conocer, de forma general, la diferencia entre datos primarios y secundarios.

Saber distinguir datos agregados de datos desagregados.

Conocer las principales fuentes de producción y bancos de datos a nivel

nacional e internacional.

Saber de forma general, si los datos secundarios utilizados son fiables y válidos

para responder a una pregunta de investigación.

La producción de datos secundarios

Cada día, con mayor frecuencia, la investigación hace uso de información que

se produce por organismos e instituciones cuya finalidad no es,

necesariamente, servir como herramienta para la investigación social. Su

utilidad para este fin puede ser, sin embargo, considerable, dependiendo

también de la imaginación del investigador.

La información de estos organismos es amplia y puede abarcar muchos

campos: el conocimiento del nivel de producción de textiles a base de

2

productos sintéticos, el número de perros o animales de compañía

abandonados, el número de abortos legales practicados en una sociedad, etc.

Este documento orienta sobre la utilización que puede hacerse de este tipo de

datos, comúnmente conocidos como secundarios, para que puedan usarse con

corrección en cualquier investigación.

Datos primarios y datos secundarios

El investigador o investigadora puede elaborar sus propios instrumentos

de recogida de información al realizar el diseño de la investigación. De

este modo, mediante esos instrumentos, se producen datos que son

directamente relevantes para responder a sus preguntas de investigación.

En estos casos, se dice que en la investigación se han producido datos primarios. La elaboración de cuestionarios, para ser aplicadas a una

muestra, mediante la técnica de la encuesta, responde a este tipo de

producción de datos.

Sin embargo es bastante frecuente que, en la fase del diseño de la

investigación, no se elaboren instrumentos específicos para recoger

información que responda directamente a las preguntas de investigación.

Puede que, por diversas circunstancias, se recurra a información que ya existe

para dar respuesta a esos interrogantes. Es frecuente que se recurra a datos

elaborados en investigaciones previas, o generados por organismos que

desean tener un conocimiento de alguna cuestión específica. En estos casos el

investigador, normalmente, busca, de entre toda esa información disponible, la

3

que es relevante a su objeto de estudio y le permita responder a sus preguntas

de investigación.

Por lo tanto, los datos secundarios son datos existentes, previos a la

realización de la investigación que se propone llevar a cabo el investigador

o investigadora. Suelen ser, en un primer momento, recopilados, para, en

un segundo momento, realizar determinadas operaciones a fin de que de

los mismos se extraiga información útil y relevante para contestar a las

preguntas que plantea la investigación. Como señalan Mochmann y

Guchteneire, “la utilización de viejos datos para nuevas ideas sería la descripción coloquial de lo que se ha denominado en términos técnicos análisis secundario” (en González, 2000:302).

Se aprende practicando

Elección 1

Distingue datos primarios y secundarios

Un organismo ha encargado un estudio sobre paro juvenil en Viena. Para realizar este estudio se podrían utilizar diferentes datos. De la siguiente lista de acciones, señala en cuáles se estarían generando datos primarios y en cuáles se estaría utilizando datos secundarios.

Acciones

1. Utilizar el padrón municipal de Viena

2. Utilizar el registro de la oficina del Instituto Nacional de Empleo

3. Realizar un cuestionario a los jóvenes mayores de 16 años

4. Utilizar una encuesta sobre la situación laboral en Austria realizada por la el Ministerio de Empleo

5. Realizar un cuestionario a los empresarios/empleadores de la zona

4

Se aprende practicando

Multirrespuesta 1

¿Cuáles son datos secundarios?

Se desea realizar una investigación sobre el aumento de la violencia de género en

Andalucía durante la última década. ¿Cuáles de los siguientes datos que podemos

utilizar son secundarios?

1. Entrevistas realizadas por el investigador a víctimas de malos tratos.

2. Estadísticas de la policía y la guardia civil sobre denuncias por malos tratos.

3. Estadísticas del Instituto de la Mujer sobre el perfil de denunciantes y

denunciados en casos de malos tratos.

4. Informes realizados por los psicólogos a las personas que han sido atendidas en

los servicios de urgencia con indicios de haber sido víctimas de malos tratos.

5. Entrevistas con maltratadores, realizadas por otro investigador para una

investigación previa sobre maltrato, a las que el investigador tiene acceso.

6. Estadísticas de la judicatura sobre condenas por casos de malos tratos.

7. Encuesta realizada por el CIS a una muestra representativa de la población

Española, de ambos sexos, mayor de 18 años, sobre la incidencia y la percepción

de los malos tratos.

La producción de datos secundarios en las últimas décadas

Con el desarrollo en los últimos años de los sistemas computarizados y las

tecnologías de la información la producción de datos, y su uso, se ha

disparado. Hoy en día, gracias a esos avances en la tecnología, resulta mucho

más fácil y sencillo recopilar, almacenar y manejar información. El problema

casi sería el contrario: la sobreinformación. La cuestión reside aquí en saber

5

seleccionar entre toda la información disponible la que es útil, válida y fiable

para la investigación que se desee desarrollar.

Las organizaciones e instituciones, públicas y privadas, para conocer mejor a

las personas y a los sectores de población a los que se dirigen, así como para

evaluar los resultados de sus políticas, recopilan cada vez mayor información

sobre las sociedades y las almacenan en bases de datos, las cuales, gracias a

las computadoras y a los sistemas informatizados, se pueden almacenar en un

espacio reducido y a un coste no demasiado elevado. Incluso los usuarios

cuentan con recursos de almacenaje impensables hace solo unos años: los

CD-ROM, los pen-drivers, más cómodos de usar por su reducido tamaño, o los

discos duros extraíbles.

Dada esta cantidad ingente de información, las empresas, las organizaciones, y

las instituciones dedican, como señala González (2000: 301), parte del coste

no ya a la producción sino al diseño, gestión y mantenimiento de las grandes

bases de datos, lo que normalmente se conoce como Banco de Datos. La

gestión de la información en bancos de datos permite rentabilizar su uso pues,

por un lado, su mayor accesibilidad gracias a las nuevas tecnologías y por otro

lado, su organización centralizada, permiten de forma rápida y ordenada el

acceso de los usuarios a la información.

A nivel internacional, por ejemplo, el Banco Mundial (WB) posee un

impresionante banco de datos sobre desarrollo y economía mundial; el

Internacional Social Survey Programme (ISSP) lleva a cabo, desde 1985, una

encuesta internacional sobre asuntos múltiples como gobierno, religión,

desigualdad social, familia, ciudadanía, identidad nacional y un largo etcétera.

A nivel nacional, el Centro de investigaciones Sociológicas (CIS) posee un

banco de datos sobre trabajo, población, medio ambiente, valores y actitudes,

etc., al que se puede acceder a través de precio más o menos razonable.

6

Esta explosión de bancos de datos supone, de forma paralela, que se elaboren

cada vez más y de forma más rigurosa documentos metodológicos asociados a ellos, con el fin de mejorar su uso. Así, pues, llegados a este

punto, habría que preguntarse por el papel que verdaderamente juegan los

datos secundarios en la producción de conocimiento científico.

El documento metodológico contiene la información sobre cómo se ha

realizado la recopilación de datos: el territorio donde se ha llevado a cabo; el

año de su realización; la muestra y el error, en caso de ser una encuesta; la

unidad monetaria que se ha utilizado; y un largo etcétera de información que

se resume en la ficha técnica.

¿Son útiles los datos secundarios?

El gran problema con el que se han enfrentado los datos secundarios hasta

ahora mismo puede resumirse en la frase de McCaston (1998:7): “los datos

secundario complementan, pero no remplazan, la colección de datos primarios

y deben ser el punto de partida de cualquier actividad investigadora”. Es decir,

normalmente, como señala González (2000:300), el propio término

“secundario”, ha tenido una connotación peyorativa (como datos

complementarios o supletorios). De hecho, y como se ha mencionado, el bajo

coste en la producción ha sido tradicionalmente uno de los motivos para su

uso, ante las limitaciones económicas del investigador para generar sus

propios datos.

En los últimos años, no obstante, esta visión está variando. De hecho, existen

investigaciones comparativas, entre diferentes países, que no podrían haberse

realizado si no es por el uso de datos secundarios. De igual manera, la

presentación de tesis doctorales construidas sobre la base únicamente de

7

datos secundarios, sin que ello haya producido ninguna merma en su calidad

científica. La ilustración 1 resume esta nueva perspectiva, comparándola con

la perspectiva tradicional.

Ilustración 1. Nuevos enfoques respecto a la utilidad de los datos secundarios

Por lo tanto, el uso de los datos secundarios va más allá de su uso exploratorio

o conformista ante diseños con escasos recursos. Como señala González

(2000:300): “en realidad, cuando hablamos de investigación secundaria nos

referimos a datos existentes y disponibles, sin implicar ningún tipo de aspecto

peyorativo”. Debe resaltarse que la posibilidad de usar datos secundarios

depende, en gran medida, de la teoría y de la creatividad científica de quien los

maneja”. Naturalmente este uso requiere una justificación de por qué y cómo

se considera que el dato aporta la información que se necesita y es relevante

para la pregunta de investigación planteada.

Pero entonces, ¿cómo se puede establecer la utilidad de los datos

secundarios en una investigación? Es decir, ¿cuándo se puede decir que

un dato secundario es útil a los fines de la investigación? La respuesta

remite a la los objetivos y la pregunta de investigación. Si desde el

principio se sabe con claridad cuáles son los objetivos de la investigación,

cuál es la pregunta que sustenta las indagaciones del investigador,

entonces el uso de datos primarios o secundarios se relativiza.

Habrá datos que sean útiles y relevantes para responder a la pregunta

planteada, independientemente de que existan previamente (secundarios) o

sean producidos explícitamente para el desarrollo de la investigación

(primarios); y otros que no lo serán. No está de más recordar al lector que

8

pueden producirse datos primarios que no sean los adecuados para responder

a la pregunta de investigación.

No es este el lugar para desarrollar las cuestiones relativas a los objetivos y

preguntas de investigación, así como tampoco al diseño de la investigación.

Baste decir que si el investigador o investigadora, “confunde o equivoca el

objetivo propicia la utilización de métodos inadecuados y puede llevar a

pronósticos e inferencias desdichadas” (Glamour et al.1997:17, en González,

2000 :300).

Se aprende practicando

Multirrespuesta 2

¿Cuáles son datos secundarios útiles?

Imagine el lector o lectora una investigación sobre el aumento de las empresas

solidarias en Argentina durante la última década. ¿Cuáles de los siguientes datos

secundarios cree más adecuado utilizar?

1. Informes y estadísticas sobre aportaciones del Estados a los países en vías de

desarrollo.

2. Estadísticas de la Secretaría de Empleo, Industria y Comercio sobre número de

empresas ubicadas en Argentina.

3. Informes y estadísticas de la Secretaría de Bienestar Social sobre programas de

solidaridad llevados a cabo en Argentina.

4. Informes anuales de las empresas solidarias en Argentina sobre aportaciones

realizadas a organizaciones o programas de solidaridad

9

Datos agregados, datos desagregados

Los datos, además de primarios y secundarios, pueden ser agregados o

desagregados. En realidad se trata de dos conceptos muy sencillos y que

tienen que ver con el concepto de unidades de análisis.

Los datos agregados “describen un grupo de observaciones,

estableciéndose el grupo a partir de un criterio definitorio”(McCaston,

1998:5). Los datos agregados normalmente se expresan en un valor

absoluto o en un porcentaje, y normalmente se refieren a datos asociados

a unidades territoriales (pueblo, ciudad, provincia, región, país, etc.) y/o

a series temporales (un año, tres, cinco, una década, etc.)

Los datos agregados suelen estar referidos a determinado tipo de unidades de

análisis: el conjunto de individuos (los miembros de una pandilla, los

alumnos de un aula, los estudiantes de una carrera, la población reclusa en

una provincia, los empleados de una empresa, los afiliados de un partido

político, etc.); o la organización o institución (la familia, el Gobierno, el país,

la región, el partido político, el sindicato, etc…).

Los datos desagregados se entienden normalmente como información

asociada a personas o entidades individuales, como puede ser edad,

sexo, ingreso, nivel de formación, ideología, preferencias en consumo,

etc.

10

Los datos desagregados suelen estar referidos a determinado tipo de unidades

de análisis: el individuo (un joven, una doctora, un enfermero, un político, una

empresaria; el acontecimiento (una huelga, un vertido contaminante, la

quiebra de una empresa, un proceso electoral, etc.); y el producto cultural (una obra literaria, un programa electoral, un artículo de periódico, un currículo

escolar, una costumbre popular, etc.).

Los datos que se recogen desagregadamente pueden agregarse

posteriormente. Esta es una ventaja de contar con datos desagregados. Por

ejemplo, de una encuesta con datos individuales sobre la opinión de los

ciudadanos de un país acerca de la eutanasia, se puede conseguir un dato

agregado para ese país: el porcentaje de población que justifica la eutanasia,

que puede compararse con un dato agregado similar para otros países. Sin

embargo, el proceso de desagregar la información a partir de un dato agregado

no puede llevarse a cabo con garantías.

Normalmente la información desagregada permite conocer las características,

opiniones, hechos o aspectos subjetivos de las personas con cierto detalle. La

información agregada, en cambio, se orienta más al análisis contextual o

estructural de la situación analizada.

Se aprende practicando

Multirrespuesta 3

¿Cuáles son datos agregados?

De la siguiente lista, indique cuáles constituyen el tipo de datos que se han

denominado agregados.

1. Porcentaje de desempleo en una región.

2. Tipo de sistema electoral de un país.

3. Opinión de un ciudadano sobre el aborto.

11

4. Número de inmigrantes legales registrados en España durante los últimos 5 años.

5. Número de hijos de una mujer.

6. Tasa de fertilidad española.

Elección 2

¿Cuáles son datos agregados y desagregados?

En una investigación se trata de establecer, entre otras cosas, los factores

explicativos de la formación de coaliciones de gobernanza. Para ello se recopilaron

diferentes informaciones, algunas de las cuales constituían datos agregados y otros

datos desagregados. ¿Sabría distinguirlos?

1. Ideología política de los alcaldes.

2. Preferencias partidistas de los alcaldes.

3. Porcentaje de población joven en el municipio

4. Preferencias en gasto local del alcalde

5. Tamaño del municipio.

6. Porcentaje de personas dedicadas a trabajar en el sector servicios del municipio

7. Porcentaje de empleados en el sector servicios.

12

Estadísticas frente a encuestas.

Para finalizar este apartado, comentar la diferencia que hay entre datos

secundarios provenientes de estadísticas y encuestas, en conexión con la

distinción entre datos agregados y desagregados que acaba de realizarse.

Los datos de encuestas son normalmente datos desagregados. La información

se extrae de cada individuo a quien se administra el cuestionario. Si la

encuesta está bien diseñada y se ha administrado correctamente, el conjunto

de individuos será una muestra representativa y se podrán hacer inferencias

sobre la población objeto de estudio.

Las estadísticas, sin embargo, suelen caracterizarse por recoger la información

en forma de datos agregados; es decir, porcentajes o número absolutos de

determinados rasgos de unidades colectivas, como escuelas, ciudades,

regiones, estados, unidades temporales, etc. Por otro lado, cuentan con la

ventaja de que se suele recoger información de todas y cada una de esas

unidades colectivas. Es decir, no se extrae una muestra, sino que se estudia

todo el universo. Por lo tanto, el problema de la representatividad desaparece.

Fuentes de producción de datos secundarios

Una vez conocida la utilidad de los datos secundarios para la producción de

conocimiento científico, en esta sección se muestra qué datos existen, dónde

están y cómo puede accederse a ellos.

A continuación se mencionan los centros de investigación, organismos e

instituciones donde se puede acceder a datos secundarios. Es lo que se llama

Fuente de Producción de Datos. Se han seleccionado únicamente las

Fuentes que se consideran más importantes, entre las que aportan datos en el

13

campo de la Ciencias Sociales (información y producción social, política y

económica).

Para cada Fuente se hace una breve mención de los bancos de datos y bases

de datos que estos organismos e instituciones poseen. Obviamente, se trata de

una introducción, de manera que la información que se ofrece, aunque ha

tratado de ser lo más exhaustiva posible, no agota las Fuentes de Producción

de datos existentes.

Para facilitar la presentación se han distinguido entre Fuentes de Producción

de Datos nacionales e internacionales.

Fuentes de producción y bancos de datos nacionales

En esta sección se han seleccionado las Fuentes que se consideran más

importantes, entre las que aportan datos en el campo de la Ciencias Sociales, a

nivel nacional.

Para cada Fuente se hace una breve mención de los bancos de datos que

posee. Obviamente, se trata de una introducción, de manera que la información

que se ofrece no agota las Fuentes de Producción de datos existentes. Se

anima al lector igualmente a que explore cada una de estas Fuentes (ahora o

en otro momento), ya que sólo así llegará a conocerlas con la profundidad

suficiente para saber si contienen datos que puedan ser útiles para su

investigación.

Instituto Nacional de Estadística (INE)

El Instituto Nacional de Estadística es un instituto público de producción de

datos nacional cuyo origen se remonta a medidos del siglo XIX. Es el

encargado de realizar el Censo de Población y Vivienda de nuestro territorio

nacional, el Censo Electoral, La Encuesta de Población Activa (EPA), de

14

carácter trimestral, el Índice de Precios al Consumo (IPC), y la coordinación

del Padrón Municipal, realizado por cada ayuntamiento, entre otros. Comentar,

además, que cada Comunidad Autónoma y cada Ministerio, posee, así mismo,

un Instituto u Oficina de Estadística.

Se puede acceder a los datos del INE yendo directamente a la dirección

http://www.ine.es/

http://www.ine.es/inebmenu/indice.htm

Centro de Investigaciones Sociológicas (CIS)

El CIS es un organismo autónomo dependiente del Ministerio de la Presidencia

cuyos orígenes datan de medidos del siglo XX. Se dedica principalmente al

estudio, mediante encuestas, de la realidad social española.

El CIS realiza investigaciones sobre cerca de 20 temáticas diferentes, cada

temática con varias subclasificaciones a su vez. Junto con el INE, se trata de

una de las fuentes de producción más importante, y con la que sin duda vas a

tener que trabajar en algún momento.

Se puede acceder a la base de datos del CIS yendo directamente a la dirección

http://www.cis.es/cis/opencms/ES/index.html

http://www.cis.es/cis/opencms/ES/2_bancodatos/

Consejo Superior de Investigaciones Científicas (CSIC)

Es el Centro de Investigación por antonomasia en España, donde se sitúan los

mejores recursos para realizar la misma, así como importantes equipos de

investigación.

15

El Consejo Superior de Investigaciones Científicas posee una base de datos, a

la cual, no obstante, no se puede acceder. Sin poder obviar la importante labor

investigadora de esta institución, el no acceso a bases de datos producidas por

investigadores nacionales puede servir de ejemplo para mostrar un problema

con el que se pueden encontrar los investigadores: conocer que existen

investigaciones realizadas sobre temáticas de su interés pero que no se han

publicadas.

Se puede acceder la página institucional del CSIC a través del siguiente enlace

http://www.csic.es

Institut de Ciènces Politiques i Socials (ICPS)

El Institut de Ciènces Politiques i Socials es un instituto de investigación

dependiente de la Diputación de Barcelona que posee una serie de

publicaciones. Entre ellas, las relativas al mundo local aportan datos sobre la

situación económica, política y social de los municipios de diferentes países, un

aspecto de la realidad social con muchas dificultades para la recopilación de

información, debido principalmente a su dispersión.

Se puede acceder a la base de datos del ICPS a través del siguiente enlace

http://www.icps.cat/

http://www.icps.cat/investigacion

Banco de España (BE)

El Banco de España es una entidad de derecho público con personalidad

jurídica propia que hasta cierto punto, y junto con el Banco Europeo Central

(BEC), trata de organizar la economía del país, entre otras funciones.

16

Accediendo a su página Web puede consultarse una apartado dedicado a

‘Estadísticas’. La página permite acceder a la información tanto del BE como

del BEC. Sobre el primero, además de ofrecer información sobre el calendario

de publicaciones estadísticas, ofrece un elenco de información económica,

como puede ser la Encuesta Financiera de las Familias, con información de

cómo nos va a las familias españolas con las sumas y las restas….

Además, ofrece información del BCE, entre ella las estadísticas de la zona euro

por países, o las instituciones bancarias de la zona euro.

Se puede acceder a la base de datos del BE yendo directamente a la dirección

http://www.bde.es/bde/es/

http://www.bde.es/bde/es/areas/estadis/

Consejo Económico y Social (CES)

Esta institución pública de orientación consultiva elabora, entre otras cosas,

una memoria anual sobre la situación socioeconómica y laborar de España, la

cual puede bajarse desde su página Web en formato .pdf.

A diferencia de hace unos años, el CES en la actualidad no provee de Bases

de Datos, la información se localiza en informes elaborados por su personal. Se

puede acceder a la página institucional del CES a través del siguiente enlace

http://www.ces.es/.

17

Fundación Banco Bilbao Vizcaya (BBV)

La Fundación BBV es una institución privada que posee información

secundaria financiera y también sobre aspectos sociales: parejas de hecho,

políticas familiares, etc.

Se puede acceder a la base de datos del BBV yendo a la siguiente dirección

http://www.fbbva.es/TLFU/tlfu/esp/home/index.jsp

http://www.fbbva.es/TLFU/tlfu/esp/areas/econosoc/bbdd/index.jsp

Obra Social de La Caixa

La Caixa, institución financiera, posee entre sus fines la mejora de las

condiciones de vida de determinados colectivos. Realiza una serie de

publicaciones relacionadas con el voluntariado, inmigración, cooperación

internacional, que pueden adquirirse a un precio razonable.

A diferencia de unos años atrás, en la actualidad no provee de una base de

datos. Se puede acceder a la base de datos del La Caixa yendo directamente

a la dirección

http://obrasocial.lacaixa.es/

Se aprende practicando

Elección 3

¿Qué es el Instituto Nacional de Estadística?

De las siguientes opciones, ¿cuál es la definición que más caracteriza al INE?

18

1. Es un instituto de investigación privado que realiza estudios sobre la realidad

socio-política de los municipios.

2. Es un instituto de investigación público que se encarga de realizar los sondeos

electorales.

3. Es un instituto de investigación público encargado de producir los padrones

municipales

4. Es un instituto de investigación público que desde su fundación realiza la

actividad censal en el territorio nacional.

Fuentes de producción y bancos de datos internacionales.

En esta sección se han seleccionado las Fuentes que se consideran más

importantes, entre las que aportan datos en el campo de la Ciencias Sociales, a

nivel internacional.

Para cada Fuente se hace una breve mención de los bancos y bases de datos

que poseen. Obviamente, se trata de una introducción, de manera que la

información que se ofrece no agota las Fuentes de Producción de datos

existentes. Se anima al lector igualmente a que explore cada una de estas

Fuentes (ahora o en otro momento), ya que sólo así llegará a conocerlas con la

profundidad suficiente para saber si contienen datos que puedan ser útiles para

su investigación.

19

International Statistical Institute (ISI)

Esta institución, no posee propiamente un banco de datos. Para su acceso hay

que hacer una suscripción de pago, y poder consultar una serie de

publicaciones estadísticas de diversa índole. Lo interesante de esta página es

que permite acceder a los enlaces las oficinas de estadística oficiales de los

países del mundo.

Puedes acceder la web del ISI a través de la siguiente dirección

http://www.isi-web.org/

http://www.isi-web.org/infoservice/statistical-organisations

Internacional Social Survey Program (ISSP)

El ISSP es un programa anual donde colaboran diferentes países sobre tópicos

relacionados con las ciencias sociales. Los temas tratados hasta hoy han sido

muy variados, como el rol del gobierno, redes sociales y relaciones sociales,

religión, orientaciones en el trabajo, medioambiente, entre otras.

El proyecto internacional incluye 43 países, con una menor representación de

los africanos.

Se puede visitar el enlace para conocer más obre este programa

http://www.issp.org/

http://www.issp.org/page.php?pageId=4

20

Council of European Social Science Data Archives (CESSDA)

El CESSDA es una organización paraguas que agrupa a diversas

organizaciones que poseen archivos de datos en ciencias sociales de Europa.

El CESSDA posee bases de datos tanto europeas como internacionales, como

la Encuesta Social Europea (ESS), el Eurobarómetro o los datos del Programa

de la Encuesta Social Internacional (ISSP). Desde el CESSDA se puede

acceder a la ficha técnica de los estudios, y así conocer la información

contenida en los mismos y la forma en que se han realizado. Las temáticas que

se incluyen, son, entre otras: política, medio ambiente, información y

comunicación, estado de bienestar, estratificación social, educación y

economía.

Entre los datos que forman parte del CESSDA se encuentran el Danish Data

Archives (DDA), de la Universidad de Odense, el Irish Social Science Data

Archive (ISSDA), El Sociological Data Archive (SDA), de Institute of Sociology

of the Academy of Sciences of the Czech Republic de Praga, el Social

Research Informatics Center (TARKI), de Budapest.

Se puede acceder a la información de esta organizacin a través del siguiente

en lace

http://www.cessda.net/

http://www.cessda.net/catalogue/

World Values Survey (WVS)

La encuesta mundial de valores nace a principios de la década de los 80 del

siglo pasado y en la actualidad es un proyecto de investigación global. Cuenta

con la colaboración de instituciones de investigación de cerca de 100 países,

que engloban a cerca del 90% de la población mundial.

21

Su objetivo es generar un banco de datos con información estadística relativa a

valores y creencias, atendiendo a estos en campos como familia, infancia,

participación política, medio ambiente, acumulación de riqueza, espiritualidad,

democracia, y un largo etcétera.

Se puede acceder a la base de datos del WVS yendo directamente a la

dirección

http://www.worldvaluessurvey.org/

http://www.wvsevsdb.com/wvs/WVSData.jsp

United Nation Organization (UN)

La Organización de Naciones Unidad (ONU) posee una ingente información

sobre derechos humanos, paz, desarrollo económico y social, infancia, medio

ambiente, salud, mujer, por citar algunos. La información se presenta en

publicación o en bases de datos. Alguna información es posible bajarla

directamente del servidor de la página Web, si bien la mayoría de las bases de

datos tiene un precio más o menos asequible.

Se puede acceder a la base de datos de la ONU yendo directamente a la

dirección

http://www.un.org/es/

http://www.un.org/es/dataBasess/

World Health Organization (WHO)

Incluida en el sistema de las Naciones Unidas, la Organización Mundial de la

Salud (OMS), ofrece la labor de dar a conocer la situación de los asuntos

22

sanitarios a nivel mundial: índices de morbilidad, mortalidad, nacimientos,

nutrición, enfermedades, y un largo etc. Al igual que la ONU, permite su acceso

a algunos indicadores de forma gratuita, mientras que otros son mediante

pago.

Se puede acceder a la base de datos de la OMS yendo directamente a la

dirección

http://www.who.int/en/

http://www.who.int/research/en/

EUROSTAT

Este organismo, de la Unión Europea, ofrece información comparada sobre los

diferentes estados miembros de la UE. Estos datos se recogen de las

administraciones de cada país y se armonizan para que puedan se utilizados

de forma comparativa.

Se puede visitar el siguiente enlace para conocer más acerca de este

organismo

http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/

http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/search_dataBases

Organization for Economic Co-operation and Development (OECD)

Similar a Eurostat, pero ofrece información sobre un conjunto mayor de países,

incluyendo los europeos aunque no formen parte de la EU. En concreto, la

Organización para la Cooperación y el Desarrollo Económico (OCDE) es una

23

organización internacional compuesta por 30 estados cuyo objetivo es

coordinar sus políticas sociales y económicas.

Puede visitarse en enlace para familiarizarse con su base de datos.

http://www.oecd.org/

http://www.oecd.org/statistics/

World Bank (WB)

El Banco Mundial (BM) es una organización internacional propiedad de 185

países y está formada por dos instituciones de desarrollo singulares: El Banco

internacional de Reconstrucción y Fomento (BIRF) y la Asociación Internacional

del Fomento (AIF).

Su principal fin es reducir la pobreza y mejora el nivel de vida de las personas.

El WB elabora un informe anual sobre los rasgos mundiales más

sobresalientes. Además, posee un banco de datos cuyos tópicos son, entre

otros: agricultura, ayudas (deuda externa, ayudas públicas..), desarrollo de la

infancia, globalización, gobernanza, infraestructuras, macroeconomía,

población, pobreza, sectores de producción, desarrollo social y desarrollo

urbano. Se puede accede a información estadística de hasta 150 países, como

dato comparado. Algunos de ellos pueden bajarse de forma gratuita, para otros

habrías de suscribirte.

Se puede acceder a la información del BM en el siguiente enlace

http://www.worldbank.org/

http://data.worldbank.org/

24

International Monetary Fund (IMF)

En el año 1945 se creo esta organización con un número inicial de 45 países

participantes. La finalidad del Fondo Monetario Internacional (FMI) en sus

inicios se dirigía a hacer estudios macroeconómicos para conocer la estabilidad

económica mundial, y proponer parámetros para corregir los desequilibrios

económicos y las desigualdades sociales inherentes. En la actualidad la

organización cuenta con cerca de 180 países miembros y sus objetivos han

variado hacia políticas económicas y fiscales de tipo neoliberal.

Su banco de datos posee información de indicadores económicos y financieros,

movimientos de las balanzas de pagos de los países, comercio mundial,

inversiones, precios de bienes de primera necesidad, entre otros.

Se puede acceder a la información del FMI a través de este vínculo

http://www.imf.org/external/index.htm

http://www.imf.org/external/data.htm

Se aprende practicando

Multirrespuesta 4

¿Qué datos se relacionan con el CIS?

A continuación aparecen una serie de organismos internacionales que producen

bancos de datos. Se propone al lector que señale cuáles están en el sistema ARCES

del CIS

Banco Mundial (WB)

Organización para la Cooperación y el Desarrollo Económico (OECD)

International Social Survey Programme (ISSP)

Council of European Social Science Data Archive (CESSDA)

Estadisticas del Instituto Nacional de Estadística (INE)

25

Se aprende practicando

Elección 4

¿A qué banco de datos es más adecuado acudir?

Imagine el lector que tuviera de buscar datos secundarios para conocer cómo se

distribuye el porcentaje de inmigrantes entre los países miembros de la Unión

Europea. ¿A qué fuente de producción de datos acudiría, a UN o a Eurostat?

UN

Eurostat

Fiabilidad y validez de los datos secundarios

Este apartado de la unidad didáctica el tema relativo a la calidad de los datos

secundarios. Esta cuestión ha generado, y lo sigue haciendo, importantes

debates. En este apartado se presentan cuestiones relativas a estas ideas

orientadas sobre todo desde un punto técnico y práctico, sin que el debate

epistemológico y metodológico se agote en lo que aquí va a presentarse.

Para que para que la utilización de los datos secundarios en una investigación

sea adecuada y produzca resultados relevantes, se debe asegurar que se

utilizan datos válidos y fiables. Los datos serán válidos y fiables en la medida

en que se hayan recogido/producido con instrumentos válidos y fiables. Pero

¿qué significa que un instrumento es válido y fiable? ¿y cómo se puede

asegurar que ha sido así si se utilizan datos secundarios, es decir, si el proceso

de producción de los mismos no ha dependido del investigador o investigadora

que los va a usar? Estas son las dos cuestiones a las que trataremos de

responder en esta sección.

26

Para introducirnos en el tema podemos recoger la definición sobre fiabilidad y

validez realizada por Kirk y Miller (1986:19).

Validez: el punto en el que el procedimiento mide exactamente lo que quiere

medir.

Fiabilidad: el punto en el que un procedimiento de medición produce la misma

respuesta con independencia de quien la lleve a cabo.

Schutt (2001) define que un instrumento es fiable cuando produce medidas

consistentes, que no cambian cuando el objeto que está siendo medido

tampoco lo hace, o que cambia de acuerdo a los cambios que se producen en

el objeto que está siendo medido. Por ejemplo, una balanza es fiable devuelve

siempre el mismo peso si no hay variación, y devuelve una medida superior

cuando se engorda, o inferior cuando se adelgaza.

El procedimiento es valido, en cambio, si ofrece información sobre lo que se

desea conocer. Alvira (2000:101-102), considera que la validez se resuelve

cuando existe una adecuación entre los objetivos propuestos en la

investigación y la forma en que tratan de medirse. Si se utilizan unos

instrumentos que consiguen arrojar luz sobre los objetivos de la investigación,

se está atendiendo a criterios válidos de medición. Por ejemplo, si se sabe que

el agua inicia la ebullición en los 100º, y se conoce que el mercurio se expande

linealmente con la temperatura, un termómetro construido con mercurio sería

un criterio valido para medir el concepto de ebullición (ejemplo tomado de Kirk

y Miller,1986:19-21).

Un procedimiento fiable normalmente produce un resultado válido. En el

ejemplo anterior, mediciones sucesivas de agua en ebullición a los 100º indican

27

un procedimiento fiable. En cambio, es difícil que se produzca un criterio de

validez si el procedimiento no es fiable. Siguiendo con el ejemplo anterior, el

termómetro puede marcar 80º, 100º y 110º, en tres tomas que se han realizado

cuando el agua llega a ebullición. El procedimiento no es fiable (el termómetro

parece estar roto), por lo tanto, aunque el criterio de validez se observe (un

termómetro es un instrumento que sirve para medir la temperatura) los

resultados no son válidos (no hay adecuación entre lo que se quiere medir y lo

que se mide realmente).

También puede ocurrir que el dato sea fiable, técnicamente hablando, pero que

no sea válido. Supongamos que se va un bar, donde se sabe que se consume

hachís, a aplicar un cuestionario. Todas las personas del bar al responder al

cuestionarios dicen que no consumen hachís. Pero se sabe que no es cierto,

pues se les ha hemos visto fumar. El procedimiento en sí, técnicamente es

fiable (siempre produce la misma respuesta-no se fuma hachís), pero no es

válido. Si la validez se define como la adecuación entre los objetivos y la forma

en que se trata de medirlos, el cuestionario no parece ser, en este caso, el

instrumento más adecuado para medir nuestro objetivo.

En todo caso, para obtener datos fiables, es necesario insistir en la búsqueda

de diferentes fuentes que permitan contrastar el dato en sí. Más abajo se

profundiza en estas cuestiones, y se insiste al lector o lectora en no olvidar la

estrecha relación entre validez y fiabilidad para obtener una fuente de

información útil.

Se aprende practicando

Elección 5

¿Qué instrumento/medida es más válido y fiable?

Para ilustrar la fiabilidad y validez de una medida, se pueden comparar dos

28

instrumentos diferentes. El lector puede imaginar que un agente de policía quiere

saber si una persona ha consumido drogas… Puede preguntarle directamente a esa

persona si lo ha hecho, o puede realizar un análisis de sangre. ¿Cuál de los dos

instrumentos cree que es más válido, y por tanto fiable? Es decir, ¿cuál cree que el

que produce con mayor probabilidad la misma repuesta?

1. La pregunta.

2. El análisis de sangre.

Para recordar

Algunos instrumentos de medida pueden producir datos muy fiables, pero no

válidos. Imagina el caso de una persona obsesionada con su peso, que

utiliza una balanza con una tara de 10 kilos. La balanza ofrece pesos fiables:

si el sujeto mantiene el peso, la balanza devuelve siempre la misma cantidad

de kilos; cuando el sujeto sube de peso, la balanza devuelve una cantidad

de kilos mayor; y cuando el sujeto baja de peso, la balanza devuelve una

cantidad de kilos más baja. Pero la medida no es fiable, porque el peso es

sistemáticamente 10 kilos inferior al real. Luego no se mide lo que se quiere

medir, que el peso real del sujeto.

Como establecer la fiabilidad y validez de los datos secundarios

A continuación se indican algunos aspectos que sería conveniente tener

presentes cuando se busquen datos en Internet para su explotación.

En general, lo primero a tener en cuenta cuando se utilicen datos

secundarios es la presencia de lo que se llama documento metodológico

29

(también llamado metadata) y ficha técnica. La existencia de estos

documentos está indicando que existe cierta rigurosidad en el proceso de

producción de los datos. Si no hay un documento metodológico o ficha

técnica que los sustente se puede desconfiar de su validez y fiabilidad.

Es importante conocer cuál es el organismo e institución que genera los datos.

Si el Centro de producción de datos goza de cierto reconocimiento, en cuanto a

la seriedad el trabajo que hace, más probabilidad de que los datos se hayan

producido de forma valida y fiable.

Sobre la fiabilidad de los datos:

- Una manera de observar si el dato es fiable es utilizando un mecanismo de

control consistente en buscar bases de datos que contenga el mismo dato que

se busca. Si las bases de datos no varían de forma chirriante el valor del dato

que presentan, los datos gozan de más fiabilidad. Si no es así, es importante

tratar de conocer, a partir del documento metodológico, cómo se ha realizado la

recogida de información. Puede que la forma en que se han producido difiera, y

por tanto, el dato a mostrar.

- Otra forma de observar si el dato es fiable es contrastar con expertos sobre la

bondad de los mismos. Puede haber personas de la administración que puedan

ayudar a resolver dudas, o indicar personas o grupos a los que poder dirigirse.

- En el documento metodológico:

• Se aconseja hacer una copia del cuestionario y la descripción del

fichero. Ello permitirá ver si las preguntas se han elaborado para recoger

de forma exhaustiva y excluyente las categorías de respuesta.

30

• Se aconseja buscar una descripción del fichero de datos, cuáles son las

variables, y si la codificación se ha realizado de forma correcta.

Sobre la validez de los datos:

- Cuando se trabajo con datos primarios el investigador o investigadora

establece la correspondencia que debe haber entre el concepto que se quiere

medir y la variables a la que finalmente se llegan, mediante el proceso de

operacionalización. Sin embargo, en el caso de los datos secundarios, no es el

propio autor el que ha operacionalizado los conceptos, de manera que la lógica

cambia sutilmente. En esta situación lo que hay que justificar es que el dato

secundario, tal y como ha sido medido, pueda formar parte de la

operacionalización posible del concepto que interesa medir en la investigación.

- En el documento metodológico o en la ficha técnica:

• Observar si queda bien indicado el tipo de muestreo, si el tamaño de la

muestra es el correcto, cuál es el error muestral.

• Observar cuál ha sido la tasa de respuesta.

• Observar si se han incluido las características o el tratamiento de la no

respuesta.

Se aprende practicando

Multirrespuesta 5

Fiabilidad de los datos

A continuación aparecen una serie de cuestiones relativas a la fiabilidad. Se invita

al lector a señalar cuáles son correctas.

31

1. Los mecanismos de control reducen la fiabilidad de los datos.

2. Conocer la forma de realizar las preguntas y sus categorías de respuesta permite

evaluar la fiabilidad del dato.

3. Conocer la forma en que los datos se han codificado aporta información sobre su

fiabilidad.

4. Poder comparar el dato en dos bases de datos diferentes permite evaluar su

fiabilidad.

Se aprende practicando

Multirrespuesta 6

Validez de los datos

A continuación aparecen una serie de cuestiones relativas a la validez. Se invita al

lector a señalar cuáles son correctas.

1. La validez aumenta si se conoce que la muestra es representativa.

2. El error muestral no se asocia con la validez de la investigación.

3. Si los datos no se ajustan a los indicadores establecidos en el proceso de

operacionalización habrá un problema de validez.

4. Si la tasa de no respuesta es muy alta la validez de la información debe

cuestionarse.

Validez y fiabilidad a través del documento metodológico y la ficha técnica

El documento metodológico y la ficha técnica que debe acompañar a cualquier

conjunto de datos secundarios recoge información identificativa de las bases de

datos de las que proceden. Esta información proporciona conocimiento sobre

cómo se ha realizado la obtención de los datos, cuando se realizó su

32

localización, donde se ha procedido a recoger el dato, quién ha participado en

el proceso, entre otras cosas.

El documento metodológico o metadatos, y la ficha técnica, son las

herramientas más eficaces que posee el investigador o investigadora para

conocer la validez y fiabilidad de los datos. Se hará uso de estas

herramientas para establecer hasta que punto la información se ha

obtenido con cierta rigurosidad y sistematicidad. Por ello, cuando una base

de datos carece de esta información, se debe dudar que dichos datos se

hayan producido de forma válida y fiable.

Por tanto, antes de recopilar cualquier base de datos, es conveniente localizar

la ficha técnica y/o el metadatos para saber si es adecuado el uso o no de la

misma. Algunos datos en soporte papel no indican el documento metodológico

o la ficha técnica que les precede. Sin embargo deben hacer constar la Fuente

de donde se han recogido, para que el investigador pueda acudir a la misma y

localizar la ficha técnica de los datos.

La información que aparece en el documento metodológico no es la misma de

la ficha técnica. Normalmente el metadato es más completo, ya que suele

incorpora el documento de la ficha técnica e información adicional.

El documento metodológico trata de introducir en un único documento

información relativa al cuestionario que se aplicó, cómo se ha realizado la

codificación de las variables, el procedimiento para estandarizar variables

diferentes, la ficha técnica, los participantes en el proyecto, etc.

33

La ficha técnica recoge normalmente información asociada sólo a la forma

en que se aplicó el cuestionario: cuando se realizó, donde, a qué

población, su muestra, el error muestral, etc.

¿Cómo es una ficha técnica?

Este es un ejemplo del aspecto que tiene una ficha técnica. La ilustración 2

presenta la ficha técnica de un estudio del CIS. Invitamos al lector o lectora a

que piense que información está ofreciendo que sea relevante para conocer la

validez y fiabilidad de los datos secundarios.

Ilustración 2. Elementos de una ficha técnica

La ilustración 3 muestra esa misma ficha técnica con comentarios sobre los

elementos que permiten conocer la validez y la fiabilidad del estudio.

Ilustración 3. Ficha técnica y validez y fiabilidad

Recapitulemos

Este documento ha mostrado algunos aspectos para la utilización de datos

secundarios. En un principio se ha definido el término datos secundarios,

diferenciándolo de los datos primarios. Además, hemos tratado de que

conozcas su relación con los conceptos de datos agregados y de estadísticas,

por un lado, y datos desagregados y encuestas, por otro.

34

Además, se ha insistido en que sean consciente de la utilidad del dato

secundario, para así ayudarte adoptar decisiones en cuanto a la idoneidad de

su uso en atención a los objetivos o preguntas de la investigación.

En un segundo momento se te han comentado algunas fuentes de producción

de bancos de datos relacionadas con cuestiones de índole social, política y

económica, su acceso y las bases de datos que puedes encontrar en ellas.

En un tercer momento se te han mostrado los instrumentos que puedes utilizar

para conocer cómo se realizaron las encuestas y estadísticas, el documento

metodológico y la ficha técnica. Con esta información reduces problemas de

fiabilidad y validez que están presentes en cualquier investigación, es decir,

conoces información sobre la bondad técnica de los datos.

Para terminar, se ha tratado de que aprendas como exportar una base de

datos, a fin de que puedas realizar cualquier manipulación con los datos

existentes en la misma.

Por lo tanto, qué es un dato secundario, para qué sirve, cómo reconocer si es

fiable y válido y cómo acceder a él son los aspectos básicos que has conocido

en esta unidad didáctica, que esperamos haya sido de tu agrado.

35

Bibliografía

• Alvira Marín, Francisco. 2000. ‘Diseños de investigación social: criterios

operativos’, en García, Ibáñez y Alvira, El análisis de la realidad social.

Madrid: Alianza, 99-128.

• Cordero Valdivia, Magdalena. 1998. Bancos de Datos. Madrid:CIS.

• Gónzalez Rodríguez, Benjamín. ‘Nuevas perspectivas en la explotación

y aprovechamiento de los datos secundarios’, en García, Ibáñez y Alvira,

El análisis de la realidad social. Madrid: Alianza, 299-342.

• Kirk, Jerome y Millar, Marc L. 1986. Reliability and validity in qualitative

research. London: Sage.

• McCaston, M. Katherine. 1998. ‘Tips for collecting, reviewing, and

analyzing secondary data’, en Partnership and Household Livelihood

Security Unit (PHLS), www.livelihoods.org/.../docs/work/SL

%20Nepal/Reference%20Sheets/Tips%20for%20Using%20Secondary

%20Data.doc,

• Rodriguez, Vicente y Asián, Rosario. 2006. Indicadores y fuentes

estadísticas para el análisis de los mercados de trabajo. Sevilla:

Consejería de empleo.

• Schutt, Russell K. 2001. Investigating the social world. Thousand Oaks:

Pine Forge Press.

36

Anexo 1. Gráficas e ilustraciones

Ilustración 1. Nuevos enfoques respecto a la utilidad de los datos secundarios (González, 2000:333)

Perspectiva tradicional Perspectiva actual

Estudio de la naturaleza de los fenómenos subyacentes (p.e. descubrir la naturaleza de las relaciones multivariantes entre variables)

Orientación a las aplicaciones (p.e.: búsqueda de soluciones que permitan buenos pronósticos)

El analista lleva a cabo un análisis manual

El analista realiza un análisis electrónico (automatizado o semi-automatizado)

Trabajos sobre pocos datos Trabajo con millones de datosNo almacenamiento Almacenamiento masivo de informaciónÉnfasis en la recogida de datos Énfasis en el análisis de datosAcumulación de datos muy lenta ( o no acumulación)

Acumulación rápida de datos/información

Utilización de técnicas tradicionales de análisis (algo de estadística)

Utilización de nuevas técnicas analíticas y de otro tipo

En cada proyecto trabaja con una sola base de datos

En cada proyecto se trabaja con múltiples bases de datos

El investigador trabaja generalmente aislado

El investigador trabaja conjuntamente con otros investigadores de muy distintas áreas

El investigador se mueve con datos referidos a ámbitos locales y/o nacionales

El investigador se mueve con datos de ámbito internacional

El investigador formula preguntas concretas/específicas

El investigador/analista formula preguntas generales

Trabaja con métodos y técnicas que tiene supuestos más rígidos (normalidad, variables métricas…)

Utiliza técnicas cuyos supuestos son menos rígidos

Trabajo con métodos consolidados Busca nuevos métodos y estrategiasUsa datos primarios con más frecuencia Recurre a –y explota datos- ya existentes

(secundarios)

37

Ilustración 2. Elementos de una ficha técnica

ESTUDIO CIS Nº 2.663 LATINOBARÓMETRO, 2006 (IX) FICHA TÉCNICA Ámbito: Nacional. Universo: Población española de ambos sexos de 18 años y más. Tamaño de la muestra: Diseñada: 2.500 entrevistas. Realizada: 2.476 entrevistas. Afijación: Proporcional. Ponderación: No procede. Puntos de muestreo: 237 municipios y 48 provincias. Procedimiento de muestreo: Polietápico, estratificado por conglomerados, con selección de las unidades primarias de muestreo (municipios) y de las unidades secundarias (secciones) de forma aleatoria proporcional, y de las unidades últimas (individuos) por rutas aleatorias y cuotas de sexo y edad. Los estratos se han formado por el cruce de las 17 comunidades autónomas con el tamaño de hábitat, dividido en 7 categorías: menor o igual a 2.000 habitantes; de 2.001 a 10.000; de 10.001 a 50.000; de 50.001 a 100.000; de 100.001 a 400.000; de 400.001 a 1.000.000, y más de 1.000.000 de habitantes. Los cuestionarios se han aplicado mediante entrevista personal en los domicilios. Error muestral: Para un nivel de confianza del 95,5% (dos sigmas), y P = Q, el error real es de ±2,0% para el conjunto de la muestra y en el supuesto de muestreo aleatorio simple. Fecha de realización: Del 25 de noviembre al 1 de diciembre de 2006.

38

Ilustración 3. Ficha técnica y validez y fiabilidad

39

Anexo 2. Soluciones de 'Se aprende practicando'

Elección 1

Distingue datos primarios y secundarios

1. Primarios: acciones 3 y 5; 2. Secundarios: acciones 1, 2 y 4.

Multirrespuesta 1

¿Cuáles son datos secundarios?

Excepto en el primer caso (1), todos son datos secundarios.

Multirrespuesta 2

¿Cuáles son datos secundarios útiles?

Excepto en el primer caso (1), todos son datos que pueden ser de utilidad. En el

primer caso los datos se refieren a las cuentas estatales, no empresariales.

Multirrespuesta 3

¿Cuáles son datos agregados?

Excepto en los casos (3) y (5), el resto se trata de datos agregados. En (3) se maneja

un dato que se refiere a la opinión particular de un individuo: se trata de un dato

desagregado que se podría recoger, por ejemplo, a través de un cuestionario. En (5)

hay también un dato particular respecto al número de hijos de una mujer.

En ambos casos, se podrían agregar los datos de diferentes individuos y producir

un dato agregado (porcentaje de personas a favor del aborto en una región

40

determinada, en el primer caso, por ejemplo; o la tasa de fecundidad del país, en el

segundo).

Elección 2

¿Cuáles son datos agregados y desagregados?

Agregados: 3, 5, 6, y 7; Desagregados: 1, 2, y 4. La información que posee sobre

cada uno de los alcaldes constituyen datos desagregados, ya que se refieren a

individuos (en este caso cada uno de los alcaldes). La información sobre las

ciudades y municipios gobernados por esos alcaldes, constituyen datos agregados,

ya que se refieren a una unidad geográfica o territorial.

Elección 3

¿Qué es el Instituto Nacional de Estadística?

La respuesta (4) es la definición más adecuada del INE. La opción (1) no es

correcta porque no es un centro de investigación privado. La opción (2) no es

correcta porque el INE no realiza los sondeos electorales, cuestión que realiza

sobre todo el CIS. La opción (3), por último, no es del todo correcta, pues el INE

coordina los padrones municipales, pero son los ayuntamientos los encargados de

su realización.

Multirrespuesta 4

¿Qué datos se relacionan con el CIS?

41

El ISSP y el CESSDA forman parte del Sistema ARCES del CIS.

Elección 4

¿A qué banco de datos es más adecuado acudir?

Acudiría en primer lugar a Eurostat, pues es la oficina de estadísticas de la UE y

donde con más probabilidad encontraría el dato ya comparado. En El banco de

datos de Naciones Unidas puede ser que se localice esta información también, pero

podría costar más trabajo localizarla.

Elección 5

¿Qué instrumento/medida es más válido y fiable?

2. El análisis de sangre. La pregunta está sujeta a la deseabilidad social, ya que el

consumo de drogas suele ser un comportamiento sancionado social y legalmente.

Por tanto, aunque una persona consuma drogas, si se le pregunta es probable que

diga que no lo hace. Si la pregunta no se adecua a lo que verdaderamente queremos

conocer, sería mejor optar por otra forma de recoger la información.

El análisis de sangre u orina, por el contrario, no está sujeto a la deseabilidad

social. Dirá con exactitud si una persona ha consumido drogas, con los márgenes de

error aceptables en que cualquier instrumento de medición puede incurrir.

Multirrespuesta 5

Fiabilidad de los datos

Las afirmaciones 2, 3 y 4 son correctas. Conocer los mecanismos de control, la

forma de realizar las preguntas, la forma de codificarlas y la posibilidad de

42

comparar el dato aumentan la fiabilidad de la investigación.

Multirrespuesta 6

Validez de los datos

Las afirmaciones 1, 3, y 4 son correctas. Una muestra representativa, con un error

muestral aceptable, con datos ajustados a los indicadores que quieren medirse y

con una tasa de no respuesta baja aumentan la validez de la investigación.

43