El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales

21
El Big Data como fenómeno y herramienta para el eresearch en CSyH Digitales Imagen de Web Design Hot. Fuente http://www.freepik.com Dra. María Sánchez González Profesora Asociada e investigadora Periodismo UMA/ Técnico Innovación UNIA/ Miembro de @GRINUGR [email protected]/ @cibermarikiya Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”

description

Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”. *Aportación enmarcada en Proyecto de Investigación “Ciencias Sociales y Humanidades Digitales: casos, gestión y modelos de negocio” (Campus de Excelencia Internacional BioTic Granada, convocatoria 2013). *Próximamente disponible en monográfico CAC.

Transcript of El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales

El Big Data como fenómeno y herramienta para el e‐research en 

CSyH Digitales

Imagen de Web Design Hot. Fuentehttp://www.freepik.com

Dra. María Sánchez GonzálezProfesora Asociada e investigadora Periodismo UMA/ Técnico Innovación UNIA/ Miembro de @[email protected]/ @cibermarikiya

Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”

Introducción: evolución de los datos en el ecosistema digital

Los datos han existido siempre…•Huella digital de entidades e individuos (búsquedas, navegación en red…).

•Las empresas del sector de la Economía digital buscan convertir datos en valor: desarrollo de sistemas de búsqueda personalizados; recomendaciones… en los últimos años. Sin ellas empresas como Google o Facebook no existirían de la misma manera hoy (Mayer-Schönberger, OII).

•Todos basados en el mismo principio, el almacenamiento y la utilización de datos masivos, y en tecnologías y estándares propios de la web semántica(término acuñado por Berners-Lee hace dos décadas).

Fuente de imagen: Victor V. Varela http://www.pinterest.com/pin/109564203404688024/

… Pero hoy vivimos en “the Age of Big data”. Factores clave

Crecimiento exponencial de datos: superan la capacidad de procesamiento de los sistemas convencionales (Strata Conference, O’Reilly).

“Three converging ‘perfect storms’”: computing, data y convergence(Big, Data, Big Analytics, Minelli et al, 2013): crecimiento anual del volumen de datos generados online de un 40%.

“Squared web” o web2 (participación + sistemas de inteligencia artificial):-Buena parte de los datos procede de usuarios conectados redes sociales a través de diversos dispositivos, incluyendo los móviles.-A más participación, más sensores alimentando aplicaciones en tiempo real.

Datos enlazados e interdependientes: Linked data: tecnologías que promueven la interconexión de datos y

facilitan su acceso y recuperación.

Los datos dejan de ser dependientes o independientes para convertirse en interdependientes

Posibilidad de tratamiento masivo de datos

Fuente: FICO. En http://bit.ly/1842rsk

“Big Data Analytics” como nueva forma de tratamiento y análisis de datos ante esta complejidad (Calero, 2013).

Nuevas vías para la investigación (técnicas y herramientas) y fenómeno poco explorado en CSyH Digitales.

open data, o-gov y transparencia, movimientos impulsores del big data

- Iniciativas que, desarrolladas bien por instituciones públicas (gobierno abierto), bien por colectivos de activistas, suponen, así, una oportunidad para la apropiación ciudadana del big data y el desarrollo de disciplinas como el periodismo de datos.- Las propias empresas de Economía Digital aprovechan esta apertura de datos y fomentan su utilización: Google Data Public.

Open data: los datos públicos en abierto (la nube pública) como base.

¿Big-Linked-Open Data?Empieza a ser posible disponer de un ecosistema digital compuesto por grandes bases de datos interconectados y abiertos de acceso público.

Análisis panorámico, exploratorio y cualitativo en torno al fenómeno big data y a sus posibles aplicaciones (e

implicaciones) para el e-research en CSyHD

• Acotar la significación, conforme al contexto actual y diferenciándolo de otros relacionados con el auge de los datos en red, el término big data.

• Identificar colectivos relacionados con la difusión y el análisis del fenómeno del bigdata, así como los nuevos perfiles profesionales y de investigadores que, como el llamado científico de datos, comienzan a demandarse.

• Explorar sobre incidencia del Big Data en la llamada Ciencia de los Datos y su función en la Nueva Ciencia de Redes.

• Describir técnicas de procesado y representación de datos masivos en red, como el llamado visual analythics, que facilitan la labor de investigadores.

• Detectar y analizar tendencias y casos significativos de uso del big data en los principales campos de conocimiento de las Ciencias Sociales y Humanidades.

Objetivos específicos

MetodologíaFuentes bibliográficas y fuentes hemerográficas online

Localización, análisis y taxonomía de iniciativas relevantes sobre big data(función del big data y aplicación; disponibilidad de resultados/herramientas en red y

potencial replicabilidad; destinatarios; promotores…).

Planteamiento de estudio

Big data: concepción y auge en el contexto actual

Primeras definiciones, aluden a datos masivos:

“Data that exceeds the processing capacity of conventional database systems” (Dumbill, 2012)

“Combinación entre algoritmos, tecnologías y estrategias, capaces de capturar y analizar grandes volúmenes de datos provenientes de múltiples fuentes heterogéneas a una alta velocidad, de forma económica y a tiempo real” (Paniagua, 2013)

Pero no sólo referido por tanto a datos masivos o macrodatos, sino también a su tratamiento

Desarrollo

Objetivo: convertir datos en conocimiento

Fuente: IBM. What is big data? En http://www.ibm.com/big-data/us/en/

Las 4 dimensiones o V’s del big data según IBM

La quinta V= VisualizaciónImportancia de la representación visual, comprensible, de los datos (Tascón, 2013)

Soluciones basadas en big data

Doble funcionalidad:

•Consultas/ bases de datos. Permiten acceder a grandes cantidades de información, en distintos formatos y en tiempo real; manejarlos, filtrarlos…

•Visualizaciones de datos. E integran sistemas de visualización para mostrar estos datos o, incluso, crear visualizaciones personalizadas y publicarlas...

Ciencia de los Datos como híbrido entre informática tradicional, matemáticas y arte.

En empresas del sector de la Economía Digital. El caso de Google: El gráfico del conocimiento (2012)/ Google Flu y Google Dengue Trends/ Hadoop/ Google Big Query…

En otros sectores: medicina, banca, comunicación, educación…Y adopción por parte de propias empresas

Implicaciones del big data para el e-research: nuevas Ciencias y Técnicas

La Ciencia de los Datos y su transformación con Big Data:Análisis más certeros y profundos, “transformar grandes volúmenes de datos en

inteligencia” (Paniagua, 2013).Dos grandes utilidades:

1. Seguimiento de información en tiempo real.2. Análisis de tendencias y prospectiva.

Visual analythics como técnica de visualización y análisis de grandes cantidades de datos

Ciencia del razonamiento analítico facilitada por interfaces visuales interactivas” (Thomas y Cook, 2005)

Proliferación de utilidades online que extraen información de cuestiones complejas y la representan visualmente, facilitando su comprensión para su estudio o toma de decisiones: grafos; información geoposicionada o espacio-temporal…

Ejemplo: Esteban Moro (UC3M): estudio sobre la influencia del comportamiento de usuarios en difusión de la información y viralidad a través de redes sociales (matemáticas). Fuente: http://www.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/claves_difusion_informacion

Sinergia entre Big Data y la Nueva Ciencia de las RedesAnálisis experimental y estudio de su naturaleza, nodos… de forma más ágil,

gracias a la proliferación de data sets para el modelado de datos y la simulación y de tecnologías de visualización automática e inteligente de estas redes, online.

Big data y análisis de redes en la investigación aplicada• Precedir, prevenir y personalizar (ej. Sanidad).• Monitorizar a tiempo real la reputación digital de una entidad o la visibilidad de determinados

mensajes en redes y comunidades virtuales, detectar temas que interesan al público o líderes de opinión, analizar preferencias o hábitos de consumo… (comunicación y marketing digital)

• Identificar y seguir en tiempo real de patrones anómalos de seguimiento en red (ej.Ciberterrorismo).

• …

Demanda de nuevos perfiles profesionales: científicos de datos o data scientifics; expertos en big data…

Iniciativas y colectivos centrados en su análisis, divulgación y promoción:

Capacitación para el big data: primeras iniciativas por universidades y otras entidades, orientadas a

capacitación técnica: ¿qué ocurre con científicos de CSyH?

- O’Reilly y sus Conferencias Strata, iniciadas en 2011 en California. - En el caso español, Asociación Española de Linked Data (AELID)/

Grupo Macrodatos/ programas en fundaciones de grandes empresas (Telefónica, BBVA…)

Consecuentemente…

Exploración en torno al fenómeno desde la AcademiaInformes, análisis técnicos o reflexiones sobre iniciativas determinadas…Desde perspectiva de “Predictive Analytics”/ “Intelligence Business”.Casos significativos de centros/organismos de investigación adscritos a universidades.…

…O como herramienta para la investigación académica:construcción de aplicaciones web basadas en big data y visualizaciónde datos

NameGevDev, an online application forFacebook that allows “capture, analyse, and visualise your Facebook network”(Hogan)

http://apps.facebook.com/namegendev/

El caso del Oxford Internet Institute (Universidad de Oxford) en CSyHD

Big data como objeto de estudio…“Accessing and Using Big Data to Advance Social Science Knowledge” (Meyer)http://www.oii.ox.ac.uk/research/projects/?id=98

“The InteractiveVis project” (http://blogs.oii.ox.ac.uk/vis/?page_id=25), oninteractive visualization in the University of Oxford, and funded by JISC (2012).

Fuente: Twitter Network of @OIIOxford viaOxford Internet Institute

Ejemplos, demos y noticias en este blog: http://blogs.oii.ox.ac.uk/vis/

Y ofrece online recursos para el análisis de datos o sistemas interactivos de visualización, fruto del trabajo de investigadores

El valor del big data para el e-research en CSyH. Posibles aplicaciones, objetos de estudio y

radiografía de casosEstudios macroscópicos: macrodemografías, macroanálisis de contenidos… (no posibles de otra forma. Importante considerar el contexto yesencial función de investigadores como intérpretes en análisis cualitativos).

Exploraciones sobre la marca digital e influencia de personas o entidades en redes sociales (aplicaciones online basadas en visual analythics, como Klout. Escasamente personalizables, y muchas de pago).

Análisis de percepciones, clima social u opinión pública mediante sistemas de escucha activa online

Herramientas que proporcionan rankings y sistemas de escucha activa online, claves en seguimiento de campañas electorales y potencial de anticipación/control de votos.

Ej: elecciones de USA de 2012. Fuente de imagen: http://enteratech.com.mx/2012/11/08/el-papel-del-big-data-en-las-us-elections-2012/

Investigación sobre audiencias sociales (macroanálisis de perfiles y preferencias…. Alternativa/complemento a audiometrías clásicas para consumos transmediáticos).

Estudios antropológicos y sociológicos con big data: comprender el comportamiento humano (Ej: “The Human Face of Big data”, proyecto colaborativo basado en aportaciones de usuarios sobre vida cotidiana. Ver http://www.thehumanfaceofbigdata.com/).

Estudios geolocalizados y mapeados sobre usuarios en redes sociales para analizar posibles correlaciones (Ej. “Hedonometerproject” de Universidad de Vermont, análisis de niveles de felicidad de forma geolocalizada y correlación con otros factores: salud, fechas… Ver: http://hedonometer.org/about.html)

Fuente de imagen: http://onehappybird.com/2013/02/18/where-is-the-happiest-city-in-the-usa/

Herramienta para la investigación sobre e-learning y enseñanza-aprendizaje en red (sistemas métricos sobre PLEs de Knewton y Junyo; nuevas posibilidades de macroetnografías digitales ante MOOCs…)

Herramienta para la estrategia y prospectiva: modelos predictivos basados en big data en CSyHD:

-Ej: estudios de Preis y Mota, Universidad de Boston, en revista Nature, que correlacionan PIB de países con búsquedas en Google sobre presente/pasado; alertas tempranas sobre términos financieros…

-Limitaciones del big data en prospectiva: ruido estadístico. Fuente de imagen:

http://www.nature.com/srep/2012/120405/srep00350/full/srep00350.html#results

Incidencia sobre e-research en CSyH:

-Transformación en el modo de investigar online y nuevas posibilidades: técnicas de análisis inteligente de datos masivos sobre diversos fenómenos; sistemas de visualización en red (fuentes/herramientas para presentar resultados…).

-Demanda de nuevos roles expertos en big data y de competencias de investigadores (análisis de datos).

- Necesidad de equipos multidisciplinares y de la colaboración entre áreas: expertos en big data en CSyH y científicos sociales que den contexto e interpreten datos cuantitativos de otras áreas.

Discusión y conclusiones: oportunidades y retos del big

data en CSyHD

Fuente de imagen: FICO, en http://bit.ly/1b8bruB

Limitaciones actuales del big data:

-Barreras culturales “to data-driven change” y retraso y temores en adoptar las correspondientes tecnologías (“laggards and luddites”) por parte de determinadas entidades (Croll, 2013) -Solvencia de datos y riesgo de manipulación: ¿cómo comprobar fuentes y filtrar datos?-Escasa fiabilidad o validez de los resultados de determinadas investigaciones: “antropología de datos” (Croll, 2013), esencial (ej. Haití).-…

El “small data” como alternativa o complemento:

- Pequeños datasets que pueden ser almacenados y procesados a través de un simple ordenador personal. - Instrumento de visualización y empoderamiento colectivo del big data/ última fase de los procesos asociados a éste (los grandes volúmenes de datos se traducen en aplicaciones concretas asociadas a determinados objetivos).

En cualquier caso, ambos modelos, small y big data, no son excluyentes, y su combinación abre nuevas posibilidades

al e-research.

*Aportación enmarcada en Proyecto de Investigación “Ciencias Sociales y Humanidades Digitales: casos, gestión y modelos de negocio” (Campus de Excelencia Internacional BioTic Granada,

convocatoria 2013).*Próximamente disponible en monográfico CAC.

Muchas gracias Dra. María Sánchez GonzálezExposición para el Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”

Mis coordenadas online

Algunos de mis canales en la web social:

Blog personal (marca, espacio centralizador): www.cibermarikiya.com

http://pinterest.com/cibermarikiya/…

http://paper.li/cibermarikiya/

http://storify.com/cibermarikiya

http://www.slideshare.net/cibermarikiya

http://prezi.com/user/cibermarikiya/

http://issuu.com/cibermarikiya

http://www.twitter.com/cibermarikiya

http:// www.facebook.com/cibermarikiya

http://es.linkedin.com/in/cibermarikiya

http://unia.academia.edu/mariaSanchez

http://www.diigo.com/user/cibermarikiya