Open Data Day: Extraccion y visualizacion de datos
-
Upload
janneth-chicaiza -
Category
Education
-
view
147 -
download
2
Transcript of Open Data Day: Extraccion y visualizacion de datos
![Page 1: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/1.jpg)
International Open Data Hackathon
Extracción y Visualización de datos
Janneth Chicaiza Ma. del Carmen Cabrera
![Page 2: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/2.jpg)
Extracción de datos
• Conjunto de métodos y procesos que permiten extraer datos escondidos de documentos como PDFs, páginas web. Donde no se puede acceder a los datos fácilmente para reutilizarlos.
![Page 3: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/3.jpg)
Extracción de Datos
Extracción de datos
![Page 4: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/4.jpg)
Herramientas de Extracción de datos
Tipo/Licencia Formatos de entrada
Formatos de salida
Web/Free Trial Archivo PDF Excel - CSV - XML
Escritorio / Free Trial Página Web HTML - CSV - Excel - JSON - SQL - VCARD
Tabula WEB/Free/GitHub PDF Excel - CSV- TSV - JSON - SCRIPT
import.io Escritorio/Free Trial PDF CSV - Excel
WebHarvy Escritorio/Free Trial Páginas Web XML- CSV - JSON - TSV - SQL
![Page 5: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/5.jpg)
Herramientas de recuperación
RdfLib
Sesame
![Page 6: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/6.jpg)
Herramientas de extracción
• calcula el número de elementos por página.
• permite seleccionar los elementos de la pagina web a extraer.
• permite editar los datos extraídos.
• exporta a: html, csv, txt, excel, json, xml, sql.
![Page 7: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/7.jpg)
Herramientas de extracción
• se levanta en el localhost, 8080
• transforma archivos pdfs.
• función de autodetección de tablas.
• tiene dos métodos de extracción: Stream, Lattice.
• exporta a: csv, tsv, json, zip csv’s, script.
Tabula
![Page 8: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/8.jpg)
Caso de aplicación
![Page 9: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/9.jpg)
Ranking de investigadores uruguayos• Fuente de datos: Ranking Web of Universities (RWU).
• RWU proporciona una lista ordenada de investigadores de instituciones de un determinado país.
• El ranking se calcula de acuerdo a sus perfiles públicos de Google Scholar Citaciones.
• Los datos corresponden a septiembre de 2015.
http://www.webometrics.info/en/node/79
![Page 10: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/10.jpg)
Scimago Institutions Ranking (SIR)• Ranking anual elaborado por Scimago.
• Incluye a todas las instituciones de educación superior de los países que componen Iberoamérica con al menos 1 documento (artículos, revisiones, cartas, conferencias, etc.) de la base de datos Scopus.
h"p://www.scimagoir.com/pdf/iber_new/SIR%20Iber%20ECU%202010%20HE.pdf
![Page 11: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/11.jpg)
Visualización de datos
Simplifica la presentación de los datos y la información importante
![Page 12: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/12.jpg)
Herramientas de visualizaciónhttp://www.clasesdeperiodismo.com/2013/10/20/10-herramientas-para-trabajar-con-periodismo-de-datos/
DatawrapperServicio gratuito para la elaboración de visualizaciones sencillas, pero bastante útiles. Los usuarios pueden trabajar con cuadros personalizados entre los que destacan gráficas de barras, diagramas circulares y gráficos lineales. La herramienta tiene una función de automatización de contenido que permite generar gráficos a partir de cuadros en Excel.
h"ps://datawrapper.de/iChartsCrear gráficos de barra acompañados de descripciones. Tiene entre sus opciones la posibilidad de producir cuadros interactivos. Los cuadros desarrollados en esta página pueden ser insertados fácilmente a páginas web. Producto comercial que permite descargar un demo.
http://icharts.net/
![Page 13: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/13.jpg)
• Librería Javascript para jQuery que permite crear gráficas dinámicas e interactivas.
VennageEs una herramienta fácil de usar y sirve para crear cuadros estadísticos e infografías a las cuales se les puede agregar gráficos, imágenes y texto. Existe una versión gratuita de la plataforma y otra premium, que por 19 dólares al mes incluye plantillas editables.
http://www.flotcharts.org/
https://venngage.com/
Flot
![Page 14: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/14.jpg)
TableuHerramienta gratuita para hacer gráficos interactivos y otras visualizaciones que permiten a los lectores explorar los números detrás de una historia. Ofrece una amplia gama de diseños interactivos.
https://public.tableau.com/s/
Google Fusion TablesHerramienta permite crear visualizaciones de datos como mapas, gráficos y líneas de tiempo. Para elaborar cada pieza puedes usar la información que se encuentra en la cuenta de Google.
![Page 15: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/15.jpg)
Demostración
![Page 16: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/16.jpg)
Visualización de DatosInvestigadores Uruguayos
![Page 17: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/17.jpg)
Visualización con Fusion Table
• Crear una FusionTable
![Page 18: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/18.jpg)
![Page 19: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/19.jpg)
![Page 20: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/20.jpg)
![Page 21: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/21.jpg)
Tableu
![Page 22: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/22.jpg)
Visualización de datosRanking de Universidades del Ecuador
![Page 23: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/23.jpg)
Proyecto Tableu
![Page 24: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/24.jpg)
![Page 25: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/25.jpg)
![Page 26: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/26.jpg)
![Page 27: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/27.jpg)
![Page 28: Open Data Day: Extraccion y visualizacion de datos](https://reader031.fdocuments.net/reader031/viewer/2022021918/589dbad11a28abf7288b5581/html5/thumbnails/28.jpg)
Muchas gracias