4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

16
Recolectar enlaces, captura masiva de documentos en internet 4 © Fotografia de Sebastian Babestrello, COPADA DE SARDINA Y ANCHOVETA PESCA DE CERCO http://www.flickr.com/photos/sebastianbavestrello/3838123182/in/set-72157621963370973/

description

Extraer y recolectar enlaces de una pagina web, Señalar documentos como Recolector de enlaces y fuente de recoleccion. Ver los documentos recolectados y valorar el interes general de una pagina web.

Transcript of 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Page 1: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Recolectar enlaces, captura masiva de documentos en internet4

© Fotografia de Sebastian Babestrello, COPADA DE SARDINA Y ANCHOVETA PESCA DE CERCOhttp://www.flickr.com/photos/sebastianbavestrello/3838123182/in/set-72157621963370973/

Page 2: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Titulo del Curso: Software “Herramienta de Documentalista” Su uso para profesionales de la informacion

http://www.facebook.com/group.php?gid=186557580539

Page 3: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

TEMARIO

1 Instalacion y personalizacion del software2 Alta, baja y modificacion de un documento (registro)3 Recolectar RSS, lector de feed4 Recolectar enlaces, captura masiva de documentos en internet5 Definicion de la Tabla de materias y del Cuadro de clasificacion6 Asignar materia, Etiquetado, Cuadro de clasificacion7 Importar imagenes de un disco, extraer metadatos8 Importar documentos de un disco, extraer metadatos9 Metadatos y Recuperacion de la informacion10 Difusion de la informacion, Generar informes11 Gestion de necesidades de informacion, calcular relevancia y pertinencia.

Page 4: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

“En su momento tuve el atrevimiento de definir un neologismo que ha tenido cierto éxito: infoxicación. La palabra definía el exceso informacional, de intoxicación informacional, en la que tienes más información de la que humanamente puedes procesar y, como consecuencia, surge la ansiedad (técnicamente information fatigue syndrome). En inglés el término es information overload (sobrecarga informacional). Pues bien, la infoxicación es un problema de nuestra sociedad y, por tanto, también una gran fuente de oportunidades.”

Alfons Cornella

Entrevistando a un miliciano en las trincheras, España 1937

Para reflexionar...

Page 5: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

DESCRIPCION Y OBJETIVOS DE ESTE TEMA

Extraer y recolectar enlaces de una pagina web, Señalar documentos como Recolector de enlaces y fuente de recoleccion.

Ver los documentos recolectados y valorar el interes general de una pagina web.

Page 6: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

Desde el menu principal elegimos la opcion Entrada de Documentos

Page 7: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

Elegimos la opcion Recolector de Enlaces URL de paginas Web

Page 8: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

Esta es la pantalla de control del recolector de urls, esta dividida en dos rejillas las fuentes de recoleccion a la izquierda y a la derecha las urls recolectadas

Para leer un canal, pulsamos en el icono extraer

Page 9: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Si observamos la lista izquierda, vemos que aparece una flecha a la izquierda del nombre

El objeto de señalar los documentos como fuentes de recoleccion es que de todos los documentos que tenemos en la Base de Datos, solo aparezcan en la pantalla de recoleccion, los que hallamos señalado como recolector de enlaces.

A continuacion veremos como se realiza esta sencilla operacion.

Page 10: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

Para dar de alta una fuente de recoleccion, damos de alta una ficha y nos vamos a la pestaña Relaciones, cumplimentamos NOMBRE y URL y en fuentes de recoleccion señalamos el documento como recolector de enlaces. Pulsamos en aceptar para guardar los cambios.

Page 11: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

Vamos a extraer como ejemplo los enlaces de la pagina de la Muskiz Liburutegia

Fragmento de Codigo HTML de la pagina<font color="#990066"><a href="http://www.muskiziburutegia.org/biblioteca/guias/berdintasuna/FrameSet.htm" target="_blank">Cuentos en la Igualdad / Berditasunerako ipuinak (2005)</a></font></div></td>

Extraemos URL:http://www.muskiziburutegia.org/biblioteca/guias/berdintasuna/FrameSet.htmNombre:Cuentos en la Igualdad /Berditasunerako ipuinak (2005)

Page 12: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

Señalamos la casilla de verificacion de la web de la que queremos extraer los enlaces. Pulsamos en el icono Extraer y a continuacion “Recolectar enlaces URL de una pagina Web

Page 13: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

En la barra de iconos, pulsamos en Extraer

Aparecera un menu, donde elegimos “Recolectar enlaces URL de una pagina Web”, entendemos como pagina Web cualquier pagina HTML

Page 14: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

En la pantalla del recolector de enlaces, ya nos apareceran las urls recolectadas

Page 15: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

Entrevistando a un miliciano en las trincheras, España 1937

Si hacemos doble click en cualquier linea de la lista de enlaces recolectados, la pestaña VER nos muestra la pagina correspondiente. Pulsando en el valor que consideremos tambien podemos valorar el interes general de la pagina

Page 16: 4 Recolectar Enlaces, Captura Masiva De Documentos En Internet

“El ser humano ha erigido una civilización tan compleja que le resulta absolutamente necesario mecanizar por completo sus archivos si desea llevar toda su experiencia a su conclusión lógica en lugar quedarse bloqueado por sobrecargar su limitada memoria. Sus excursiones conceptuales podrían resultar más placenteras si pudiese recuperar el privilegio de olvidar las múltiples cosas que no necesita tener a mano inmediatamente, aunque sin renunciar a la seguridad de poder encontrarlas en el momento en que le pudiesen resultar útiles”

Cómo podríamos pensarVannevar Bush

Julio de 1945 http://www.facebook.com/group.php?gid=186557580539