Download - La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

Transcript
Page 1: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

Opcions

Imprimir Recomanar Citacioacute Estadiacutestiques Metadades Similars

textos universitaris debiblioteconomia i documentacioacute

nuacutemero 27desembre de 2011

ISSN 1575 - 5886DL B - 19675 - 1998

Facultat de Biblioteconomia i Documentacioacute Universitat de Barcelona

inici bull presentacioacute bull instruccions autors bull subscripcioacute bull altres nuacutemeros bull cerca bull blok

La recuperacioacuten de la informacioacuten en los archivos en liacutenea1

[Versioacute catalana]

VICENT GIMEacuteNEZ-CHORNET

Profesor Titular de Biblioteconomiacutea y DocumentacioacutenUniversitat Politegravecnica de Valegravenciavigichoharupves

Resumen [Abstract] [Resum]

Objetivo Analizar las propuestas de recuperacioacuten de la informacioacuten de los archivos que han puesto adisposicioacuten de los usuarios en Internet sus fondos documentales para reflexionar sobre los cambios deparadigma de los archivos fiacutesicos a los archivos digitales

Metodologiacutea Identificacioacuten y anaacutelisis de los sitios web de archivos que permiten a los usuarios diversosplanteamientos para la recuperacioacuten de la informacioacuten Valoracioacuten de la implementacioacuten de las buenaspraacutecticas en la recuperacioacuten de la informacioacuten en la arquitectura del sitio web

Resultados La evolucioacuten de las Tecnologiacuteas de la Informacioacuten y la Comunicacioacuten permiten implementareficaces instrumentos de recuperacioacuten de la informacioacuten en los archivos que ponen a disposicioacuten en liacuteneasus cataacutelogos El anaacutelisis permite reflexionar sobre las praacutecticas de la recuperacioacuten de la informacioacuten enlos archivos fiacutesicos y de su evolucioacuten y de las posibilidades de aplicarlo en la Web y en la Web 30

1 Introduccioacuten

Ha sido bastante habitual cuando se mencionan las funciones que debe realizar un archiveroincluso en el entorno de la administracioacuten electroacutenica no destacar entre sus tareas los aspectosrelacionados con la recuperacioacuten de la informacioacuten Karen Dawley Paul en los antildeos 80 incidiacutea enque los gestores documentales teniacutean las funciones de planificacioacuten incluyendo los aspectos decreacioacuten utilizacioacuten proteccioacuten y eliminacioacuten final tras la evaluacioacuten de los documentoselectroacutenicos en un sistema de informacioacuten abarcando incluso aspectos como los servicios dereprografiacutea los procesadores de textos el procesamiento de datos el correo electroacutenico elreconocimiento oacuteptico de caracteres las telecomunicaciones la micrografiacutea la gestioacuten dedocumentos y archivos y tambieacuten servicios bibliotecarios mencionando que la gestioacuten eficaz detodo ello jugaba un papel importante en el establecimiento de la estructura de informacioacuten de lasorganizaciones y que ello afectariacutea a la informacioacuten que se conservaba y que seriacutea accesible parafuturas investigaciones (Paul 1988 37)

La teoriacutea archiviacutestica espantildeola centroacute sus investigaciones en los antildeos 80 en aspectosrelacionados con la clasificacioacuten la descripcioacuten la valoracioacuten las tipologiacuteas documentales laautenticidad o el ciclo vital de los documentos generados por las organizaciones pero poco sobrela buacutesqueda o recuperacioacuten de la informacioacuten de ellos en los archivos En parte esto tiene ciertaexplicacioacuten Los profesionales como por ejemplo Antonia Heredia (1988) en el libro Archiviacutesticageneral teoriacutea y praacutectica se centraban en los aspectos que maacutes preocupaban a los archiveros enun entorno de carencias tecnoloacutegicas con el cual trabajan la mayoriacutea Los estudios realizaban unavisioacuten de conjunto y sistematizaban los conocimientos archiviacutesticos dando a conocer incluso lasnovedades en la automatizacioacuten de los archivos Los temas que se trataban haciacutean referencia a lasciencias auxiliares de la archiviacutestica la historia de los archivos las caracteriacutesticas de losdocumentos de archivo las transferencias la valoracioacuten documental la administracioacuten de archivos

la clasificacioacuten y la ordenacioacuten la descripcioacuten y los instrumentos de descripcioacuten (guiacuteas inventarios ycataacutelogos) considerando a las fichas iacutendice como los instrumentos auxiliares de descripcioacuten lostesauros las listas alfabeacuteticas o los libros registro la accesibilidad documental y el servicio dedocumentos Si en los manuales de archiviacutestica de los antildeos 80 y 90 no hay un capiacutetulo destinado ala recuperacioacuten de la informacioacuten no es porque no interese el tema sino porque el entorno fiacutesico yla ausencia de implementacioacuten tecnoloacutegica es bastante generalizada (excepto excepciones comoel caso de la automatizacioacuten del Archivo General de Indias) y la recuperacioacuten de la informacioacuten secontempla desde otro enfoque

Antes del entorno tecnoloacutegico (fundamentalmente bases de datos Internet e intranets) larecuperacioacuten de la informacioacuten es decir encontrar los documentos tras una peticioacuten se basaba enuna buena organizacioacuten del archivo y en unos buenos instrumentos de descripcioacuten de ahiacute que noexistiesen capiacutetulos especiacuteficos dedicados a esta faceta en nuestra literatura archiviacutestica ya que larespuesta estaba impliacutecita en la buena gestioacuten de los documentos archiviacutesticos Otra cuestioacuten escuando aparece Internet y trasladamos este mismo asunto a la arquitectura de la informacioacuten delsitio web y a sus funcionalidades (los OPACs)

El intereacutes por el proceso de buacutesqueda de documentos no es nuevo Ya en 1835 en una memoriarealizada por Jorge Garciacutea sobre el Archivo del Reino de Valencia dedicoacute un capiacutetulo titulado Dela busca de documentos Seguacuten dicha memoria la busca pues de los documentos depende en laactualidad o de las noticias ciertas y circunstanciadas que suministren los interesados o de las quearrojen los iacutendices que se mencionaraacuten o de la luz que el archivero y oficiales puedan dar abeneficio de sus observaciones y experiencias A pesar de la antiguumledad de estas apreciacionesrecalcamos los aspectos que nos parecen trascienden a la actualidad Para la recuperacioacuten de lainformacioacuten en los archivos habriacutea pues que tener en cuenta seguacuten aquellos paraacutemetros del sigloXIX

1 El vocabulario y los teacuterminos de la consulta2 El anaacutelisis documental y la indizacioacuten3 La tecnologiacutea en la buacutesqueda

Literatura archiviacutestica maacutes reciente no ha contemplado dichos aspectos Es maacutes algunas obrasque han sido muy positivas en algunos aspectos en otros han impregnado una opinioacuten desdenuestro punto de vista erroacutenea Es el caso de las afirmaciones de Elio Lodolini (1993 p 207-208213-214) que tanta influencia ha teniendo en algunos archiveros espantildeoles Seguacuten este autor ladescripcioacuten individualizada de los documentos de archivo y su anaacutelisis documental lo que seentiende por cataacutelogo no se debe realizar en los archivos

En efecto no tendriacutea sentido preguntar en un archivo iquestqueacute hay sobre tal tema y iquestqueacute haysobre tal personaje (como por desgracia bastante a menudo hacen los que se dirigen a unarchivo sin una suficiente preparacioacuten especiacutefica) Es necesario por el contrario preguntarcuaacutel era en los diversos momentos la oficina competente para tratar el tema que interesa yqueacute procedimientos usaba es decir coacutemo produciacutea y organizaba sus propios documentos obien coacutemo un personaje ha tenido contactos con la autoridad puacuteblica (si la investigacioacuten sedesarrolla en un archivo puacuteblico) en calidad de juez de acusado []

El inventario es pues un instrumento compuesto el uacutenico medio que permite realizar labuacutesqueda en un archivo Del todo inuacutetil seriacutea por el contrario un cataacutelogo de documentosentre otras cosas carente de sentido sin poner de relieve el aspecto fundamentalarchiviacutestico de los documentos mismos es decir su interdependencia []

En este contexto algunos autores espantildeoles han considerado que el cataacutelogo era el menosrecomendable de todos los instrumentos de descripcioacuten desde un punto de vista praacutectico y deservicio debido a las carencias de medios materiales y humanos existentes en la mayoriacutea de losarchivos En consecuencia siguiendo el planteamiento de Lodolini la ausencia de descripcioacutenindividualizada y anaacutelisis documental de los documentos imposibilita su buacutesqueda especiacutefica dadoque no hay indizacioacuten ni descripcioacuten individual del documento Estas opiniones del siglo XXcuriosamente contrastan con la consideracioacuten del archivero de 1835 que teniacutea muy claro que lasfichas iacutendices (donde estaba tambieacuten la descripcioacuten individualizada de los documentos) era uno delos pilares baacutesicos para la buacutesqueda de los documentos De hecho en muchos archivosespantildeoles se realizaron en el siglo XIX y principios del XX muchas fichas iacutendice que han servidoreiteradamente a los historiadores

En este contexto iquestla produccioacuten teoacuterica en archiviacutestica en otros paiacuteses se ha preocupado por laindizacioacuten y la recuperacioacuten de la informacioacuten en los archivos Richard J Cox (1992) ya sentildealoacute quefrente a la definicioacuten tradicional de gestioacuten documental mdashcomo el uso del control sistemaacutetico y

cientiacutefico de toda la informacioacuten registrada que una organizacioacuten necesita en su actividadempresarialmdash la aparicioacuten en los uacuteltimos antildeos mdashantildeos 80mdash del concepto de gestioacuten de recursos deinformacioacuten information resources management (IRM) era algo maacutes la informacioacuten es un recursoinstitucional que necesita de la tecnologiacutea para ser gestionada y necesita de personas para tratareficazmente ambas cosas La Gestioacuten de Recursos de Informacioacuten (IRM) incluye el esfuerzo detener el control de la total diversidad de recursos de informacioacuten hardware y softwareequipamiento de telecomunicaciones equipamiento de automatizacioacuten de la oficina y de losaparatos de reprografiacutea asiacute como de la informacioacuten transmitida a traveacutes de esta infraestructura ylas personas La IRM incluye tambieacuten una variedad de teacutecnicas que son muy similares a aquellasempleadas por los gestores documentales y creadas en torno al concepto de ciclo de vida Estasafirmaciones las sentildealoacute Richard Cox cuando auacuten no habiacutea nacido Internet tal y como loconocemos ahora Posteriormente Michael Cook y Margaret Procter (2000) sentildealaron la existenciade diferentes estrategias de recuperacioacuten de la informacioacuten por parte de los usuarios Las tresprincipales estrategias empleadas por eacutestos (incluyendo al personal propio de la entidad comousuarios) para localizar los documentos archiviacutesticos maacutes relevantes para su investigacioacuten son laidentificacioacuten directa el hojeado y la buacutesqueda o exploracioacuten La identificacioacuten directa ocurrecuando el usuario sabe una o maacutes de las caracteriacutesticas de identificacioacuten de los documentos (porejemplo un nombre especiacutefico una fecha o un coacutedigo de referencia) Para ello el requisito principales que los datos que pertenecen a cada entidad deben estar claramente identificables En laestrategia de hojear los usuarios leen las paacuteginas del asistente de buacutesqueda para seleccionarcualquier informacioacuten o tema que consideren como uacutetiles Esta estrategia se emplea condescripciones archiviacutesticas de texto libre tales como la historia administrativa la custodia o lasaacutereas de alcance y contenido En la estrategia de buacutesqueda el objetivo de la recuperacioacuten debeestar maacutes o menos bien definido La accioacuten de la exploracioacuten o buacutesqueda se basa en el uso depalabras claves Hay que tener presente que los usuarios persiguen rapidez en la presentacioacuten delos resultados mdashestaacuten habituados a los resultados de Googlemdash En esta estrategia se requiere unaOPAC correctamente construida Suele haber un cierto grado de conflicto entre la configuracioacuten delsitio web y la estructura de la bases de datos o OPAC maacutes conveniente para cada modalidad derecuperacioacuten de la informacioacuten por ello es importante que se establezcan formas de ayudasapropiadas para cada estrategia separando las referidas al hojeado de la buacutesqueda o exploracioacuten

Tambieacuten Cook y Procter (2000) han sentildealado la importancia de la indizacioacuten en los archivos comoparte de la recuperacioacuten de la informacioacuten Opinan que la creacioacuten de los iacutendices son partesesenciales de una descripcioacuten archiviacutestica y que son puntos de acceso necesarios en un sistemade recuperacioacuten de la informacioacuten La importancia de los iacutendices en la descripcioacuten archiviacutestica haaumentado en estos uacuteltimos antildeos El vocabulario de los iacutendices debe estar hecho con antelacioacuten ydeben ser una parte de un sistema integrado de apoyo en la recuperacioacuten de la informacioacuten Losusuarios tienen que disponer de acceso directo a los iacutendices Los iacutendices son ayudas secundariasde la recuperacioacuten Ello permite llevar a los usuarios de forma certera a las descripciones que en elsistema estaacuten indizadas permitiendo recuperar directamente los documentos que se desean Serecomienda que los iacutendices sean palabras claves dentro de los asistentes de buacutesqueda

2 Instrumentos a nuestro alcance para la recuperacioacuten de lainformacioacuten

En la actualidad disponemos de diversos instrumentos a nuestro alcance para resolver de la formamaacutes eficiente la recuperacioacuten de la informacioacuten en los archivos que han decidido poner sus fondosa disposicioacuten de cualquier usuario o a usuarios de una comunidad especiacutefica Estos instrumentosse basan en software y en hardware asiacute como en aplicacioacuten de estaacutendares No vamos a tratar delhardware ni del software especiacutefico sino de forma geneacuterica que nos ofrecen las TICs paraoptimizar la gestioacuten y por tanto la recuperacioacuten de la informacioacuten

Hemos de dejar claro que todo el trabajo que se realiza en la administracioacuten de los archivos y en lagestioacuten de los documentos converge en una sola finalidad poder consultar los documentos trasuna peticioacuten Los documentos se clasifican se ordenan se describen se garantiza su oacuteptimaconservacioacuten para poder resolver la consulta en un momento dado

Entre los instrumentos a nuestro alcance destacamos

21 Base de datos

La base de datos y el sistema de gestioacuten de bases de datos han revolucionado la gestioacuten de los

documentos Es en definitiva la convergencia de un sistema de gestioacuten basado en muebles concajones que contienen fichas descriptivas (ordenadas tradicionalmente por lugares fechas oasuntos) a un sistema de gestioacuten electroacutenica donde identificamos campos en los que se almacenandatos o informacioacuten

Mientras que las bases de datos son un conjunto o coleccioacuten de datos un sistema de gestioacuten debases de datos mdashSGBDmdash es un software que permite la creacioacuten mantenimiento y explotacioacuten dela base de datos (Abadal Codina 2005 18-19) Una base de datos es una coleccioacuten organizadade datos para uno o maacutes propoacutesitos y que por lo general en las uacuteltimas deacutecadas la encontramosen forma digital El teacutermino base de datos se aplica a los datos y estructuras de datos y no alSGBD que requiere de un software para gestionarlos dado que la estructura de una base de datossuele ser demasiado compleja para ser manejada sin su SGBD La base de datos SQL dispone delestaacutendar ISOIEC 9075 mdashInformation technology Database languages SQLmdash actualizado confrecuencia

Descripcioacuten archiviacutestica

La normalizacioacuten en la descripcioacuten archiviacutestica mdashestaacutendares como ISAD (G) ISAAR-CPM EAD oEAC-CPFmdash permite estructurar la descripcioacuten de la informacioacuten y la descripcioacuten de susproductores Ello supone otro gran avance porque ha abierto la posibilidad de hacer interoperablesdistintas bases de datos La aplicacioacuten de los estaacutendares va a permitir mdashal igual que en lasbibliotecas lo permitioacute la ISBD o los distintos formatos MARCmdash interrelacionar las bases de datoscon campos definidos para la descripcioacuten y el anaacutelisis documental Queremos hacer hincapieacute entres partes que caracterizan a la descripcioacuten archiviacutestica por las cuales se debe poder realizar larecuperacioacuten de la informacioacuten

1 Descripcioacuten del contexto Son campos destinados a describir al productor de ladocumentacioacuten archiviacutestica especialmente mediante las normas ISAAR-CPF o la EAC-CPFEn opinioacuten de la comisioacuten que elaboroacute la ISAAR-CPF con ello se consigue al mismo tiempofacilitar la recuperacioacuten de informacioacuten de las descripciones archiviacutesticas asiacute como que larecuperacioacuten de la informacioacuten se vea mejorada por el uso de puntos de acceso (o teacuterminosiacutendice) y que los puntos de acceso funcionen mejor cuando estaacuten estandarizados por mediode un registro de autoridad (Thibodeau 1995) El intereacutes por describir el contexto en ladocumentacioacuten archiviacutestica es algo maacutes para saber que el expediente es auteacutentico debeestar identificado su productor en el mundo se ha de especificar el sistema que lo gestionase tienen que nombrar sus creadores y los procesos por los que se identifica La descripcioacutendel contexto a partir de los metadatos generados contribuye a garantizar su autenticidad(Cumming K 2007) Desde el punto de vista de la recuperacioacuten de la informacioacuten es muchomaacutes relevante describir al productor en un archivo que recoge documentacioacuten de muchosproductores que en un archivo de un uacutenico productor puesto que una peticioacuten de buacutesquedapuede ser la recuperacioacuten de los documentos producidos por un productor dado Desde elpunto de vista de la autenticidad y las medidas de conservacioacuten se debe describir elproductor

2 Descripcioacuten de la unidad archiviacutestica Bien hablemos de Unidad de Informacioacuten bien deUnidad Archiviacutestica en este apartado lo entendemos como unidad de descripcioacuten tal y comolo define la norma ISAD (G) es decir como un documento o conjunto de documentoscualquiera que sea su forma fiacutesica tratado como un todo y que como tal constituye la basede una uacutenica descripcioacuten La norma identifica 26 elementos para describir cualquier unidad(fondo serie unidad documental compuesta o simple etc) La traslacioacuten de los elementos acampos de una base de datos hace posible su recuperacioacuten automatizada con todas lascaracteriacutesticas que puedan ofrecer estos campos numeacutericos (para procesar nuacutemerosmaacutescaras de bits fechas u horas) o alfanumeacutericos Igualmente los etiquetados de la EADsirven para ser trasladados a bases de datos

3 Indizacioacuten Utilizada en los archivos al menos desde eacutepoca medieval de forma progresivase va incorporando a las bases de datos archiviacutesticas A principios del siglo XXI eran escasasen el entorno espantildeol las bases de datos que habiacutean incorporado la indizacioacuten (bien sea conlenguaje documental o con lenguaje libre) como campos para la recuperacioacuten de lainformacioacuten Hemos de resaltar la diferencia que existe entre iacutendice y productor El primerocomo uno de tantos puntos de acceso a la informacioacuten registrada en ciertos campos de labase de datos donde se aconseja la utilizacioacuten de un lenguaje documental que lo utilizantanto las bibliotecas como los archivos para indicar lugares materias organismos opersonas Mientras que el del productor en los archivos es un concepto maacutes amplio mdashcomo

hemos indicado anteriormentemdash y dispone de su norma especiacutefica para describir estecontexto

Interoperabilidad

La interoperabilidad la entendemos como la propiedad de un producto o de un sistema que escapaz de conseguir la utilizacioacuten de software por distintos sistemas informaacuteticos (sistemasoperativos y aplicaciones de software) interconectados por diferentes tipos de redes para elintercambio de informacioacuten o de datos En los archivos inicialmente mdashantildeos 70 y 80mdash laintroduccioacuten de software y hardware fue para la automatizacioacuten de distintas unidades dedescripcioacuten en bases de datos muchas veces con la realizacioacuten de iacutendices para favorecer larecuperacioacuten de la informacioacuten Primero se introdujo en local (Bell 1975) posteriormente aparecioacuteel intereacutes de compartir esta informacioacuten en liacutenea (Arad Bell 1977-1978) como ocurriacutea en lasbibliotecas y finalmente la automatizacioacuten iba a contemplar la totalidad de la gestioacuten en unaorganizacioacuten (Vaacutezquez de Parga 1986) Desde la perspectiva de la recuperacioacuten de la informacioacutennos interesa destacar la interoperabilidad desde dos aspectos

1 Intercambio de datos El intercambio de datos e informacioacuten se efectuacutea principalmentemediante una estructura de datos (los campos de las bases de datos o mediante scriptscreados para la transferencia de los datos) A nivel europeo el programa IDA (Intercambio deDatos entre Administraciones) ha sido una gran iniciativa que desde 1998 ha generadoexperiencias estaacutendares y aplicaciones para hacer posible la interoperabilidad de las redestelemaacuteticas transeuropeas destinadas al intercambio de datos entre administraciones (UnioacutenEuropea 1998) con ello hemos alcanzado que los archivos sean interoperables(Klischewski 2004) En Espantildea en 2010 empieza a regularse el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica (Espantildea 2010) Sin embargoen los archivos histoacutericos que han decidido poner a disposicioacuten de los usuarios sus fondosdistintos sistemas de redes y software ya existentes han permitido desde hace maacutes de unadeacutecada el completo intercambio de datos e informacioacuten en Internet

2 Datos enlazados o vinculados En el entorno de alcanzar la web semaacutentica la aparicioacuten en1999 de la especificacioacuten RDF mdashResource Description Frameworkmdash de la World Wide WebConsortium (W3C) fue el inicio que permitioacute poner datos o metadatos en la web para suprocesamiento proporcionando interoperabilidad entre aplicaciones que intercambianinformacioacuten legible por maacutequina en la web Tim Berners-Lee (2006) acuntildeoacute maacutes tarde elconcepto de Linked Data sentildealando que con los datos vinculados se pueden encontrar en laweb otros datos relacionados No se trata de la Web Hipertexto sino de la definicioacuten de unasintaxis abstracta basada en RDF que sirve para vincular su sintaxis concreta a susemaacutentica formal incluyendo entre otros el tratamiento de referencias URI (UniversalResource Identifier)

3 Anaacutelisis a partir de casos

La recuperacioacuten de la informacioacuten de los archivos que han puesto a disposicioacuten de los usuarios ladescripcioacuten de sus contenidos en liacutenea se debe poder realizar bien interrogando el productor mdashISAAR (CPF) o EAC (CPF)mdash bien interrogando los campos de la descripcioacuten mdashprincipalmente losestaacutendares ISAD (G) o EADmdash bien interrogando su indizacioacuten mdashlenguajes documentalesespecialmente tesauros para las materias geograacutefico entidades o personasmdash o bien sondeandoen su interoperabilidad mdashespecialmente a partir de los metadatos RDFmdash

31 Interrogacioacuten sobre el productor

En los archivos se describe al productor mdashbien sean instituciones personas o familiasmdash con lafinalidad de controlar el contexto que ha producido un fondo documental No tiene sentido realizaresfuerzos en describir productores que no se enlacen o no se vayan a enlazar con lasdescripciones de los fondos documentales Ni tiene sentido describir en sobremanera a unproductor mdashcasi una investigacioacuten cientiacutefica de historia de las institucionesmdash si esa informacioacuten nosirve directamente para identificar el contexto y para recuperar la informacioacuten de los fondosdocumentales archiviacutesticos Con la identificacioacuten y descripcioacuten del productor garantizaremos

tambieacuten la autenticidad y si aplicamos por ejemplo un OAIS mdashOpen Archival Information System(ISO 14721 2003)mdash conseguimos tambieacuten la conservacioacuten de la documentacioacuten en nuestrosistema de gestioacuten documental

En Espantildea la principal base de datos que utiliza la ISAAR (CPF) y al mismo tiempo la EAC-CPFestaacute disponible en el Censo Guiacutea de Archivos de Espantildea e Iberoameacuterica Contiene un total de4324 descripciones y es posible su buacutesqueda por personas familias o instituciones Lasdescripciones se pueden tambieacuten visualizar seguacuten la codificacioacuten EAC-CPF

Imagen 1 Descripcioacuten de Autoridades en el Censo-Guiacutea (Espantildea)

Imagen 2 Visualizacioacuten codificada EAC

En esta base de datos se debe mejorar la unificacioacuten de criterios en algunas consideramosescasas descripciones de entidades como por ejemplo en el caso del Consejo de Aragoacuten y elConsejo Supremo de Aragoacuten ya que nos referimos al mismo productor y debe disponer enconsecuencia de un identificador y no de dos identificadores (ES28079MCU193 y ES8019ACA2)Pero la mejora maacutes destacada que se ha de realizar estaacute relacionada en la misma finalidad de ladescripcioacuten del productor recuperar los fondos que eacuteste ha producido En este sentido salvoalgunas excepciones la identificacioacuten del productor no enlaza con la base de datos que describelos fondos documentales

A nivel internacional uno de los proyectos maacutes interesantes es SNAC (Social Networks and ArchivalContext Project) Se aprovecha del estaacutendar EAC-CPF y de tecnologiacutea digital para desbloquearlas descripciones de las personas desde las fuentes secundarias e integrarlas en nuevas utilidadespara por una parte crear eficientes herramientas de coacutedigo abierto que permitan a los archiverosseparar el proceso de describir las personas del de describir los documentos o unidades dedescripcioacuten y por otra crear un prototipo integrado de los recursos histoacutericos y sistema de acceso

que permitiraacute el enlace mutuo de las descripciones de las personas con las descripcionesrealizadas en los archivos bibliotecas y museos Dicho prototipo ya estaacute en funcionamiento(httpsocialarchiveiathvirginiaeduxtfsearch) y permite efectuar buacutesquedas sobre personasfamilias o instituciones y enlaza con las descripciones de las instituciones en liacutenea que disponende esos fondos documentales

Imagen 3 Prototipo SNAC

Imagen 4 Prototipo SNAC ejemplo de descripcioacuten de institucioacuten y enlace con las unidades de descripcioacutenrelacionas

32 Interrogacioacuten sobre los campos de descripcioacuten

En los archivos los campos de las unidades de descripcioacuten se regulan principalmente por losestaacutendares ISAD (G) o por las EAD Una de las principales ventajas de estos estaacutendares es quepermiten la descripcioacuten multinivel otra cuestioacuten distinta es que el software que lo soporta seacapaz de integrar la descripcioacuten multinivel en su base de datos La otra ventaja de los estaacutendareses que al fin se consiguioacute en archivos algo que ya ocurriacutea en bibliotecas hacer posible lainteroperabilidad de datos ya que se ha consensuado una estructura uacutenica de campos y definir lafuncioacuten de esos campos mdashcomo en bibliotecas el formato MARCmdash Cualquier alteracioacuten delnuacutemero de los campos o de la funcioacuten de los mismos rompe con uno de los objetivos de estosestaacutendares hacer posible la creacioacuten de redes entre archivos o la interconexioacuten entre diferentesbases de datos

En Espantildea el Portal de Archivos Espantildeoles (PARES) es el sitio web maacutes importante por el volumende unidades de descripcioacuten realizadas y como valor antildeadido por la disposicioacuten de documentosdigitalizados en abierto La utilizacioacuten de los estaacutendares ha facilitado la interconexioacuten entre losdiferentes archivos espantildeoles que estaacuten en esta red La buacutesqueda avanzada no permite

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 2: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

la clasificacioacuten y la ordenacioacuten la descripcioacuten y los instrumentos de descripcioacuten (guiacuteas inventarios ycataacutelogos) considerando a las fichas iacutendice como los instrumentos auxiliares de descripcioacuten lostesauros las listas alfabeacuteticas o los libros registro la accesibilidad documental y el servicio dedocumentos Si en los manuales de archiviacutestica de los antildeos 80 y 90 no hay un capiacutetulo destinado ala recuperacioacuten de la informacioacuten no es porque no interese el tema sino porque el entorno fiacutesico yla ausencia de implementacioacuten tecnoloacutegica es bastante generalizada (excepto excepciones comoel caso de la automatizacioacuten del Archivo General de Indias) y la recuperacioacuten de la informacioacuten secontempla desde otro enfoque

Antes del entorno tecnoloacutegico (fundamentalmente bases de datos Internet e intranets) larecuperacioacuten de la informacioacuten es decir encontrar los documentos tras una peticioacuten se basaba enuna buena organizacioacuten del archivo y en unos buenos instrumentos de descripcioacuten de ahiacute que noexistiesen capiacutetulos especiacuteficos dedicados a esta faceta en nuestra literatura archiviacutestica ya que larespuesta estaba impliacutecita en la buena gestioacuten de los documentos archiviacutesticos Otra cuestioacuten escuando aparece Internet y trasladamos este mismo asunto a la arquitectura de la informacioacuten delsitio web y a sus funcionalidades (los OPACs)

El intereacutes por el proceso de buacutesqueda de documentos no es nuevo Ya en 1835 en una memoriarealizada por Jorge Garciacutea sobre el Archivo del Reino de Valencia dedicoacute un capiacutetulo titulado Dela busca de documentos Seguacuten dicha memoria la busca pues de los documentos depende en laactualidad o de las noticias ciertas y circunstanciadas que suministren los interesados o de las quearrojen los iacutendices que se mencionaraacuten o de la luz que el archivero y oficiales puedan dar abeneficio de sus observaciones y experiencias A pesar de la antiguumledad de estas apreciacionesrecalcamos los aspectos que nos parecen trascienden a la actualidad Para la recuperacioacuten de lainformacioacuten en los archivos habriacutea pues que tener en cuenta seguacuten aquellos paraacutemetros del sigloXIX

1 El vocabulario y los teacuterminos de la consulta2 El anaacutelisis documental y la indizacioacuten3 La tecnologiacutea en la buacutesqueda

Literatura archiviacutestica maacutes reciente no ha contemplado dichos aspectos Es maacutes algunas obrasque han sido muy positivas en algunos aspectos en otros han impregnado una opinioacuten desdenuestro punto de vista erroacutenea Es el caso de las afirmaciones de Elio Lodolini (1993 p 207-208213-214) que tanta influencia ha teniendo en algunos archiveros espantildeoles Seguacuten este autor ladescripcioacuten individualizada de los documentos de archivo y su anaacutelisis documental lo que seentiende por cataacutelogo no se debe realizar en los archivos

En efecto no tendriacutea sentido preguntar en un archivo iquestqueacute hay sobre tal tema y iquestqueacute haysobre tal personaje (como por desgracia bastante a menudo hacen los que se dirigen a unarchivo sin una suficiente preparacioacuten especiacutefica) Es necesario por el contrario preguntarcuaacutel era en los diversos momentos la oficina competente para tratar el tema que interesa yqueacute procedimientos usaba es decir coacutemo produciacutea y organizaba sus propios documentos obien coacutemo un personaje ha tenido contactos con la autoridad puacuteblica (si la investigacioacuten sedesarrolla en un archivo puacuteblico) en calidad de juez de acusado []

El inventario es pues un instrumento compuesto el uacutenico medio que permite realizar labuacutesqueda en un archivo Del todo inuacutetil seriacutea por el contrario un cataacutelogo de documentosentre otras cosas carente de sentido sin poner de relieve el aspecto fundamentalarchiviacutestico de los documentos mismos es decir su interdependencia []

En este contexto algunos autores espantildeoles han considerado que el cataacutelogo era el menosrecomendable de todos los instrumentos de descripcioacuten desde un punto de vista praacutectico y deservicio debido a las carencias de medios materiales y humanos existentes en la mayoriacutea de losarchivos En consecuencia siguiendo el planteamiento de Lodolini la ausencia de descripcioacutenindividualizada y anaacutelisis documental de los documentos imposibilita su buacutesqueda especiacutefica dadoque no hay indizacioacuten ni descripcioacuten individual del documento Estas opiniones del siglo XXcuriosamente contrastan con la consideracioacuten del archivero de 1835 que teniacutea muy claro que lasfichas iacutendices (donde estaba tambieacuten la descripcioacuten individualizada de los documentos) era uno delos pilares baacutesicos para la buacutesqueda de los documentos De hecho en muchos archivosespantildeoles se realizaron en el siglo XIX y principios del XX muchas fichas iacutendice que han servidoreiteradamente a los historiadores

En este contexto iquestla produccioacuten teoacuterica en archiviacutestica en otros paiacuteses se ha preocupado por laindizacioacuten y la recuperacioacuten de la informacioacuten en los archivos Richard J Cox (1992) ya sentildealoacute quefrente a la definicioacuten tradicional de gestioacuten documental mdashcomo el uso del control sistemaacutetico y

cientiacutefico de toda la informacioacuten registrada que una organizacioacuten necesita en su actividadempresarialmdash la aparicioacuten en los uacuteltimos antildeos mdashantildeos 80mdash del concepto de gestioacuten de recursos deinformacioacuten information resources management (IRM) era algo maacutes la informacioacuten es un recursoinstitucional que necesita de la tecnologiacutea para ser gestionada y necesita de personas para tratareficazmente ambas cosas La Gestioacuten de Recursos de Informacioacuten (IRM) incluye el esfuerzo detener el control de la total diversidad de recursos de informacioacuten hardware y softwareequipamiento de telecomunicaciones equipamiento de automatizacioacuten de la oficina y de losaparatos de reprografiacutea asiacute como de la informacioacuten transmitida a traveacutes de esta infraestructura ylas personas La IRM incluye tambieacuten una variedad de teacutecnicas que son muy similares a aquellasempleadas por los gestores documentales y creadas en torno al concepto de ciclo de vida Estasafirmaciones las sentildealoacute Richard Cox cuando auacuten no habiacutea nacido Internet tal y como loconocemos ahora Posteriormente Michael Cook y Margaret Procter (2000) sentildealaron la existenciade diferentes estrategias de recuperacioacuten de la informacioacuten por parte de los usuarios Las tresprincipales estrategias empleadas por eacutestos (incluyendo al personal propio de la entidad comousuarios) para localizar los documentos archiviacutesticos maacutes relevantes para su investigacioacuten son laidentificacioacuten directa el hojeado y la buacutesqueda o exploracioacuten La identificacioacuten directa ocurrecuando el usuario sabe una o maacutes de las caracteriacutesticas de identificacioacuten de los documentos (porejemplo un nombre especiacutefico una fecha o un coacutedigo de referencia) Para ello el requisito principales que los datos que pertenecen a cada entidad deben estar claramente identificables En laestrategia de hojear los usuarios leen las paacuteginas del asistente de buacutesqueda para seleccionarcualquier informacioacuten o tema que consideren como uacutetiles Esta estrategia se emplea condescripciones archiviacutesticas de texto libre tales como la historia administrativa la custodia o lasaacutereas de alcance y contenido En la estrategia de buacutesqueda el objetivo de la recuperacioacuten debeestar maacutes o menos bien definido La accioacuten de la exploracioacuten o buacutesqueda se basa en el uso depalabras claves Hay que tener presente que los usuarios persiguen rapidez en la presentacioacuten delos resultados mdashestaacuten habituados a los resultados de Googlemdash En esta estrategia se requiere unaOPAC correctamente construida Suele haber un cierto grado de conflicto entre la configuracioacuten delsitio web y la estructura de la bases de datos o OPAC maacutes conveniente para cada modalidad derecuperacioacuten de la informacioacuten por ello es importante que se establezcan formas de ayudasapropiadas para cada estrategia separando las referidas al hojeado de la buacutesqueda o exploracioacuten

Tambieacuten Cook y Procter (2000) han sentildealado la importancia de la indizacioacuten en los archivos comoparte de la recuperacioacuten de la informacioacuten Opinan que la creacioacuten de los iacutendices son partesesenciales de una descripcioacuten archiviacutestica y que son puntos de acceso necesarios en un sistemade recuperacioacuten de la informacioacuten La importancia de los iacutendices en la descripcioacuten archiviacutestica haaumentado en estos uacuteltimos antildeos El vocabulario de los iacutendices debe estar hecho con antelacioacuten ydeben ser una parte de un sistema integrado de apoyo en la recuperacioacuten de la informacioacuten Losusuarios tienen que disponer de acceso directo a los iacutendices Los iacutendices son ayudas secundariasde la recuperacioacuten Ello permite llevar a los usuarios de forma certera a las descripciones que en elsistema estaacuten indizadas permitiendo recuperar directamente los documentos que se desean Serecomienda que los iacutendices sean palabras claves dentro de los asistentes de buacutesqueda

2 Instrumentos a nuestro alcance para la recuperacioacuten de lainformacioacuten

En la actualidad disponemos de diversos instrumentos a nuestro alcance para resolver de la formamaacutes eficiente la recuperacioacuten de la informacioacuten en los archivos que han decidido poner sus fondosa disposicioacuten de cualquier usuario o a usuarios de una comunidad especiacutefica Estos instrumentosse basan en software y en hardware asiacute como en aplicacioacuten de estaacutendares No vamos a tratar delhardware ni del software especiacutefico sino de forma geneacuterica que nos ofrecen las TICs paraoptimizar la gestioacuten y por tanto la recuperacioacuten de la informacioacuten

Hemos de dejar claro que todo el trabajo que se realiza en la administracioacuten de los archivos y en lagestioacuten de los documentos converge en una sola finalidad poder consultar los documentos trasuna peticioacuten Los documentos se clasifican se ordenan se describen se garantiza su oacuteptimaconservacioacuten para poder resolver la consulta en un momento dado

Entre los instrumentos a nuestro alcance destacamos

21 Base de datos

La base de datos y el sistema de gestioacuten de bases de datos han revolucionado la gestioacuten de los

documentos Es en definitiva la convergencia de un sistema de gestioacuten basado en muebles concajones que contienen fichas descriptivas (ordenadas tradicionalmente por lugares fechas oasuntos) a un sistema de gestioacuten electroacutenica donde identificamos campos en los que se almacenandatos o informacioacuten

Mientras que las bases de datos son un conjunto o coleccioacuten de datos un sistema de gestioacuten debases de datos mdashSGBDmdash es un software que permite la creacioacuten mantenimiento y explotacioacuten dela base de datos (Abadal Codina 2005 18-19) Una base de datos es una coleccioacuten organizadade datos para uno o maacutes propoacutesitos y que por lo general en las uacuteltimas deacutecadas la encontramosen forma digital El teacutermino base de datos se aplica a los datos y estructuras de datos y no alSGBD que requiere de un software para gestionarlos dado que la estructura de una base de datossuele ser demasiado compleja para ser manejada sin su SGBD La base de datos SQL dispone delestaacutendar ISOIEC 9075 mdashInformation technology Database languages SQLmdash actualizado confrecuencia

Descripcioacuten archiviacutestica

La normalizacioacuten en la descripcioacuten archiviacutestica mdashestaacutendares como ISAD (G) ISAAR-CPM EAD oEAC-CPFmdash permite estructurar la descripcioacuten de la informacioacuten y la descripcioacuten de susproductores Ello supone otro gran avance porque ha abierto la posibilidad de hacer interoperablesdistintas bases de datos La aplicacioacuten de los estaacutendares va a permitir mdashal igual que en lasbibliotecas lo permitioacute la ISBD o los distintos formatos MARCmdash interrelacionar las bases de datoscon campos definidos para la descripcioacuten y el anaacutelisis documental Queremos hacer hincapieacute entres partes que caracterizan a la descripcioacuten archiviacutestica por las cuales se debe poder realizar larecuperacioacuten de la informacioacuten

1 Descripcioacuten del contexto Son campos destinados a describir al productor de ladocumentacioacuten archiviacutestica especialmente mediante las normas ISAAR-CPF o la EAC-CPFEn opinioacuten de la comisioacuten que elaboroacute la ISAAR-CPF con ello se consigue al mismo tiempofacilitar la recuperacioacuten de informacioacuten de las descripciones archiviacutesticas asiacute como que larecuperacioacuten de la informacioacuten se vea mejorada por el uso de puntos de acceso (o teacuterminosiacutendice) y que los puntos de acceso funcionen mejor cuando estaacuten estandarizados por mediode un registro de autoridad (Thibodeau 1995) El intereacutes por describir el contexto en ladocumentacioacuten archiviacutestica es algo maacutes para saber que el expediente es auteacutentico debeestar identificado su productor en el mundo se ha de especificar el sistema que lo gestionase tienen que nombrar sus creadores y los procesos por los que se identifica La descripcioacutendel contexto a partir de los metadatos generados contribuye a garantizar su autenticidad(Cumming K 2007) Desde el punto de vista de la recuperacioacuten de la informacioacuten es muchomaacutes relevante describir al productor en un archivo que recoge documentacioacuten de muchosproductores que en un archivo de un uacutenico productor puesto que una peticioacuten de buacutesquedapuede ser la recuperacioacuten de los documentos producidos por un productor dado Desde elpunto de vista de la autenticidad y las medidas de conservacioacuten se debe describir elproductor

2 Descripcioacuten de la unidad archiviacutestica Bien hablemos de Unidad de Informacioacuten bien deUnidad Archiviacutestica en este apartado lo entendemos como unidad de descripcioacuten tal y comolo define la norma ISAD (G) es decir como un documento o conjunto de documentoscualquiera que sea su forma fiacutesica tratado como un todo y que como tal constituye la basede una uacutenica descripcioacuten La norma identifica 26 elementos para describir cualquier unidad(fondo serie unidad documental compuesta o simple etc) La traslacioacuten de los elementos acampos de una base de datos hace posible su recuperacioacuten automatizada con todas lascaracteriacutesticas que puedan ofrecer estos campos numeacutericos (para procesar nuacutemerosmaacutescaras de bits fechas u horas) o alfanumeacutericos Igualmente los etiquetados de la EADsirven para ser trasladados a bases de datos

3 Indizacioacuten Utilizada en los archivos al menos desde eacutepoca medieval de forma progresivase va incorporando a las bases de datos archiviacutesticas A principios del siglo XXI eran escasasen el entorno espantildeol las bases de datos que habiacutean incorporado la indizacioacuten (bien sea conlenguaje documental o con lenguaje libre) como campos para la recuperacioacuten de lainformacioacuten Hemos de resaltar la diferencia que existe entre iacutendice y productor El primerocomo uno de tantos puntos de acceso a la informacioacuten registrada en ciertos campos de labase de datos donde se aconseja la utilizacioacuten de un lenguaje documental que lo utilizantanto las bibliotecas como los archivos para indicar lugares materias organismos opersonas Mientras que el del productor en los archivos es un concepto maacutes amplio mdashcomo

hemos indicado anteriormentemdash y dispone de su norma especiacutefica para describir estecontexto

Interoperabilidad

La interoperabilidad la entendemos como la propiedad de un producto o de un sistema que escapaz de conseguir la utilizacioacuten de software por distintos sistemas informaacuteticos (sistemasoperativos y aplicaciones de software) interconectados por diferentes tipos de redes para elintercambio de informacioacuten o de datos En los archivos inicialmente mdashantildeos 70 y 80mdash laintroduccioacuten de software y hardware fue para la automatizacioacuten de distintas unidades dedescripcioacuten en bases de datos muchas veces con la realizacioacuten de iacutendices para favorecer larecuperacioacuten de la informacioacuten Primero se introdujo en local (Bell 1975) posteriormente aparecioacuteel intereacutes de compartir esta informacioacuten en liacutenea (Arad Bell 1977-1978) como ocurriacutea en lasbibliotecas y finalmente la automatizacioacuten iba a contemplar la totalidad de la gestioacuten en unaorganizacioacuten (Vaacutezquez de Parga 1986) Desde la perspectiva de la recuperacioacuten de la informacioacutennos interesa destacar la interoperabilidad desde dos aspectos

1 Intercambio de datos El intercambio de datos e informacioacuten se efectuacutea principalmentemediante una estructura de datos (los campos de las bases de datos o mediante scriptscreados para la transferencia de los datos) A nivel europeo el programa IDA (Intercambio deDatos entre Administraciones) ha sido una gran iniciativa que desde 1998 ha generadoexperiencias estaacutendares y aplicaciones para hacer posible la interoperabilidad de las redestelemaacuteticas transeuropeas destinadas al intercambio de datos entre administraciones (UnioacutenEuropea 1998) con ello hemos alcanzado que los archivos sean interoperables(Klischewski 2004) En Espantildea en 2010 empieza a regularse el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica (Espantildea 2010) Sin embargoen los archivos histoacutericos que han decidido poner a disposicioacuten de los usuarios sus fondosdistintos sistemas de redes y software ya existentes han permitido desde hace maacutes de unadeacutecada el completo intercambio de datos e informacioacuten en Internet

2 Datos enlazados o vinculados En el entorno de alcanzar la web semaacutentica la aparicioacuten en1999 de la especificacioacuten RDF mdashResource Description Frameworkmdash de la World Wide WebConsortium (W3C) fue el inicio que permitioacute poner datos o metadatos en la web para suprocesamiento proporcionando interoperabilidad entre aplicaciones que intercambianinformacioacuten legible por maacutequina en la web Tim Berners-Lee (2006) acuntildeoacute maacutes tarde elconcepto de Linked Data sentildealando que con los datos vinculados se pueden encontrar en laweb otros datos relacionados No se trata de la Web Hipertexto sino de la definicioacuten de unasintaxis abstracta basada en RDF que sirve para vincular su sintaxis concreta a susemaacutentica formal incluyendo entre otros el tratamiento de referencias URI (UniversalResource Identifier)

3 Anaacutelisis a partir de casos

La recuperacioacuten de la informacioacuten de los archivos que han puesto a disposicioacuten de los usuarios ladescripcioacuten de sus contenidos en liacutenea se debe poder realizar bien interrogando el productor mdashISAAR (CPF) o EAC (CPF)mdash bien interrogando los campos de la descripcioacuten mdashprincipalmente losestaacutendares ISAD (G) o EADmdash bien interrogando su indizacioacuten mdashlenguajes documentalesespecialmente tesauros para las materias geograacutefico entidades o personasmdash o bien sondeandoen su interoperabilidad mdashespecialmente a partir de los metadatos RDFmdash

31 Interrogacioacuten sobre el productor

En los archivos se describe al productor mdashbien sean instituciones personas o familiasmdash con lafinalidad de controlar el contexto que ha producido un fondo documental No tiene sentido realizaresfuerzos en describir productores que no se enlacen o no se vayan a enlazar con lasdescripciones de los fondos documentales Ni tiene sentido describir en sobremanera a unproductor mdashcasi una investigacioacuten cientiacutefica de historia de las institucionesmdash si esa informacioacuten nosirve directamente para identificar el contexto y para recuperar la informacioacuten de los fondosdocumentales archiviacutesticos Con la identificacioacuten y descripcioacuten del productor garantizaremos

tambieacuten la autenticidad y si aplicamos por ejemplo un OAIS mdashOpen Archival Information System(ISO 14721 2003)mdash conseguimos tambieacuten la conservacioacuten de la documentacioacuten en nuestrosistema de gestioacuten documental

En Espantildea la principal base de datos que utiliza la ISAAR (CPF) y al mismo tiempo la EAC-CPFestaacute disponible en el Censo Guiacutea de Archivos de Espantildea e Iberoameacuterica Contiene un total de4324 descripciones y es posible su buacutesqueda por personas familias o instituciones Lasdescripciones se pueden tambieacuten visualizar seguacuten la codificacioacuten EAC-CPF

Imagen 1 Descripcioacuten de Autoridades en el Censo-Guiacutea (Espantildea)

Imagen 2 Visualizacioacuten codificada EAC

En esta base de datos se debe mejorar la unificacioacuten de criterios en algunas consideramosescasas descripciones de entidades como por ejemplo en el caso del Consejo de Aragoacuten y elConsejo Supremo de Aragoacuten ya que nos referimos al mismo productor y debe disponer enconsecuencia de un identificador y no de dos identificadores (ES28079MCU193 y ES8019ACA2)Pero la mejora maacutes destacada que se ha de realizar estaacute relacionada en la misma finalidad de ladescripcioacuten del productor recuperar los fondos que eacuteste ha producido En este sentido salvoalgunas excepciones la identificacioacuten del productor no enlaza con la base de datos que describelos fondos documentales

A nivel internacional uno de los proyectos maacutes interesantes es SNAC (Social Networks and ArchivalContext Project) Se aprovecha del estaacutendar EAC-CPF y de tecnologiacutea digital para desbloquearlas descripciones de las personas desde las fuentes secundarias e integrarlas en nuevas utilidadespara por una parte crear eficientes herramientas de coacutedigo abierto que permitan a los archiverosseparar el proceso de describir las personas del de describir los documentos o unidades dedescripcioacuten y por otra crear un prototipo integrado de los recursos histoacutericos y sistema de acceso

que permitiraacute el enlace mutuo de las descripciones de las personas con las descripcionesrealizadas en los archivos bibliotecas y museos Dicho prototipo ya estaacute en funcionamiento(httpsocialarchiveiathvirginiaeduxtfsearch) y permite efectuar buacutesquedas sobre personasfamilias o instituciones y enlaza con las descripciones de las instituciones en liacutenea que disponende esos fondos documentales

Imagen 3 Prototipo SNAC

Imagen 4 Prototipo SNAC ejemplo de descripcioacuten de institucioacuten y enlace con las unidades de descripcioacutenrelacionas

32 Interrogacioacuten sobre los campos de descripcioacuten

En los archivos los campos de las unidades de descripcioacuten se regulan principalmente por losestaacutendares ISAD (G) o por las EAD Una de las principales ventajas de estos estaacutendares es quepermiten la descripcioacuten multinivel otra cuestioacuten distinta es que el software que lo soporta seacapaz de integrar la descripcioacuten multinivel en su base de datos La otra ventaja de los estaacutendareses que al fin se consiguioacute en archivos algo que ya ocurriacutea en bibliotecas hacer posible lainteroperabilidad de datos ya que se ha consensuado una estructura uacutenica de campos y definir lafuncioacuten de esos campos mdashcomo en bibliotecas el formato MARCmdash Cualquier alteracioacuten delnuacutemero de los campos o de la funcioacuten de los mismos rompe con uno de los objetivos de estosestaacutendares hacer posible la creacioacuten de redes entre archivos o la interconexioacuten entre diferentesbases de datos

En Espantildea el Portal de Archivos Espantildeoles (PARES) es el sitio web maacutes importante por el volumende unidades de descripcioacuten realizadas y como valor antildeadido por la disposicioacuten de documentosdigitalizados en abierto La utilizacioacuten de los estaacutendares ha facilitado la interconexioacuten entre losdiferentes archivos espantildeoles que estaacuten en esta red La buacutesqueda avanzada no permite

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 3: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

cientiacutefico de toda la informacioacuten registrada que una organizacioacuten necesita en su actividadempresarialmdash la aparicioacuten en los uacuteltimos antildeos mdashantildeos 80mdash del concepto de gestioacuten de recursos deinformacioacuten information resources management (IRM) era algo maacutes la informacioacuten es un recursoinstitucional que necesita de la tecnologiacutea para ser gestionada y necesita de personas para tratareficazmente ambas cosas La Gestioacuten de Recursos de Informacioacuten (IRM) incluye el esfuerzo detener el control de la total diversidad de recursos de informacioacuten hardware y softwareequipamiento de telecomunicaciones equipamiento de automatizacioacuten de la oficina y de losaparatos de reprografiacutea asiacute como de la informacioacuten transmitida a traveacutes de esta infraestructura ylas personas La IRM incluye tambieacuten una variedad de teacutecnicas que son muy similares a aquellasempleadas por los gestores documentales y creadas en torno al concepto de ciclo de vida Estasafirmaciones las sentildealoacute Richard Cox cuando auacuten no habiacutea nacido Internet tal y como loconocemos ahora Posteriormente Michael Cook y Margaret Procter (2000) sentildealaron la existenciade diferentes estrategias de recuperacioacuten de la informacioacuten por parte de los usuarios Las tresprincipales estrategias empleadas por eacutestos (incluyendo al personal propio de la entidad comousuarios) para localizar los documentos archiviacutesticos maacutes relevantes para su investigacioacuten son laidentificacioacuten directa el hojeado y la buacutesqueda o exploracioacuten La identificacioacuten directa ocurrecuando el usuario sabe una o maacutes de las caracteriacutesticas de identificacioacuten de los documentos (porejemplo un nombre especiacutefico una fecha o un coacutedigo de referencia) Para ello el requisito principales que los datos que pertenecen a cada entidad deben estar claramente identificables En laestrategia de hojear los usuarios leen las paacuteginas del asistente de buacutesqueda para seleccionarcualquier informacioacuten o tema que consideren como uacutetiles Esta estrategia se emplea condescripciones archiviacutesticas de texto libre tales como la historia administrativa la custodia o lasaacutereas de alcance y contenido En la estrategia de buacutesqueda el objetivo de la recuperacioacuten debeestar maacutes o menos bien definido La accioacuten de la exploracioacuten o buacutesqueda se basa en el uso depalabras claves Hay que tener presente que los usuarios persiguen rapidez en la presentacioacuten delos resultados mdashestaacuten habituados a los resultados de Googlemdash En esta estrategia se requiere unaOPAC correctamente construida Suele haber un cierto grado de conflicto entre la configuracioacuten delsitio web y la estructura de la bases de datos o OPAC maacutes conveniente para cada modalidad derecuperacioacuten de la informacioacuten por ello es importante que se establezcan formas de ayudasapropiadas para cada estrategia separando las referidas al hojeado de la buacutesqueda o exploracioacuten

Tambieacuten Cook y Procter (2000) han sentildealado la importancia de la indizacioacuten en los archivos comoparte de la recuperacioacuten de la informacioacuten Opinan que la creacioacuten de los iacutendices son partesesenciales de una descripcioacuten archiviacutestica y que son puntos de acceso necesarios en un sistemade recuperacioacuten de la informacioacuten La importancia de los iacutendices en la descripcioacuten archiviacutestica haaumentado en estos uacuteltimos antildeos El vocabulario de los iacutendices debe estar hecho con antelacioacuten ydeben ser una parte de un sistema integrado de apoyo en la recuperacioacuten de la informacioacuten Losusuarios tienen que disponer de acceso directo a los iacutendices Los iacutendices son ayudas secundariasde la recuperacioacuten Ello permite llevar a los usuarios de forma certera a las descripciones que en elsistema estaacuten indizadas permitiendo recuperar directamente los documentos que se desean Serecomienda que los iacutendices sean palabras claves dentro de los asistentes de buacutesqueda

2 Instrumentos a nuestro alcance para la recuperacioacuten de lainformacioacuten

En la actualidad disponemos de diversos instrumentos a nuestro alcance para resolver de la formamaacutes eficiente la recuperacioacuten de la informacioacuten en los archivos que han decidido poner sus fondosa disposicioacuten de cualquier usuario o a usuarios de una comunidad especiacutefica Estos instrumentosse basan en software y en hardware asiacute como en aplicacioacuten de estaacutendares No vamos a tratar delhardware ni del software especiacutefico sino de forma geneacuterica que nos ofrecen las TICs paraoptimizar la gestioacuten y por tanto la recuperacioacuten de la informacioacuten

Hemos de dejar claro que todo el trabajo que se realiza en la administracioacuten de los archivos y en lagestioacuten de los documentos converge en una sola finalidad poder consultar los documentos trasuna peticioacuten Los documentos se clasifican se ordenan se describen se garantiza su oacuteptimaconservacioacuten para poder resolver la consulta en un momento dado

Entre los instrumentos a nuestro alcance destacamos

21 Base de datos

La base de datos y el sistema de gestioacuten de bases de datos han revolucionado la gestioacuten de los

documentos Es en definitiva la convergencia de un sistema de gestioacuten basado en muebles concajones que contienen fichas descriptivas (ordenadas tradicionalmente por lugares fechas oasuntos) a un sistema de gestioacuten electroacutenica donde identificamos campos en los que se almacenandatos o informacioacuten

Mientras que las bases de datos son un conjunto o coleccioacuten de datos un sistema de gestioacuten debases de datos mdashSGBDmdash es un software que permite la creacioacuten mantenimiento y explotacioacuten dela base de datos (Abadal Codina 2005 18-19) Una base de datos es una coleccioacuten organizadade datos para uno o maacutes propoacutesitos y que por lo general en las uacuteltimas deacutecadas la encontramosen forma digital El teacutermino base de datos se aplica a los datos y estructuras de datos y no alSGBD que requiere de un software para gestionarlos dado que la estructura de una base de datossuele ser demasiado compleja para ser manejada sin su SGBD La base de datos SQL dispone delestaacutendar ISOIEC 9075 mdashInformation technology Database languages SQLmdash actualizado confrecuencia

Descripcioacuten archiviacutestica

La normalizacioacuten en la descripcioacuten archiviacutestica mdashestaacutendares como ISAD (G) ISAAR-CPM EAD oEAC-CPFmdash permite estructurar la descripcioacuten de la informacioacuten y la descripcioacuten de susproductores Ello supone otro gran avance porque ha abierto la posibilidad de hacer interoperablesdistintas bases de datos La aplicacioacuten de los estaacutendares va a permitir mdashal igual que en lasbibliotecas lo permitioacute la ISBD o los distintos formatos MARCmdash interrelacionar las bases de datoscon campos definidos para la descripcioacuten y el anaacutelisis documental Queremos hacer hincapieacute entres partes que caracterizan a la descripcioacuten archiviacutestica por las cuales se debe poder realizar larecuperacioacuten de la informacioacuten

1 Descripcioacuten del contexto Son campos destinados a describir al productor de ladocumentacioacuten archiviacutestica especialmente mediante las normas ISAAR-CPF o la EAC-CPFEn opinioacuten de la comisioacuten que elaboroacute la ISAAR-CPF con ello se consigue al mismo tiempofacilitar la recuperacioacuten de informacioacuten de las descripciones archiviacutesticas asiacute como que larecuperacioacuten de la informacioacuten se vea mejorada por el uso de puntos de acceso (o teacuterminosiacutendice) y que los puntos de acceso funcionen mejor cuando estaacuten estandarizados por mediode un registro de autoridad (Thibodeau 1995) El intereacutes por describir el contexto en ladocumentacioacuten archiviacutestica es algo maacutes para saber que el expediente es auteacutentico debeestar identificado su productor en el mundo se ha de especificar el sistema que lo gestionase tienen que nombrar sus creadores y los procesos por los que se identifica La descripcioacutendel contexto a partir de los metadatos generados contribuye a garantizar su autenticidad(Cumming K 2007) Desde el punto de vista de la recuperacioacuten de la informacioacuten es muchomaacutes relevante describir al productor en un archivo que recoge documentacioacuten de muchosproductores que en un archivo de un uacutenico productor puesto que una peticioacuten de buacutesquedapuede ser la recuperacioacuten de los documentos producidos por un productor dado Desde elpunto de vista de la autenticidad y las medidas de conservacioacuten se debe describir elproductor

2 Descripcioacuten de la unidad archiviacutestica Bien hablemos de Unidad de Informacioacuten bien deUnidad Archiviacutestica en este apartado lo entendemos como unidad de descripcioacuten tal y comolo define la norma ISAD (G) es decir como un documento o conjunto de documentoscualquiera que sea su forma fiacutesica tratado como un todo y que como tal constituye la basede una uacutenica descripcioacuten La norma identifica 26 elementos para describir cualquier unidad(fondo serie unidad documental compuesta o simple etc) La traslacioacuten de los elementos acampos de una base de datos hace posible su recuperacioacuten automatizada con todas lascaracteriacutesticas que puedan ofrecer estos campos numeacutericos (para procesar nuacutemerosmaacutescaras de bits fechas u horas) o alfanumeacutericos Igualmente los etiquetados de la EADsirven para ser trasladados a bases de datos

3 Indizacioacuten Utilizada en los archivos al menos desde eacutepoca medieval de forma progresivase va incorporando a las bases de datos archiviacutesticas A principios del siglo XXI eran escasasen el entorno espantildeol las bases de datos que habiacutean incorporado la indizacioacuten (bien sea conlenguaje documental o con lenguaje libre) como campos para la recuperacioacuten de lainformacioacuten Hemos de resaltar la diferencia que existe entre iacutendice y productor El primerocomo uno de tantos puntos de acceso a la informacioacuten registrada en ciertos campos de labase de datos donde se aconseja la utilizacioacuten de un lenguaje documental que lo utilizantanto las bibliotecas como los archivos para indicar lugares materias organismos opersonas Mientras que el del productor en los archivos es un concepto maacutes amplio mdashcomo

hemos indicado anteriormentemdash y dispone de su norma especiacutefica para describir estecontexto

Interoperabilidad

La interoperabilidad la entendemos como la propiedad de un producto o de un sistema que escapaz de conseguir la utilizacioacuten de software por distintos sistemas informaacuteticos (sistemasoperativos y aplicaciones de software) interconectados por diferentes tipos de redes para elintercambio de informacioacuten o de datos En los archivos inicialmente mdashantildeos 70 y 80mdash laintroduccioacuten de software y hardware fue para la automatizacioacuten de distintas unidades dedescripcioacuten en bases de datos muchas veces con la realizacioacuten de iacutendices para favorecer larecuperacioacuten de la informacioacuten Primero se introdujo en local (Bell 1975) posteriormente aparecioacuteel intereacutes de compartir esta informacioacuten en liacutenea (Arad Bell 1977-1978) como ocurriacutea en lasbibliotecas y finalmente la automatizacioacuten iba a contemplar la totalidad de la gestioacuten en unaorganizacioacuten (Vaacutezquez de Parga 1986) Desde la perspectiva de la recuperacioacuten de la informacioacutennos interesa destacar la interoperabilidad desde dos aspectos

1 Intercambio de datos El intercambio de datos e informacioacuten se efectuacutea principalmentemediante una estructura de datos (los campos de las bases de datos o mediante scriptscreados para la transferencia de los datos) A nivel europeo el programa IDA (Intercambio deDatos entre Administraciones) ha sido una gran iniciativa que desde 1998 ha generadoexperiencias estaacutendares y aplicaciones para hacer posible la interoperabilidad de las redestelemaacuteticas transeuropeas destinadas al intercambio de datos entre administraciones (UnioacutenEuropea 1998) con ello hemos alcanzado que los archivos sean interoperables(Klischewski 2004) En Espantildea en 2010 empieza a regularse el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica (Espantildea 2010) Sin embargoen los archivos histoacutericos que han decidido poner a disposicioacuten de los usuarios sus fondosdistintos sistemas de redes y software ya existentes han permitido desde hace maacutes de unadeacutecada el completo intercambio de datos e informacioacuten en Internet

2 Datos enlazados o vinculados En el entorno de alcanzar la web semaacutentica la aparicioacuten en1999 de la especificacioacuten RDF mdashResource Description Frameworkmdash de la World Wide WebConsortium (W3C) fue el inicio que permitioacute poner datos o metadatos en la web para suprocesamiento proporcionando interoperabilidad entre aplicaciones que intercambianinformacioacuten legible por maacutequina en la web Tim Berners-Lee (2006) acuntildeoacute maacutes tarde elconcepto de Linked Data sentildealando que con los datos vinculados se pueden encontrar en laweb otros datos relacionados No se trata de la Web Hipertexto sino de la definicioacuten de unasintaxis abstracta basada en RDF que sirve para vincular su sintaxis concreta a susemaacutentica formal incluyendo entre otros el tratamiento de referencias URI (UniversalResource Identifier)

3 Anaacutelisis a partir de casos

La recuperacioacuten de la informacioacuten de los archivos que han puesto a disposicioacuten de los usuarios ladescripcioacuten de sus contenidos en liacutenea se debe poder realizar bien interrogando el productor mdashISAAR (CPF) o EAC (CPF)mdash bien interrogando los campos de la descripcioacuten mdashprincipalmente losestaacutendares ISAD (G) o EADmdash bien interrogando su indizacioacuten mdashlenguajes documentalesespecialmente tesauros para las materias geograacutefico entidades o personasmdash o bien sondeandoen su interoperabilidad mdashespecialmente a partir de los metadatos RDFmdash

31 Interrogacioacuten sobre el productor

En los archivos se describe al productor mdashbien sean instituciones personas o familiasmdash con lafinalidad de controlar el contexto que ha producido un fondo documental No tiene sentido realizaresfuerzos en describir productores que no se enlacen o no se vayan a enlazar con lasdescripciones de los fondos documentales Ni tiene sentido describir en sobremanera a unproductor mdashcasi una investigacioacuten cientiacutefica de historia de las institucionesmdash si esa informacioacuten nosirve directamente para identificar el contexto y para recuperar la informacioacuten de los fondosdocumentales archiviacutesticos Con la identificacioacuten y descripcioacuten del productor garantizaremos

tambieacuten la autenticidad y si aplicamos por ejemplo un OAIS mdashOpen Archival Information System(ISO 14721 2003)mdash conseguimos tambieacuten la conservacioacuten de la documentacioacuten en nuestrosistema de gestioacuten documental

En Espantildea la principal base de datos que utiliza la ISAAR (CPF) y al mismo tiempo la EAC-CPFestaacute disponible en el Censo Guiacutea de Archivos de Espantildea e Iberoameacuterica Contiene un total de4324 descripciones y es posible su buacutesqueda por personas familias o instituciones Lasdescripciones se pueden tambieacuten visualizar seguacuten la codificacioacuten EAC-CPF

Imagen 1 Descripcioacuten de Autoridades en el Censo-Guiacutea (Espantildea)

Imagen 2 Visualizacioacuten codificada EAC

En esta base de datos se debe mejorar la unificacioacuten de criterios en algunas consideramosescasas descripciones de entidades como por ejemplo en el caso del Consejo de Aragoacuten y elConsejo Supremo de Aragoacuten ya que nos referimos al mismo productor y debe disponer enconsecuencia de un identificador y no de dos identificadores (ES28079MCU193 y ES8019ACA2)Pero la mejora maacutes destacada que se ha de realizar estaacute relacionada en la misma finalidad de ladescripcioacuten del productor recuperar los fondos que eacuteste ha producido En este sentido salvoalgunas excepciones la identificacioacuten del productor no enlaza con la base de datos que describelos fondos documentales

A nivel internacional uno de los proyectos maacutes interesantes es SNAC (Social Networks and ArchivalContext Project) Se aprovecha del estaacutendar EAC-CPF y de tecnologiacutea digital para desbloquearlas descripciones de las personas desde las fuentes secundarias e integrarlas en nuevas utilidadespara por una parte crear eficientes herramientas de coacutedigo abierto que permitan a los archiverosseparar el proceso de describir las personas del de describir los documentos o unidades dedescripcioacuten y por otra crear un prototipo integrado de los recursos histoacutericos y sistema de acceso

que permitiraacute el enlace mutuo de las descripciones de las personas con las descripcionesrealizadas en los archivos bibliotecas y museos Dicho prototipo ya estaacute en funcionamiento(httpsocialarchiveiathvirginiaeduxtfsearch) y permite efectuar buacutesquedas sobre personasfamilias o instituciones y enlaza con las descripciones de las instituciones en liacutenea que disponende esos fondos documentales

Imagen 3 Prototipo SNAC

Imagen 4 Prototipo SNAC ejemplo de descripcioacuten de institucioacuten y enlace con las unidades de descripcioacutenrelacionas

32 Interrogacioacuten sobre los campos de descripcioacuten

En los archivos los campos de las unidades de descripcioacuten se regulan principalmente por losestaacutendares ISAD (G) o por las EAD Una de las principales ventajas de estos estaacutendares es quepermiten la descripcioacuten multinivel otra cuestioacuten distinta es que el software que lo soporta seacapaz de integrar la descripcioacuten multinivel en su base de datos La otra ventaja de los estaacutendareses que al fin se consiguioacute en archivos algo que ya ocurriacutea en bibliotecas hacer posible lainteroperabilidad de datos ya que se ha consensuado una estructura uacutenica de campos y definir lafuncioacuten de esos campos mdashcomo en bibliotecas el formato MARCmdash Cualquier alteracioacuten delnuacutemero de los campos o de la funcioacuten de los mismos rompe con uno de los objetivos de estosestaacutendares hacer posible la creacioacuten de redes entre archivos o la interconexioacuten entre diferentesbases de datos

En Espantildea el Portal de Archivos Espantildeoles (PARES) es el sitio web maacutes importante por el volumende unidades de descripcioacuten realizadas y como valor antildeadido por la disposicioacuten de documentosdigitalizados en abierto La utilizacioacuten de los estaacutendares ha facilitado la interconexioacuten entre losdiferentes archivos espantildeoles que estaacuten en esta red La buacutesqueda avanzada no permite

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 4: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

documentos Es en definitiva la convergencia de un sistema de gestioacuten basado en muebles concajones que contienen fichas descriptivas (ordenadas tradicionalmente por lugares fechas oasuntos) a un sistema de gestioacuten electroacutenica donde identificamos campos en los que se almacenandatos o informacioacuten

Mientras que las bases de datos son un conjunto o coleccioacuten de datos un sistema de gestioacuten debases de datos mdashSGBDmdash es un software que permite la creacioacuten mantenimiento y explotacioacuten dela base de datos (Abadal Codina 2005 18-19) Una base de datos es una coleccioacuten organizadade datos para uno o maacutes propoacutesitos y que por lo general en las uacuteltimas deacutecadas la encontramosen forma digital El teacutermino base de datos se aplica a los datos y estructuras de datos y no alSGBD que requiere de un software para gestionarlos dado que la estructura de una base de datossuele ser demasiado compleja para ser manejada sin su SGBD La base de datos SQL dispone delestaacutendar ISOIEC 9075 mdashInformation technology Database languages SQLmdash actualizado confrecuencia

Descripcioacuten archiviacutestica

La normalizacioacuten en la descripcioacuten archiviacutestica mdashestaacutendares como ISAD (G) ISAAR-CPM EAD oEAC-CPFmdash permite estructurar la descripcioacuten de la informacioacuten y la descripcioacuten de susproductores Ello supone otro gran avance porque ha abierto la posibilidad de hacer interoperablesdistintas bases de datos La aplicacioacuten de los estaacutendares va a permitir mdashal igual que en lasbibliotecas lo permitioacute la ISBD o los distintos formatos MARCmdash interrelacionar las bases de datoscon campos definidos para la descripcioacuten y el anaacutelisis documental Queremos hacer hincapieacute entres partes que caracterizan a la descripcioacuten archiviacutestica por las cuales se debe poder realizar larecuperacioacuten de la informacioacuten

1 Descripcioacuten del contexto Son campos destinados a describir al productor de ladocumentacioacuten archiviacutestica especialmente mediante las normas ISAAR-CPF o la EAC-CPFEn opinioacuten de la comisioacuten que elaboroacute la ISAAR-CPF con ello se consigue al mismo tiempofacilitar la recuperacioacuten de informacioacuten de las descripciones archiviacutesticas asiacute como que larecuperacioacuten de la informacioacuten se vea mejorada por el uso de puntos de acceso (o teacuterminosiacutendice) y que los puntos de acceso funcionen mejor cuando estaacuten estandarizados por mediode un registro de autoridad (Thibodeau 1995) El intereacutes por describir el contexto en ladocumentacioacuten archiviacutestica es algo maacutes para saber que el expediente es auteacutentico debeestar identificado su productor en el mundo se ha de especificar el sistema que lo gestionase tienen que nombrar sus creadores y los procesos por los que se identifica La descripcioacutendel contexto a partir de los metadatos generados contribuye a garantizar su autenticidad(Cumming K 2007) Desde el punto de vista de la recuperacioacuten de la informacioacuten es muchomaacutes relevante describir al productor en un archivo que recoge documentacioacuten de muchosproductores que en un archivo de un uacutenico productor puesto que una peticioacuten de buacutesquedapuede ser la recuperacioacuten de los documentos producidos por un productor dado Desde elpunto de vista de la autenticidad y las medidas de conservacioacuten se debe describir elproductor

2 Descripcioacuten de la unidad archiviacutestica Bien hablemos de Unidad de Informacioacuten bien deUnidad Archiviacutestica en este apartado lo entendemos como unidad de descripcioacuten tal y comolo define la norma ISAD (G) es decir como un documento o conjunto de documentoscualquiera que sea su forma fiacutesica tratado como un todo y que como tal constituye la basede una uacutenica descripcioacuten La norma identifica 26 elementos para describir cualquier unidad(fondo serie unidad documental compuesta o simple etc) La traslacioacuten de los elementos acampos de una base de datos hace posible su recuperacioacuten automatizada con todas lascaracteriacutesticas que puedan ofrecer estos campos numeacutericos (para procesar nuacutemerosmaacutescaras de bits fechas u horas) o alfanumeacutericos Igualmente los etiquetados de la EADsirven para ser trasladados a bases de datos

3 Indizacioacuten Utilizada en los archivos al menos desde eacutepoca medieval de forma progresivase va incorporando a las bases de datos archiviacutesticas A principios del siglo XXI eran escasasen el entorno espantildeol las bases de datos que habiacutean incorporado la indizacioacuten (bien sea conlenguaje documental o con lenguaje libre) como campos para la recuperacioacuten de lainformacioacuten Hemos de resaltar la diferencia que existe entre iacutendice y productor El primerocomo uno de tantos puntos de acceso a la informacioacuten registrada en ciertos campos de labase de datos donde se aconseja la utilizacioacuten de un lenguaje documental que lo utilizantanto las bibliotecas como los archivos para indicar lugares materias organismos opersonas Mientras que el del productor en los archivos es un concepto maacutes amplio mdashcomo

hemos indicado anteriormentemdash y dispone de su norma especiacutefica para describir estecontexto

Interoperabilidad

La interoperabilidad la entendemos como la propiedad de un producto o de un sistema que escapaz de conseguir la utilizacioacuten de software por distintos sistemas informaacuteticos (sistemasoperativos y aplicaciones de software) interconectados por diferentes tipos de redes para elintercambio de informacioacuten o de datos En los archivos inicialmente mdashantildeos 70 y 80mdash laintroduccioacuten de software y hardware fue para la automatizacioacuten de distintas unidades dedescripcioacuten en bases de datos muchas veces con la realizacioacuten de iacutendices para favorecer larecuperacioacuten de la informacioacuten Primero se introdujo en local (Bell 1975) posteriormente aparecioacuteel intereacutes de compartir esta informacioacuten en liacutenea (Arad Bell 1977-1978) como ocurriacutea en lasbibliotecas y finalmente la automatizacioacuten iba a contemplar la totalidad de la gestioacuten en unaorganizacioacuten (Vaacutezquez de Parga 1986) Desde la perspectiva de la recuperacioacuten de la informacioacutennos interesa destacar la interoperabilidad desde dos aspectos

1 Intercambio de datos El intercambio de datos e informacioacuten se efectuacutea principalmentemediante una estructura de datos (los campos de las bases de datos o mediante scriptscreados para la transferencia de los datos) A nivel europeo el programa IDA (Intercambio deDatos entre Administraciones) ha sido una gran iniciativa que desde 1998 ha generadoexperiencias estaacutendares y aplicaciones para hacer posible la interoperabilidad de las redestelemaacuteticas transeuropeas destinadas al intercambio de datos entre administraciones (UnioacutenEuropea 1998) con ello hemos alcanzado que los archivos sean interoperables(Klischewski 2004) En Espantildea en 2010 empieza a regularse el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica (Espantildea 2010) Sin embargoen los archivos histoacutericos que han decidido poner a disposicioacuten de los usuarios sus fondosdistintos sistemas de redes y software ya existentes han permitido desde hace maacutes de unadeacutecada el completo intercambio de datos e informacioacuten en Internet

2 Datos enlazados o vinculados En el entorno de alcanzar la web semaacutentica la aparicioacuten en1999 de la especificacioacuten RDF mdashResource Description Frameworkmdash de la World Wide WebConsortium (W3C) fue el inicio que permitioacute poner datos o metadatos en la web para suprocesamiento proporcionando interoperabilidad entre aplicaciones que intercambianinformacioacuten legible por maacutequina en la web Tim Berners-Lee (2006) acuntildeoacute maacutes tarde elconcepto de Linked Data sentildealando que con los datos vinculados se pueden encontrar en laweb otros datos relacionados No se trata de la Web Hipertexto sino de la definicioacuten de unasintaxis abstracta basada en RDF que sirve para vincular su sintaxis concreta a susemaacutentica formal incluyendo entre otros el tratamiento de referencias URI (UniversalResource Identifier)

3 Anaacutelisis a partir de casos

La recuperacioacuten de la informacioacuten de los archivos que han puesto a disposicioacuten de los usuarios ladescripcioacuten de sus contenidos en liacutenea se debe poder realizar bien interrogando el productor mdashISAAR (CPF) o EAC (CPF)mdash bien interrogando los campos de la descripcioacuten mdashprincipalmente losestaacutendares ISAD (G) o EADmdash bien interrogando su indizacioacuten mdashlenguajes documentalesespecialmente tesauros para las materias geograacutefico entidades o personasmdash o bien sondeandoen su interoperabilidad mdashespecialmente a partir de los metadatos RDFmdash

31 Interrogacioacuten sobre el productor

En los archivos se describe al productor mdashbien sean instituciones personas o familiasmdash con lafinalidad de controlar el contexto que ha producido un fondo documental No tiene sentido realizaresfuerzos en describir productores que no se enlacen o no se vayan a enlazar con lasdescripciones de los fondos documentales Ni tiene sentido describir en sobremanera a unproductor mdashcasi una investigacioacuten cientiacutefica de historia de las institucionesmdash si esa informacioacuten nosirve directamente para identificar el contexto y para recuperar la informacioacuten de los fondosdocumentales archiviacutesticos Con la identificacioacuten y descripcioacuten del productor garantizaremos

tambieacuten la autenticidad y si aplicamos por ejemplo un OAIS mdashOpen Archival Information System(ISO 14721 2003)mdash conseguimos tambieacuten la conservacioacuten de la documentacioacuten en nuestrosistema de gestioacuten documental

En Espantildea la principal base de datos que utiliza la ISAAR (CPF) y al mismo tiempo la EAC-CPFestaacute disponible en el Censo Guiacutea de Archivos de Espantildea e Iberoameacuterica Contiene un total de4324 descripciones y es posible su buacutesqueda por personas familias o instituciones Lasdescripciones se pueden tambieacuten visualizar seguacuten la codificacioacuten EAC-CPF

Imagen 1 Descripcioacuten de Autoridades en el Censo-Guiacutea (Espantildea)

Imagen 2 Visualizacioacuten codificada EAC

En esta base de datos se debe mejorar la unificacioacuten de criterios en algunas consideramosescasas descripciones de entidades como por ejemplo en el caso del Consejo de Aragoacuten y elConsejo Supremo de Aragoacuten ya que nos referimos al mismo productor y debe disponer enconsecuencia de un identificador y no de dos identificadores (ES28079MCU193 y ES8019ACA2)Pero la mejora maacutes destacada que se ha de realizar estaacute relacionada en la misma finalidad de ladescripcioacuten del productor recuperar los fondos que eacuteste ha producido En este sentido salvoalgunas excepciones la identificacioacuten del productor no enlaza con la base de datos que describelos fondos documentales

A nivel internacional uno de los proyectos maacutes interesantes es SNAC (Social Networks and ArchivalContext Project) Se aprovecha del estaacutendar EAC-CPF y de tecnologiacutea digital para desbloquearlas descripciones de las personas desde las fuentes secundarias e integrarlas en nuevas utilidadespara por una parte crear eficientes herramientas de coacutedigo abierto que permitan a los archiverosseparar el proceso de describir las personas del de describir los documentos o unidades dedescripcioacuten y por otra crear un prototipo integrado de los recursos histoacutericos y sistema de acceso

que permitiraacute el enlace mutuo de las descripciones de las personas con las descripcionesrealizadas en los archivos bibliotecas y museos Dicho prototipo ya estaacute en funcionamiento(httpsocialarchiveiathvirginiaeduxtfsearch) y permite efectuar buacutesquedas sobre personasfamilias o instituciones y enlaza con las descripciones de las instituciones en liacutenea que disponende esos fondos documentales

Imagen 3 Prototipo SNAC

Imagen 4 Prototipo SNAC ejemplo de descripcioacuten de institucioacuten y enlace con las unidades de descripcioacutenrelacionas

32 Interrogacioacuten sobre los campos de descripcioacuten

En los archivos los campos de las unidades de descripcioacuten se regulan principalmente por losestaacutendares ISAD (G) o por las EAD Una de las principales ventajas de estos estaacutendares es quepermiten la descripcioacuten multinivel otra cuestioacuten distinta es que el software que lo soporta seacapaz de integrar la descripcioacuten multinivel en su base de datos La otra ventaja de los estaacutendareses que al fin se consiguioacute en archivos algo que ya ocurriacutea en bibliotecas hacer posible lainteroperabilidad de datos ya que se ha consensuado una estructura uacutenica de campos y definir lafuncioacuten de esos campos mdashcomo en bibliotecas el formato MARCmdash Cualquier alteracioacuten delnuacutemero de los campos o de la funcioacuten de los mismos rompe con uno de los objetivos de estosestaacutendares hacer posible la creacioacuten de redes entre archivos o la interconexioacuten entre diferentesbases de datos

En Espantildea el Portal de Archivos Espantildeoles (PARES) es el sitio web maacutes importante por el volumende unidades de descripcioacuten realizadas y como valor antildeadido por la disposicioacuten de documentosdigitalizados en abierto La utilizacioacuten de los estaacutendares ha facilitado la interconexioacuten entre losdiferentes archivos espantildeoles que estaacuten en esta red La buacutesqueda avanzada no permite

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 5: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

hemos indicado anteriormentemdash y dispone de su norma especiacutefica para describir estecontexto

Interoperabilidad

La interoperabilidad la entendemos como la propiedad de un producto o de un sistema que escapaz de conseguir la utilizacioacuten de software por distintos sistemas informaacuteticos (sistemasoperativos y aplicaciones de software) interconectados por diferentes tipos de redes para elintercambio de informacioacuten o de datos En los archivos inicialmente mdashantildeos 70 y 80mdash laintroduccioacuten de software y hardware fue para la automatizacioacuten de distintas unidades dedescripcioacuten en bases de datos muchas veces con la realizacioacuten de iacutendices para favorecer larecuperacioacuten de la informacioacuten Primero se introdujo en local (Bell 1975) posteriormente aparecioacuteel intereacutes de compartir esta informacioacuten en liacutenea (Arad Bell 1977-1978) como ocurriacutea en lasbibliotecas y finalmente la automatizacioacuten iba a contemplar la totalidad de la gestioacuten en unaorganizacioacuten (Vaacutezquez de Parga 1986) Desde la perspectiva de la recuperacioacuten de la informacioacutennos interesa destacar la interoperabilidad desde dos aspectos

1 Intercambio de datos El intercambio de datos e informacioacuten se efectuacutea principalmentemediante una estructura de datos (los campos de las bases de datos o mediante scriptscreados para la transferencia de los datos) A nivel europeo el programa IDA (Intercambio deDatos entre Administraciones) ha sido una gran iniciativa que desde 1998 ha generadoexperiencias estaacutendares y aplicaciones para hacer posible la interoperabilidad de las redestelemaacuteticas transeuropeas destinadas al intercambio de datos entre administraciones (UnioacutenEuropea 1998) con ello hemos alcanzado que los archivos sean interoperables(Klischewski 2004) En Espantildea en 2010 empieza a regularse el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica (Espantildea 2010) Sin embargoen los archivos histoacutericos que han decidido poner a disposicioacuten de los usuarios sus fondosdistintos sistemas de redes y software ya existentes han permitido desde hace maacutes de unadeacutecada el completo intercambio de datos e informacioacuten en Internet

2 Datos enlazados o vinculados En el entorno de alcanzar la web semaacutentica la aparicioacuten en1999 de la especificacioacuten RDF mdashResource Description Frameworkmdash de la World Wide WebConsortium (W3C) fue el inicio que permitioacute poner datos o metadatos en la web para suprocesamiento proporcionando interoperabilidad entre aplicaciones que intercambianinformacioacuten legible por maacutequina en la web Tim Berners-Lee (2006) acuntildeoacute maacutes tarde elconcepto de Linked Data sentildealando que con los datos vinculados se pueden encontrar en laweb otros datos relacionados No se trata de la Web Hipertexto sino de la definicioacuten de unasintaxis abstracta basada en RDF que sirve para vincular su sintaxis concreta a susemaacutentica formal incluyendo entre otros el tratamiento de referencias URI (UniversalResource Identifier)

3 Anaacutelisis a partir de casos

La recuperacioacuten de la informacioacuten de los archivos que han puesto a disposicioacuten de los usuarios ladescripcioacuten de sus contenidos en liacutenea se debe poder realizar bien interrogando el productor mdashISAAR (CPF) o EAC (CPF)mdash bien interrogando los campos de la descripcioacuten mdashprincipalmente losestaacutendares ISAD (G) o EADmdash bien interrogando su indizacioacuten mdashlenguajes documentalesespecialmente tesauros para las materias geograacutefico entidades o personasmdash o bien sondeandoen su interoperabilidad mdashespecialmente a partir de los metadatos RDFmdash

31 Interrogacioacuten sobre el productor

En los archivos se describe al productor mdashbien sean instituciones personas o familiasmdash con lafinalidad de controlar el contexto que ha producido un fondo documental No tiene sentido realizaresfuerzos en describir productores que no se enlacen o no se vayan a enlazar con lasdescripciones de los fondos documentales Ni tiene sentido describir en sobremanera a unproductor mdashcasi una investigacioacuten cientiacutefica de historia de las institucionesmdash si esa informacioacuten nosirve directamente para identificar el contexto y para recuperar la informacioacuten de los fondosdocumentales archiviacutesticos Con la identificacioacuten y descripcioacuten del productor garantizaremos

tambieacuten la autenticidad y si aplicamos por ejemplo un OAIS mdashOpen Archival Information System(ISO 14721 2003)mdash conseguimos tambieacuten la conservacioacuten de la documentacioacuten en nuestrosistema de gestioacuten documental

En Espantildea la principal base de datos que utiliza la ISAAR (CPF) y al mismo tiempo la EAC-CPFestaacute disponible en el Censo Guiacutea de Archivos de Espantildea e Iberoameacuterica Contiene un total de4324 descripciones y es posible su buacutesqueda por personas familias o instituciones Lasdescripciones se pueden tambieacuten visualizar seguacuten la codificacioacuten EAC-CPF

Imagen 1 Descripcioacuten de Autoridades en el Censo-Guiacutea (Espantildea)

Imagen 2 Visualizacioacuten codificada EAC

En esta base de datos se debe mejorar la unificacioacuten de criterios en algunas consideramosescasas descripciones de entidades como por ejemplo en el caso del Consejo de Aragoacuten y elConsejo Supremo de Aragoacuten ya que nos referimos al mismo productor y debe disponer enconsecuencia de un identificador y no de dos identificadores (ES28079MCU193 y ES8019ACA2)Pero la mejora maacutes destacada que se ha de realizar estaacute relacionada en la misma finalidad de ladescripcioacuten del productor recuperar los fondos que eacuteste ha producido En este sentido salvoalgunas excepciones la identificacioacuten del productor no enlaza con la base de datos que describelos fondos documentales

A nivel internacional uno de los proyectos maacutes interesantes es SNAC (Social Networks and ArchivalContext Project) Se aprovecha del estaacutendar EAC-CPF y de tecnologiacutea digital para desbloquearlas descripciones de las personas desde las fuentes secundarias e integrarlas en nuevas utilidadespara por una parte crear eficientes herramientas de coacutedigo abierto que permitan a los archiverosseparar el proceso de describir las personas del de describir los documentos o unidades dedescripcioacuten y por otra crear un prototipo integrado de los recursos histoacutericos y sistema de acceso

que permitiraacute el enlace mutuo de las descripciones de las personas con las descripcionesrealizadas en los archivos bibliotecas y museos Dicho prototipo ya estaacute en funcionamiento(httpsocialarchiveiathvirginiaeduxtfsearch) y permite efectuar buacutesquedas sobre personasfamilias o instituciones y enlaza con las descripciones de las instituciones en liacutenea que disponende esos fondos documentales

Imagen 3 Prototipo SNAC

Imagen 4 Prototipo SNAC ejemplo de descripcioacuten de institucioacuten y enlace con las unidades de descripcioacutenrelacionas

32 Interrogacioacuten sobre los campos de descripcioacuten

En los archivos los campos de las unidades de descripcioacuten se regulan principalmente por losestaacutendares ISAD (G) o por las EAD Una de las principales ventajas de estos estaacutendares es quepermiten la descripcioacuten multinivel otra cuestioacuten distinta es que el software que lo soporta seacapaz de integrar la descripcioacuten multinivel en su base de datos La otra ventaja de los estaacutendareses que al fin se consiguioacute en archivos algo que ya ocurriacutea en bibliotecas hacer posible lainteroperabilidad de datos ya que se ha consensuado una estructura uacutenica de campos y definir lafuncioacuten de esos campos mdashcomo en bibliotecas el formato MARCmdash Cualquier alteracioacuten delnuacutemero de los campos o de la funcioacuten de los mismos rompe con uno de los objetivos de estosestaacutendares hacer posible la creacioacuten de redes entre archivos o la interconexioacuten entre diferentesbases de datos

En Espantildea el Portal de Archivos Espantildeoles (PARES) es el sitio web maacutes importante por el volumende unidades de descripcioacuten realizadas y como valor antildeadido por la disposicioacuten de documentosdigitalizados en abierto La utilizacioacuten de los estaacutendares ha facilitado la interconexioacuten entre losdiferentes archivos espantildeoles que estaacuten en esta red La buacutesqueda avanzada no permite

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 6: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

tambieacuten la autenticidad y si aplicamos por ejemplo un OAIS mdashOpen Archival Information System(ISO 14721 2003)mdash conseguimos tambieacuten la conservacioacuten de la documentacioacuten en nuestrosistema de gestioacuten documental

En Espantildea la principal base de datos que utiliza la ISAAR (CPF) y al mismo tiempo la EAC-CPFestaacute disponible en el Censo Guiacutea de Archivos de Espantildea e Iberoameacuterica Contiene un total de4324 descripciones y es posible su buacutesqueda por personas familias o instituciones Lasdescripciones se pueden tambieacuten visualizar seguacuten la codificacioacuten EAC-CPF

Imagen 1 Descripcioacuten de Autoridades en el Censo-Guiacutea (Espantildea)

Imagen 2 Visualizacioacuten codificada EAC

En esta base de datos se debe mejorar la unificacioacuten de criterios en algunas consideramosescasas descripciones de entidades como por ejemplo en el caso del Consejo de Aragoacuten y elConsejo Supremo de Aragoacuten ya que nos referimos al mismo productor y debe disponer enconsecuencia de un identificador y no de dos identificadores (ES28079MCU193 y ES8019ACA2)Pero la mejora maacutes destacada que se ha de realizar estaacute relacionada en la misma finalidad de ladescripcioacuten del productor recuperar los fondos que eacuteste ha producido En este sentido salvoalgunas excepciones la identificacioacuten del productor no enlaza con la base de datos que describelos fondos documentales

A nivel internacional uno de los proyectos maacutes interesantes es SNAC (Social Networks and ArchivalContext Project) Se aprovecha del estaacutendar EAC-CPF y de tecnologiacutea digital para desbloquearlas descripciones de las personas desde las fuentes secundarias e integrarlas en nuevas utilidadespara por una parte crear eficientes herramientas de coacutedigo abierto que permitan a los archiverosseparar el proceso de describir las personas del de describir los documentos o unidades dedescripcioacuten y por otra crear un prototipo integrado de los recursos histoacutericos y sistema de acceso

que permitiraacute el enlace mutuo de las descripciones de las personas con las descripcionesrealizadas en los archivos bibliotecas y museos Dicho prototipo ya estaacute en funcionamiento(httpsocialarchiveiathvirginiaeduxtfsearch) y permite efectuar buacutesquedas sobre personasfamilias o instituciones y enlaza con las descripciones de las instituciones en liacutenea que disponende esos fondos documentales

Imagen 3 Prototipo SNAC

Imagen 4 Prototipo SNAC ejemplo de descripcioacuten de institucioacuten y enlace con las unidades de descripcioacutenrelacionas

32 Interrogacioacuten sobre los campos de descripcioacuten

En los archivos los campos de las unidades de descripcioacuten se regulan principalmente por losestaacutendares ISAD (G) o por las EAD Una de las principales ventajas de estos estaacutendares es quepermiten la descripcioacuten multinivel otra cuestioacuten distinta es que el software que lo soporta seacapaz de integrar la descripcioacuten multinivel en su base de datos La otra ventaja de los estaacutendareses que al fin se consiguioacute en archivos algo que ya ocurriacutea en bibliotecas hacer posible lainteroperabilidad de datos ya que se ha consensuado una estructura uacutenica de campos y definir lafuncioacuten de esos campos mdashcomo en bibliotecas el formato MARCmdash Cualquier alteracioacuten delnuacutemero de los campos o de la funcioacuten de los mismos rompe con uno de los objetivos de estosestaacutendares hacer posible la creacioacuten de redes entre archivos o la interconexioacuten entre diferentesbases de datos

En Espantildea el Portal de Archivos Espantildeoles (PARES) es el sitio web maacutes importante por el volumende unidades de descripcioacuten realizadas y como valor antildeadido por la disposicioacuten de documentosdigitalizados en abierto La utilizacioacuten de los estaacutendares ha facilitado la interconexioacuten entre losdiferentes archivos espantildeoles que estaacuten en esta red La buacutesqueda avanzada no permite

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 7: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

que permitiraacute el enlace mutuo de las descripciones de las personas con las descripcionesrealizadas en los archivos bibliotecas y museos Dicho prototipo ya estaacute en funcionamiento(httpsocialarchiveiathvirginiaeduxtfsearch) y permite efectuar buacutesquedas sobre personasfamilias o instituciones y enlaza con las descripciones de las instituciones en liacutenea que disponende esos fondos documentales

Imagen 3 Prototipo SNAC

Imagen 4 Prototipo SNAC ejemplo de descripcioacuten de institucioacuten y enlace con las unidades de descripcioacutenrelacionas

32 Interrogacioacuten sobre los campos de descripcioacuten

En los archivos los campos de las unidades de descripcioacuten se regulan principalmente por losestaacutendares ISAD (G) o por las EAD Una de las principales ventajas de estos estaacutendares es quepermiten la descripcioacuten multinivel otra cuestioacuten distinta es que el software que lo soporta seacapaz de integrar la descripcioacuten multinivel en su base de datos La otra ventaja de los estaacutendareses que al fin se consiguioacute en archivos algo que ya ocurriacutea en bibliotecas hacer posible lainteroperabilidad de datos ya que se ha consensuado una estructura uacutenica de campos y definir lafuncioacuten de esos campos mdashcomo en bibliotecas el formato MARCmdash Cualquier alteracioacuten delnuacutemero de los campos o de la funcioacuten de los mismos rompe con uno de los objetivos de estosestaacutendares hacer posible la creacioacuten de redes entre archivos o la interconexioacuten entre diferentesbases de datos

En Espantildea el Portal de Archivos Espantildeoles (PARES) es el sitio web maacutes importante por el volumende unidades de descripcioacuten realizadas y como valor antildeadido por la disposicioacuten de documentosdigitalizados en abierto La utilizacioacuten de los estaacutendares ha facilitado la interconexioacuten entre losdiferentes archivos espantildeoles que estaacuten en esta red La buacutesqueda avanzada no permite

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 8: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

individualizar la interrogacioacuten por todos los campos de la ISAD (G) pero dispone de suficientescajas de buacutesqueda para el rastreo de las palabras elegidas en el lenguaje natural utilizado en ladescripcioacuten o para el rastreo en los campos fecha o incluso permite realizar la buacutesqueda enarchivos especiacuteficos de la red

Imagen 5 PARES Portal de Archivos Espantildeoles

Como ejemplos extranjeros el Archivo Nacional de Colombia en su sitio web de consultadocumental permite hacer una consulta por cualquier campo de la ISAD (G) mediante su seleccioacutenen la casilla campo y recuperar por varios campos y seguacuten niveles de descripcioacuten y fondosseleccionados Este es un ejemplo del mayor aprovechamiento o integracioacuten de los campos ISAD(G) que estaacuten en la base de datos con los campos de recuperacioacuten de la informacioacuten que estaacutenen el OPAC

Imagen 6 Archivo Nacional de Colombia Buacutesqueda avanzada

33 Interrogacioacuten por la indizacioacuten

De la misma forma que en los archivos histoacutericos existen o existiacutean las fichas iacutendice ordenadasalfabeacuteticamente por un vocablo referido a la regesta de la unidad de descripcioacuten en un sistema degestioacuten documental tambieacuten es posible y conveniente indizar las descripciones de esas unidadesEn bibliotecas es bastante frecuente utilizar una lista como lenguaje documental que controla elvocabulario de la indizacioacuten sin embargo en archivos la praacutectica que tiene maacutes garantiacutea deeficacia es la utilizacioacuten de tesauros como leguaje documental para la indizacioacuten de materiasentidades o instituciones geografiacutea o personas (aunque este uacuteltimo dada la escasa importancia dela jerarquiacutea muchas veces se utiliza el mismo software para su control pero excluyendo lajerarquiacutea) Para la indizacioacuten de los archivos producidos por las organizaciones se estaacuten creando

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 9: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

tesauros especiacuteficos como el EUROVOC para la documentacioacuten de la Unioacuten Europea utilizadotambieacuten por algunas administraciones autonoacutemicas u otros tesauros para archivos histoacutericos(Gimeacutenez Escrig 2011)

Un buen ejemplo de utilizacioacuten del tesauro para las descripciones con la ISAD (G) es AIM25 Es unsitio web que proporciona acceso en liacutenea a las descripciones realizadas en los archivos de maacutes decien instituciones tanto de educacioacuten superior como sociedades cientiacuteficas organizacionesculturales o empresas que estaacuten situadas en el aacuterea metropolitana de Londres Estas institucionesdescriben su documentacioacuten a diferentes niveles pero AIM25 soacutelo recoge las descripciones a nivelcoleccioacuten o fondo Es un proyecto con maacutes de diez antildeos que crece continuamente Estainterconexioacuten entre AIM25 y las respectivas entidades mdashmaacutes de 100mdash es posible porquemantienen la estructura de los campos de la ISAD (G) y su funcionalidad Pero ademaacutes hanconseguido incorporar un tesauro uacutenico que controla el vocabulario de los registros catalograacuteficosde todas las instituciones estructurado por nombres de personas materias geograacuteficos yentidades El sitio web permite navegar por el vocabulario controlado de los tesauros ademaacutes deacceder por la institucioacuten que tiene depositado el archivo Este sistema de indizacioacuten y anaacutelisisdocumental permite recuperar la documentacioacuten pertinente

Imagen 7 AIM25 navegacioacuten por palabras clave

Imagen 8 AIM25 Ejemplo de resultados indizados por Catalonia

En Espantildea el sitio web PARES tambieacuten dispone de un instrumento para la buacutesqueda por laindizacioacuten Sin embargo su funcionamiento indica que los diferentes archivos espantildeoles estaacutenutilizando lenguaje natural para su indizacioacuten No hay referencias en el sitio web de que dispongande un lenguaje documental La utilizacioacuten de un lenguaje natural induce a la sinonimia ya no queno se da la univocidad de los descriptores En un sistema de gestioacuten documental por bases dedatos imposibilita la recuperacioacuten total de los documentos pertinentes Por ejemplo el conceptoMorisco lo encontramos indizado como MORISCOS Morisco Moriscos de MarbellaMoriscos o Bandolerismo Moriscos de Marbella mdashen este uacuteltimo teacutermino han unido tresconceptos dos materias (bandolerismo y moriscos) y uno geograacutefico (Marbella)mdash Esto imposibilitala recuperacioacuten de la informacioacuten pertinente dado que el sistema no da los mismos resultados porejemplo para Moriscos que para Bandolerismo Moriscos de Marbella Para solucionar elproblema debe existir un lenguaje controlado que sea utilizado en todo el sistema

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 10: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

Imagen 9 PARES buacutesqueda por iacutendices

34 Interoperabilidad Web

Nos referimos a la Web Semaacutentica Ya tenemos a nuestra disposicioacuten instrumentos que haganposible la interoperabilidad de datos en Internet simplemente hacen falta las buenas praacutecticas y eluso de dichos instrumentos para hacer posible que recuperemos informacioacuten a partir de datosvinculados mdashLinked Datamdash de las unidades de descripcioacuten Para ello disponemos de unosmecanismos especiacuteficos destinados a las maacutequinas (Aacutelvarez Espinar 2008) con los siguientesobjetivos para evitar la ambiguumledad en la identificacioacuten (URI) para describir los recursos (RDF)para modelar antologiacuteas (OWL) para realizar buacutesquedas en bases de datos (SPARQL) y paraexpresar las reglas y su intercambio (RIF) mdashestas especificaciones se pueden encontrar enhttpwwww3orgmdash

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 11: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

Imagen 10 Figura de Aacutelvarez Espinar M (2008) sobre los mecanismos especiacuteficos para la InteroperabilidadSemaacutentica en la WEB

Desconocemos si existe alguacuten archivo que haya implementado los mecanismos para lainteroperabilidad Web Siacute que se estaacute llevando a cabo en instituciones documentales obibliotecarias y evidentemente lo utilizan tambieacuten para la documentacioacuten procedente de archivosque estaacute depositada en ella El proyecto maacutes interesante donde participan instituciones espantildeolases Europeana En Europeana se pueden efectuar buacutesquedas sobre los fondos de unas 1500instituciones colaboradoras La interoperabilidad implementada permite a las personas explorar losrecursos digitales existentes en instituciones como museos bibliotecas archivos y coleccionesaudiovisuales de Europa todo ello en una red multilinguumle Se pueden encontrar maacutes de 15millones de artiacuteculos entre los que se incluyen imaacutegenes mdashpinturas dibujos mapas fotos eimaacutegenes de objetos de museomdash textos mdashlibros perioacutedicos cartas diarios y documentos dearchivomdash sonidos mdashmuacutesica y palabra hablada en cilindros cintas discos y emisiones de radiomdash yviacutedeos mdashpeliacuteculas noticiarios y programas de TVmdash Esta diversidad de documentos y formatos sepuede recuperar desde una uacutenica plataforma gracias a las buenas praacutecticas en el trabajo dedescripcioacuten realizado y a la implementacioacuten de los instrumentos de interoperabilidad y websemaacutentica

Imagen 11 Europena Ejemplo de recuperacioacuten de la informacioacuten mediante el teacutermino Felipe V 547 textos 374imaacutegenes 7 audiovisuales y 2 audios

4 Conclusioacuten

El trabajo que se ha estado realizando de forma tradicional en los archivos para poder encontraraquellos documentos requeridos por una peticioacuten es perfectamente trasladable al entorno WebAhora bien el eacutexito de una eficaz recuperacioacuten de la informacioacuten a partir de los OPACs de archivosva a depender fundamentalmente de dos factores de las buenas praacutecticas en la gestioacuten dedocumentos mdashdestacariacuteamos unas correctas clasificaciones para la navegacioacuten multinivel y unascorrectas descripciones e indizaciones para la recuperacioacuten de la informacioacuten pertinentemdash y uso delas TIC con especial hincapieacute en su adaptacioacuten a la Web Semaacutentica mdashes el futuro que va acondicionar la presencia de unas organizaciones o su omisioacuten en Internetmdash Esto supone uncambio de paradigma ahora centrado en el usuario el cual impone a los archiveros el disentildeo delos sistemas de acceso a la informacioacuten y a la creacioacuten de servicios orientados a diversos perfilesde usuarios en el marco de la Web (Sebastiagrave Salat 2009)

El uso de las TIC no es soacutelo importante para el entorno Internet sino tambieacuten para cualquierorganizacioacuten que esteacute gestionando documentos en intranets De hecho la mayor parte de lasorganizaciones en su eAdministracioacuten no solamente van a tener la necesidad de depositardocumentos digitales en sus servidores o sistemas de almacenamiento sino tambieacuten de disentildear laarquitectura de la informacioacuten y el sistema de recuperacioacuten de la informacioacuten No es ninguacutendescubrimiento si decimos que al igual que en los archivos fiacutesicos lo que no se describe no serecupera mdashaunque utilicemos en uno u en otro otros mecanismos maacutes costosos para recuperar lo

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 12: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

que queremosmdash y unas deficientes praacutecticas en la descripcioacuten documental dificultan o imposibilitanla recuperacioacuten de los documentos deseados Disponemos de suficientes instrumentostecnoloacutegicos incluidos los recientes estaacutendares de la W3C y de suficientes instrumentos cientiacuteficospara aplicarlos en nuestras organizaciones y que no continuacutee ocurriendo el caso siguiente lasorganizaciones depositan grandes voluacutemenes de documentos (fiacutesicos o digitales) sin los adecuadosinstrumentos para la recuperacioacuten de la informacioacuten

Si guardamos los documentos y realizamos diversos trabajos teacutecnicos es para poder recuperarlosante las peticiones Si la recuperacioacuten de la informacioacuten no funciona de una forma eficaz para laorganizacioacuten o los usuarios mdashen pertinencia y rapidezmdash todo el trabajo hecho se vuelve inuacutetil

Bibliografiacutea

Abadal E Codina Ll (2005) Bases de datos documentales caracteriacutesticas funciones y meacutetodoMadrid Siacutentesis

Aacutelvarez Espinar M (2008) Interoperabilidad semaacutentica en la Web Congreso Nacional de BPMSMadrid W3C lthttpwwww3cesPresentaciones20080220-semanticaBPMS-MA gt [Consulta18092011]

Arad A Bell L (1977-1978) Descripcioacuten Archiviacutestica Un sistema general Boletiacuten ADPA vol 2nordm 2-3 paacuteg 35-42

Bell L (1975) Una investigacioacuten sobre el Tratamiento de Datos Archiviacutesticos Boletiacuten ADPA vol1 nordm 3 paacuteg 15-26

Berners-Lee T (2006) Linked Data lthttpwwww3orgDesignIssuesLinkedDatahtml gt[Consulta 9092011]

Cook M Procter M (2000) Manual of archival description Vermont Gower

Cox Richard J (1992) Managing institutional archives Foundational Principles and PracticesConnecticut Greenwood press

Cumming Kate (2007) Purposeful data the roles and purposes of recordkeeping metadataRecords Management Journal Vol 17 Iss 3 pp186-200

EAC-CPF Encoded Archival Context - Corporate Bodies Persons and Families lthttpeacstaatsbibliothek-berlinde gt [Consulta 5092011]

Espantildea (2010) Real Decreto 42010 de 8 de enero por el que se regula el Esquema Nacional deInteroperabilidad en el aacutembito de la Administracioacuten Electroacutenica Boletiacuten Oficial del Estado nordm 25 29de enero de 2010 paacuteg 8139-8156

Gimeacutenez V Escrig M (2011) Designing a Thesaurus to Give Visibility to the Historical Archives inthe Archivo del Reino in Valencia Knowledge Organization 38 Nordm 2 p 153-166

Heredia Herrera A (1988) Archiviacutestica General Teoriacutea y Praacutectica Sevilla Diputacioacuten Provincial

ISO 147212003 Space data and information transfer systems - Open archival information system -Reference model lthttpwwwisoorgisocatalogue_detailhtmcsnumber=24683 gt [Consulta17092011]

Klischeswski R (2004) Information Integration or Process Integration How to AchieveInteroperability in Administration Lecture Notes in Computer Science 2004 Vol 3183 pp 57-65

Lodolini Elio (1993) Archiviacutestica Principios y problemas Madrid Anabad

Paul KD (1988) Archivist and Records Management Managing archives and archivalinstitutions Chicago The University of Chicago Press

Sebastiagrave Salat M (2009) La transformacioacuten de los archivos y de la Archiviacutestica Tabula Nordm 12pp 17-30

SNAC Social Networks and Archival Context Project

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD

Page 13: La recuperación de la información en los archivos en líneabid.ub.edu/27/pdf/gimenez2.pdf · sitio web y la estructura de la bases de datos o OPAC más conveniente para cada modalidad

lthttpsocialarchiveiathvirginiaeduindexhtml gt [Consulta 17092011]

Thibodeau S (1995) Archival Context as Archival Authority Record The ISAAR (CPF)Archivaria 40 p 75-85 lthttpjournalssfucaarchivarindexphparchivariaarticleview1209713084 gt [Consulta5092011]

Unioacuten Europea (1998) Propuesta de decisioacuten del Consejo por la que se adopta un conjunto deacciones y medidas al objeto de garantizar la interoperabilidad de las redes telemaacuteticastranseuropeas destinadas al intercambio de datos entre administraciones (IDA) asiacute como el accesoa las mismas Diario Oficial ndeg C 054 de 21021998 p 0012 lthttpeur-lexeuropaeuLexUriServLexUriServdouri=CELEX51997PC0661280229ESHTML gt[Consulta 9092011]

Vaacutezquez de Parga M (1986)El PIA Plan de Informatizacioacuten de Archivos Boletiacuten ANABADvol 36 (1-2) paacuteg 79-83

W3C (1999) Resource Description Framework (RDF) Model and Syntax Specification lthttpwwww3orgTR1999REC-rdf-syntax-19990222 gt [Consulta 9092011]

Fecha de recepcioacuten 30092011 Fecha de aceptacioacuten 01112011

Notas1 El presente trabajo ha sido realizado en el proyecto Infoscopos (La nueva ecologiacutea de la informacioacuten yla documentacioacuten en la sociedad del conocimiento desarrollo de una meacutetrica sisteacutemica planificacioacuten deun observatorio para su seguimiento e identificacioacuten de tendencias baacutesicas y retos estrateacutegicos) es unproyecto I+D subvencionado por el Ministerio de Ciencia e Innovacioacuten (CSO2009-0761)

Facultat de Biblioteconomia i DocumentacioacuteUniversitat de BarcelonaBarcelona desembre de 2011httpwwwubedubiblio bull Comentaris

Recomanar bull Citacioacute bull Estadiacutestiques bull MetadadesEls textos publicats a BiD estan subjectes a una llicegravencia de Creative Commons

Poliacutetica de privadesaUB bull Facultat bull BiD