Entropía, relevancia y pertinencia del descriptor en el ...

10
Entropía, relevancia y pertinencia del descriptor en el mensaje comunicativo-documental. Nota tipo lógica ANTONIo Luís G¡mci~ GL’TIERBEZ Profesor de Documentación Facultad de ciencias de la información Universj(lad complutense de Madrid INTRODUCCION El proceso documental es un proceso comunicativo en el que intervienen un sujeto emisor, un canal, un mensaje y un receptor>. A diferencia de la lengua natural utilizada en la comunicación humana, la documentación utiliza un lenguaje controladot creado por el hombre, capaz de generar diálogo (hombre, fichero u ordenador) a un subnivel comunicativo. De hecho, Susan Artandi, ratificada por Iandry, considera el producto de la indización como mensaje y, en consecuen- cia, como objeto de estudio de las Ciencias de la Comunicación al senalar que la indización implica la comprensión del significado de los mensajes y la expresión de esta comprensión en la forma de nuevos mensajes (índices) 3. ¡;n este proceso, el indizador, hombre o máquina, funciona como fuente y destino, como codificador y decodificador de mensajes. Los lenguajes documentales provienen del lenguaje humano aun en el caso dc artificialización de sus signos y grafemas. De hecho el lenguaje humano se hace permanente en el documento, mientras que ¡ Así consta en la obra del 1)r. López Yepes, Teoría de la Documenlaci¿n. Pamplona., EL3NSA, 1078, pág. 1.32, y de Desanlos Guanter i. M,, La dc,curnen¡acidn cient,jfica corno objeto de la ínjbr,nacicán. «Boletín del Fondo pani la investigación económica y social>,, vol. 11, fasc. 3, abril-junio, 1870, págs. 165-175. El lenguaje humano evuluciona por impu sos i ncoriscientes psicosociales, mientras que el lenguaje controlado es codificado conscientemente por el hombre. Artandi, Susan: Machine iudeying: Unguistir ¿md Se,niotic irnplications, en «.lour’nal of (líe ASíS», jtrlio-ag¡>sto, 1976, pág. 236. Por su parte Landrv considera que la fuerza motriz generadora <le diálogo documental necesita de un proceso intelectual que implica «reflexión sobre el orden de los conceptos que existen en el tiulo inforrnaLivo y debería 56~1v’r para identificar la intenelación entre ellos». Véase el trabaio de Landry, H, c., y Rush, .1. E.: joward a theorv of iodeying, «Proceedings of Ihe Asís», vol. 5, 1968, pág. 62.

Transcript of Entropía, relevancia y pertinencia del descriptor en el ...

Page 1: Entropía, relevancia y pertinencia del descriptor en el ...

Entropía, relevanciay pertinenciadel descriptoren el mensaje

comunicativo-documental.Nota tipológica

ANTONIo Luís G¡mci~ GL’TIERBEZProfesorde Documentación

Facultad de ciencias de la informaciónUniversj(lad complutensede Madrid

INTRODUCCION

El proceso documental es un proceso comunicativo en el queintervienenun sujetoemisor, un canal,un mensajey un receptor>.Adiferenciade la lenguanatural utilizada en la comunicaciónhumana,la documentación utiliza un lenguaje controladot creado por elhombre, capazde generardiálogo (hombre, fichero u ordenador)a unsubnivelcomunicativo.De hecho,SusanArtandi, ratificadapor Iandry,considerael producto de la indización comomensajey, en consecuen-cia, como objeto de estudio de las Ciencias de la Comunicación alsenalarque la indización implica la comprensióndel significadode losmensajesy la expresiónde estacomprensiónen la forma de nuevosmensajes(índices)3.¡;n esteproceso,el indizador, hombreo máquina,funciona como fuente y destino, como codificadory decodificadordemensajes.

Los lenguajesdocumentalesprovienendel lenguajehumanoaunenel caso dc artificialización de sus signos y grafemas. De hecho ellenguajehumano sehacepermanenteen el documento,mientras que

¡ Así constaen la obra del 1)r. López Yepes,Teoría de la Documenlaci¿n. Pamplona.,EL3NSA, 1078, pág. 1.32, y de DesanlosGuanter i. M,, La dc,curnen¡acidncient,jfica cornoobjeto de la ínjbr,nacicán. «Boletín del Fondopani la investigacióneconómicay social>,,vol. 11, fasc. 3, abril-junio, 1870, págs. 165-175.

— El lenguajehumanoevuluciona por impu sosi ncoriscientespsicosociales,mientrasque el lenguajecontrolado es codificado conscientemente por el hombre.

Artandi, Susan:Machineiudeying:Unguistir ¿mdSe,nioticirnplications, en «.lour’nal of(líe ASíS», jtrlio-ag¡>sto, 1976, pág. 236. Por su parte Landrv consideraquela fuerzamotrizgeneradora <le diálogo documental necesita de un proceso intelectual que implica«reflexión sobreel orden de los conceptosque existenen el tiulo inforrnaLivo y debería56~1v’r para identificar la intenelación entreellos». Véaseel trabaio de Landry, H, c., y

Rush, .1. E.: joward a theorv of iodeying, «Proceedingsof Ihe Asís», vol. 5, 1968, pág. 62.

Page 2: Entropía, relevancia y pertinencia del descriptor en el ...

216 AntonioLuis García Gutiérrez

el lenguajedocumentalno es más que el medio de expresiónde losdocumentos.Quiereestodecir quelos documentostienensuscódigosidentificatorios, se hacenindependientesy universalescon el únicolímite de suscontenidos.Es labor humanamanipularcon las posibili-dades lingtiísticas de los colectivosdocumentalesy crear, mediantecodificación, términos controladospara la comunicacióndocumental,es decir, descriptores.Estos elementosléxico-documentalespermiti-rán el diálogo con los depósitosde documentos,manualeso automáti-cos,graciasa combinacionespotencialesde ellos, o frasesdocumenta-les, las cuales constituyen el núcleo del lenguaje documental. Sóloestructurandounaeficazteoríade la indización (procesointelectualdeextracción de conceptos)podrá accedersea camposconceptualesyterminológicosóptimos que permitan construirlenguajesdocumenta-les útiles4. En este sentido el Thesaurusaparece hoy como unaalternativaválida5parael control de documentosen áreascientíficasytécnicas.

1. [A INDIZACION PORDESCRIPTORES:ELEMENTOS LINGUISTICOS Y COMUNICATIVOS PARA UN CONCEPTO

No esposible hablarde descriptoressin hacerreferenciaal thesau-rus,puesaquéllosno tendríanoperatividadfuerade contextossemán-ticos controlados.Sin embargo,el término es antiguo como afirma elbrasileño Silva: descriptor es una vieja voz latina, en desuso en lalenguacomún,peroexistenteen los diccionariosespañoles,portugue-ses, francesese ingleses6.No obstante,fue Mooers’, matizando elmétodo creado por Taube en i9555, el primero en utilizar la denomina-ción descriptorpara referirse al producto de la indización basadaenconceptos, aunque ciertos autores, como Perreault, rechazan estadenominacióndesdeuna concepciónlógico-lingtiística9.

véanse los aspectos teóricos de la indización en el contexto de la língiiiísticadocumental en mr reciente trabajo: Normalización de la Documentación informativa.Propuesta de Tesauro español de las ciencias de la Información. Madrid, UniversidadComplutense,1982, XIII, 1293 págs.

La creación de lenguajesde estructuragramaticalcomo el Syntol, Semanticcode,etcétera,a nivel internacionaly encamposcientíficos de terminologíainestablees unaempresainviable en la actualidad.

Silva, Benedicto: Origcm e evolucao dos desatores, Río de Janeiro, Funda~aoGetúlio vargas,1972, pag. 27.

Mooers, calvin: Zatocoding Applied to Mechan ical Organization of Kaowledge,«AmericanOocumentatiom,vot. 2, núm. 1, 1951.

Taube,Mortimer The Uniterm Systemof Indeying Operating Manual. Washington,Documentationtnc., 1955,47 pág.

Perreaultrealiza una matizaciónmuy razonadasobreel término descriptor «Si unvocabulario está controlado, éste adscribe conceptos al documento, por tanto, laindización por conceptoscontroladosproduceadscriptores.Si el vocabularioeslibre, se

Page 3: Entropía, relevancia y pertinencia del descriptor en el ...

Entropía, relevanciay pertinenciadel descriptor... 217

Porotra parte,diversos investigadorescomo Chastinet10o Fondin”proponendefinicionesy enfoquesaisladosdel conceptode descriptor,el cual> a nuestroentender,no puedesercontempladomásquedesdeel campo linguo-documental, e inserto en mensajesdocumentales(provenientesde la indización en el análisis o en la recuperación),loque nos permite definirlo como la unidad .sign~ficativa mínima delmensajedocumental.El thesauruscomomarco léxico del descriptores,por tanto, un dispositivo que correlaciona los mensajeshumanosy losdocumentales.

tJn solo descriptorpuede constituir frase documentalaunquelamayoríade los sistemasde indización atribuyenvarios descriptoresacada documento. Esta afirmación está en directa relación con elconceptode profundidadde la indización. SegúnBird, «la profundidaddependedel númerode conceptorindizablesen el documento.En losdiferentessistemasde indización, los descriptoressongeneralizadosoespecificadosen suscontenidos,puedenserrecuperablessimplemen-te o en combinaciónmediantela lógicabooleana.Todosestosfactoresmás el sistemaal que se aplican influirán en las normas de indiza-ción’>12. Sobrela misma cuestión,Bradford, comentandoa AlexanderPope,adviertequelas palabrassoncomo hojasy cuantomásabundan-tes menos se encuentrabajo ellas el punto del sentido1’.

Estas máximas hacen pensar en un excesivo subjetivismo en laindización queescapaal control del lenguajedocumental.Sin embar-go, es posible establecerunas conclusionesflexibles que permitan lacoordinación multilateral en la tarea de los indizadores sobre todocuando se vislumbran posibilidadesde automatización,proceso queexije un alto nivel de normalización. Sin duda, la existenciade un

indiza describiendoel documento,y se producenlos descriptores.La clasificación nodescribesino que prescribeuna posición en una organizaciónconceptuale inscribe eldocumentoen esaposición. La ctasiflcación supone«scripción«pero no de los elemen-tos del documento sino de los documentoscomo totalidad. En resumen, tanto laclasificación como la indización «seriben»pero la primeraprescribe a la clase)e inscribede la clase); mientras que la segunda adscribe o describe; por tanto, desde una

concepciónlógieoiingtíística,descriptores el términoprovenientedeunaindizacionenlenguajelibre», flocumentaryrelevance aod Stnictural Hierarchy, «Americanliocumentwtion», julio, 1966, pág. 137.

» cha~íñ~íDuarte,Vone:Uso do kvvic en?Indexavaobibliografica. cursodeiníroducao~ tecnología dos descritores. Rio deJaneiro, Funda~aoGetúlio vargas,1970, 8 folios.

Fondin, Huberí: La structure et le vocabulaire de l’analyse documentaire. con¡ribu-Non pour une mise an point, «Documentaliste»,vol. 14, núm. 2, 1977, págs. 11 y ss.

12 Bird, P. fi.: Tbe Distribulion ofJndeying Depth la Documenia ¡ion Systems, ‘Journai ofBocumentation»,vol. 30, núm. 4, 1974,pág. 381. El autoranalizaen57.000 documentosladistribución y estabilidadde los descriptorespartiendo de la fórmula de Poissonyconcluyendoque es preciso acudira la descripción matemáticade la indizaciónparat,btenerel grado cíe dispersiónde descriptoresen un sistema.

‘~ Bradford,5. c.: Documentagao,22’ cd. PrólogodeDonl~rDuyris. TraduccióndeM. E.deMello, Rio de Janeiro,1961, pág. 79.

Page 4: Entropía, relevancia y pertinencia del descriptor en el ...

215 AntonioLuis García Gutiérrez

Thesauruses el primer paso para aproximarsea la univocidad decriterios en la indizacion.

2. PRECOORDINACIONDE DESCRIPrORES:LA FRASE DOCUMENTAL

La precoordinaciónde descriptoreses un problema relacionado<:on la profundidaddel propio descriptor,con el númerode ellosy consuscombinacionesa la horade recuperarinformación. La precoordina-ción es beneficiosa cuando se trata de eliminar aisladamentelaamíJiguedadde un concepto y perjudicial cuando se realiza a pl-ioncon el fin de reducir las falsas combinacionesde la búsqueda.Sinembargo,surelativa utilidad puedevariar según se trata de recupera-ción manual o automática.

En el caso de sistemasautomáticosel procesode poscoordinaciónes el más eficaz,ya quees la máquinala quedotade profllndidad a lafrase documental por intersección booleana, etc.), a pesar de laposibilidad de falsascombinaciones.Pero en la recuperaciónmanual,como, por ejemplo, índicessimples, permutadosy acumulativosqueaparecenal final de la bibliografía, la precoordinación es el únicomedio de encontrarla referenciaconcreta.En definitiva, la poscoordi-nación de descriptoresno esútil en la búsquedamanualde documen-tacton.

Ejemplo:

— Descriptor compuestoparaeliminar supropia ambigfledad.«/centro/±/información/~/centrode información/

— Descriptores simples no ambiguos a poscuordinar por lamáquina./cine/ + /España/+ ¡cámara»’+ /dirección/+ ¡productora!

— Descriptoresprecoordinadosen el índice tradicional/cine español!/cámaracinematográfica!¡productora!

Sin embargo,al elaborarun lenguajecontroladoes precisoprever laautomatización,por lo cual es recomendableutilizar descriptoresnoprecoordinadossólo en caso de irrelevancia o ambigtiedad, queaparezcandescompuestosen las referenciasy en las demandasy sólosintagmatizadosen los índices manuales..Aquellos descriptoresqueno seanlo suficientementesignificativos como para situarseen cam-pos facetados y concretos del Thesaurusdeberían encontrarse enindices y tablas auxiliaresde eselenguajedocumental.

Page 5: Entropía, relevancia y pertinencia del descriptor en el ...

Entropía, relevanciay pertinenciadel descriptor-... 219

3. TIPOLOGIA DE DESCRIPTORESREFERENCIALESY EN THESAURUS

Ademásde los conocidosdescriptoresunitérminosy sintagmáticoso compuestos,las anterioresreflexionesnosllevan ala propuestade lasiguiente tipología:

— Descriptor primario: aquel concepto con significado propioincluso fuerade contexto o de frase documental.Ej/comunicación de masas!,¡persuasión!,etc.

— Descriptor secundario o auxiliar: aquel concepto ambiguo,ge-nérico o no pertinente a la estructura del Thesaurus.Debeencontrarseen indicesy tablas,auxiliaresdel mismo Thesaurusen orden alfabético permutado.Es precisodistinguir dos tiposde descriptoressecundarios:los causadospor ambigiiedad.Ej. ¡modelo!, ¡centro! y por homonimia, ej. ¡índice!, ¡biblio-grafía!, en este segundocasopuedenindicar que el documentoes unabibliografía o un estudio sobreel conceptode bibliogra-fía, índice, etc. En consecuencia,los descriptoressecundariosdebencumplir dos requisitos:1.” Aparecer en distinta grafía o posición determinada(por

ejemplo en cursiva) en la bibliografías impresas.2.0 Aparecercon característicasdiferenciadorasde los descrip-

tores principales en las bibliografías automatizadasme-dianterecursosprevistosen el lenguajeutilizado.

Ambas posibilidadesno son más queun intento de gramatica-lización de la frase documental con objeto de reducir ladistorsión en la recuperación.

— Descriptor informativo: son descriptoresque puedenno estaren el Thesaurus,en los índices de las bibliografías, pero queson utiles en el contexto de descriptoresque acompañanlareferencia.Porejemplo,¡Ecología! o ¡concepto!en unabiblio-grafíasobrecine.Aisladamenteinducenaconfusión,peroen elcontextodc la referenciaaclaranla frasedocumental.‘Todos losdescriptoresson informativos aunquepuedenserno pertinen-tes con respectoa determinadoscampos(dispersión).

— Descriptorreferencialo direccional: son aquellosdescriptoresque permiten la localización de las referencias de formacolectiva mediante índices, demandasindizadas, etc. Todosellos deberánformar parte del Thesauruso apareceren laslistas de candidatospara su inclusión.

Desdeel punto de vista de la elaboracióndel Thesaurus(thesaurifi-cación)seausandoun métodoanalítico (indización de muestraaleato-ria de documentos)o global’4 (extracciónde descriptoresde dicciona-

‘~ sobre las diferentes metodologiasvéasetso: Príncipes directeurspoe,’ J’établisse-,nentet le développementde thesaurusmonolingues. Genéve,1974>111,14 págs.502-788.

Page 6: Entropía, relevancia y pertinencia del descriptor en el ...

220 Antonio Luis García Gutiérrez

ríos y terminologíasespecializadas)obtendremosuna nuevatipologíade descriptores.

II Descriptoresconfirmados:ratificados por la indización. Su usoposibilita la recuperaciónreal de documentosque existen.

2.” Descriptores preventivos o potenciaJes:su función es prevercualquier análisis o búsquedapotencial, ya que no han sidoextraídosde los documentoscentíficos existentes.Sin embar-go, estosdescriptoressonmm eficacesparaqueel Thesauruscumpla su función de ampliación o focalizaciónen la indiza-ción. Segúnestecriterio tendremosdescriptorespreventivosdenivelación, cuandosufin escubrir lagunaso establecerpuentesentre encabezamientos,y descriptoresde ampliación, cuandosufin es ampliar el campode descriptoresconfirmados.

4. RELEVANCIA, PERTINENCIA Y ENTROPIADE LA INDIZACION

Hay quetenertambiénpresenteel conceptode entropíadocumen-tal referido a la cantidadde información aportadapor un descriptoropor la frase documentalcon el menor número de signos. No parecerecomendableutilizar, al indizar, exclusivamenteel descriptormásajustadoal tema quetratael documento,ya queestoimpide recuperaresemismo documentousandocriterios de búsquedamásamplios.Enconsecuencia,no caeríamos en excesiva redundancia, fenómenoopuesto a la entropía y economía lingiiisticas, si empleamos endeterminadoscasosel conceptoinmediatamentemás genéricosegúndebeindicar el Thesaurus.Dentrodel campoentrópicode un descrip-tor puedenestudiarsediversosniveles de comportamientorelaciona-dos con la profundidadconceptual,la relevanciay la pertinencia.

El conceptode profundidadde la indización va ligado con lo quedenominaMaron amplitud terminológica. El autor dota a esta fl¡~irnanoción de dos interpretaciones:una intensional,basadaen el sig¡«do de los términosen cuestión(exploraciónsemañtica)y otraeNt( s~j-

‘ial, relativa al número de documentosque el mismo término puedeindizar. Maron indica que la amplitud semánticade un término (másgeneralidad)no guardarelación con el número de documentosqueabarca (lo cual ya fue señaladopor Jonesl’5. Incluso, «términos níásespecíficospueden indizar más documentos que los genéricos»,Jocual, según Maron, no es paradójico’6. De acuerdo con la vertienteextensional, [nencionada por el autor, la profundidad se refiere al

iones, 1<. P.: Towardsa Theoryof tndeying,«Journalof Oocumentation«,vol. 3Z, núm.2, 1976, pág. 118.

« Maron, M. E.: IJepth of Indeying. «Journalof theASíS», Julio, 1979, pág. 224.

Page 7: Entropía, relevancia y pertinencia del descriptor en el ...

Entropía, relevanciay pertinenciadel descriptor... 221

número de términos asignadosa un documento17 y si se asignanmuchos términos a un documento se dice que éste estaráindizadomás profundamente.

Porotra parte,y siguiendo la terminología del mismo investigador,desdeel punto de vista intensional, «<aqueldocumento indizado contérminos más específicosestaráintensionalmenteindizado con másprofundidadque el que contengatérminosmásgenéricos»>’3.Basándo-se en los dos principios mencionados,Maron intenta definir el nivelóptimo de indización analizando el número medio de términos deindización por camposcientíficos y por documentosindividuales, apartir del estudio de una colección de documentosy su potencialdemandapor la comunidadde usuarios.Tras el estudio puedecon-cluirse que un buen sistema de recuperación debe extraer sólodocumentos relevantes para la demanda,usando una indizaciónprecisa, lo cual ha de ser determinadopor una estricta selección,instrumentación rigurosa de normas de indización a hombres uordenador,y encuestasfrecuentesparaaveriguarlas necesidadesde ]ademanda.

Dentro de la importantedivisión maroniana,se ha mencionadoelconcepto de relevancia documental. El mismo Landry considera eldocumentodesdeel punto de vista de la indizacióncomo una«colec-ción de unos cuantos conceptos relevantes>tO.Pensamos que laindizacióndebeestablecerel ordendela relevanciade esosconceptos,recortadospor los diversosniveles de la profundidadde suaplicación.Perreault cita a Hilíman como uno de los mayores teóricos de larelevancia documental20. No obstante, si Hilíman intenta precisarobjetivamentela relevanciade un documentoatravésde la indizacióny de la demanda,Perreault,acertadamente,poneen dudaeseargumen-to planteandoel caráctersubjetivistade la relevanciade los conceptos,hastatal punto, quellega a afirmar lapidariamenteque«unacaracterís-tica propia de la relevancia es que cualquier juicio sobre ella ya esvalorativo y, poí’ tanto, no objetívo»~’.

En nuestraopinión, la relevanciadeun documentoestáen funciónde su carga entrópica, es decir, de la aportación de informaciónunitaria que comportay, consiguientemente,es precisodeterminaríaen el contexto dondese inscribecadaunidad documental.Sin embar-go, debe analizarsela relevanciade un núcleo para valorar los docu-mentosrelativos a esemismo campo,obtenido con posterioridad.Es

Denominadopor S1íarckJones«exliaustividad(le la indización en Does Indcxing

EghaustivityMatter?, «Journalof theA5t5», vol. 24, núm. 5, 1973 págs. 313, 316.Maron, N4. E.: Op. dr

r» Landr’y, fi. c. etc.: 7bward..., Op. cii., pág.59.2» Hilíman, Donaid J.: 2’Jie IVotion of Relevance,«American Documentation»,vol. 15,

1964, págs.26-34.21 Perreault J. M.: Docu,nentary...,op. cit., pág. 136.

Page 8: Entropía, relevancia y pertinencia del descriptor en el ...

222 AntonioLuis García Gutiérrez

importante,también,apreciarla diferenciaentreinformación relevantey relevanciade la información. Estaúltima es fácilmentecomprobablea través de los fondos documentalesmediante testsy sondeos.Losindicesderuido (documentosextraídosque no interesan)y desilencio(documentos existentesque no han podido ser extraídos por unadeficiente indización) se oponena la relevanciade la indización y, portanto, la cantidadde información relevanteobtenidapor el usuarionocoincide con la depuradapor el sistemadocumental.

Sin embargo,el subjetivismo impreso en el conceptode relevanciade los documentoses limado por la inercia del colectivo documentalyterminológico en cadacampo científico. Si un indizadorduda ante laelección o relevancia de un término, habrá de mantener cautela yobservarlos impulsos de los contenidosdocumentalessucesivos.Elavancelógico del cuerpo investigadordeberesolver tajantey mecáni-camentelo que en un momentodado puedecomportardudasinevita-bles. Por tanto, una actitud a mantener a la hora de establecerlarelevanciade un descriptores la expectativa,unavez superadala fasepredictiva que extrae el término en bruto del grueso del campoconceptual.

En ese mismo sentido se desgranael término pertinencia de laindización. Un descriptorespertinente,en principio, paralelamentealgradode adecuidaddel documentoquelo contiene.Sin embargo,aquíse planteael problemade la dispersión de descriptores.En efecto,delmismo modo que existe una dispersión de los artículos científicosentre las publicacionesde temasrelacionadoso diferentes(dispersióncontrolable, por otra parte, según Bradford por su ley de los círculosconcéntricosdonde sedisponenlos artículosen ordendecrecientedepertinencia o con el tema de las revistas mientras éstas crecenexponencialmente)22,los descriptores pueden aparecer, con mayorfacilidad, en contextos de poca relación con los conceptos querepresentan.Visto a la inversa, podernos encontraren documentosespecializadosciertas palabras claves de gran relevancia pero dedudosa pertinencia. ¿Cómo saber la vinculación de ese potencialdescriptorcon el tema quenosincumbe?La soluciónvienedadapor elprocedimientode la observaciónde frecuenciade aparición. Inevita-blemente si una palabra clave aparece en diversas ocasionesendocumentosafines,debeserconsideradacomo probabledescriptordeese campo documental, a pesar de los probablementejustificadoscriterios de los documentalistas.

Sin embargo,hay queconcluir quees condición indispensablepara

u Bradford,5. L.: Documentation»2.’ ed. London, croshy Lockwood, 1952, págs.49-55.Cii. por López Yepes,José:Bíbliornetrra, «cuadernosde trabajo del flepartamentodeDocumentación»,vol. II, núm. 3, 1980,págs.36-40.

Page 9: Entropía, relevancia y pertinencia del descriptor en el ...

Entropía, relevanciay pertinenciadel descriptor... 223

estudiar la pertinencia de una palabra clave, el haber demostradopreviamentesu índice de relevanciaad hoc, de acuerdoal nivel deprofundidadestablecidocomo normaen la indización de un determi-nadocampo.Existe unadirecta relaciónentrelas cotasde relevanciaypertinencia alcanzadapor los descriptoresy la eficaciade éstosen larecuperación.El indice de pertinenciadebeserdefinido en función dedosdimensionescartesianas:la primerahorizontal y desdobladaenunfactor de relación que indica la consonanciadel descriptor conrespecto a un campo científico y en un factor de inclusión que losumergeen esecampo,y la segundavertical relacionadacon el índicede profundidadquedefineel gradode amplitud sémicadel descriptor.Ademáshay que definir el índice de relevanciaqueno puedeestable-cersepor comparacióncomo el anterior,sino por medición objetiva desu (:arga semántica.

CONCLUSIONES

La documentaciónplantealos problemasclásicos de los procesoscomunicativos. De hecho su principal obstáculo y objetivo es latransmisióno circulación de información científica.Se hacenecesariala utilización de criterios únicosde indizaciónparafacilitar el flujo deinformación científica, sobre todo en camposde terminología pocounívoca e inestable,como el de la comunicación de masas (con laexcepciónde los aspectostecnológicosde la comunicación).

En basea las reflexionesprecedentespuedealirmarse lo siguiente:1:» Las técnicasde indización son diferentessegúnse destinena

procedimientosderecuperaciónmanualeso automáticos.Sin embargoes posible llegar a una conciliación que haga compatible el usocombinadode ambosmétodos.

2.” En caso de recuperaciónmanual no es perjudicial el uso dedescriptoresprecoordinadosen la indización,y enbúsquedamedianteordenadores másefectiva la poscoordinación.

Tantoen el Thesaurusempleadocomo en las referenciasbibliográfi-cas los descriptoresdebenserunitérminosen la medidade lo posible.En los índices, la sintagmatizaciónpermite recuperarsinambigliedad.Sin embargo, y en general, los términos compuestos sólo debenadmitirseparaevitar la ambigliedaddel conceptoy no de la demanda.

3» Deben establecersemedidastendentesa eliminar la ambigiie-dad en las frasesdocumentalesy la posibilidad de falsascombinacio-nes.Es deseable,por tanto, llegara unabasemínima de gramaticaliza-ción de la indización (método posicional,diferente grafía, etc.).

4.” Los descriptoressecundariosdebenutilizarse paramatizar elsentido de los primarios. Sin embargo, no deben aparecer en la

Page 10: Entropía, relevancia y pertinencia del descriptor en el ...

224 Antonio Luis García Gutiérrez

estructurafacetadadel Thesaurussino en tablas alfabéticaspermuta-dasy auxiliares.Tampocosonútiles si aparecenaisladosen los índicesmanualesde las bibliografías.

5.’, En el caso de no existir un descriptoren el Thesauruscomúnutilizado por un sistemainternacionales conveniente,si así lo precisala indización, emplearel descriptornacionalo regional pero acompa-ñadode un genéricoo asociado(BT o RT) presenteen el Ihesaurusconel fin de facilitar su recuperación a otros centros. Los descriptorescandidatos deberán ser sometidos a un estudio de frecuencia ypropuestosen las revisionesdel lenguajecomún.