Corpus alemán

19
DEUTSCHE TEXTKORPORA TIC aplicadas a la Traducción

Transcript of Corpus alemán

Page 1: Corpus  alemán

DEUTSCHE TEXTKORPORA

TIC aplicadas a la Traducción

Page 2: Corpus  alemán

LIMAS-Korpus

LIMAS-Korpus es un corpus compuesto por más de un millón de tokens

procedentes de 500 fuentes diferentes. Los textos son de diversos tipos (33 en

total) entre los que encontramos textos sobre medicina, política, psicología,

astronomía, ciencias naturales, historia, geografía, química, antropología, pero,

sobre todo, textos literarios.

En el apartado de Inhaltsverzeichnis podemos ver todos los textos y modificar

cómo queremos que aparezca la información y los títulos.

Page 3: Corpus  alemán

En el apartado Suchen:

-„Einfache Suche“: permite buscar una o más palabras sencillas.

Resultados de la búsqueda

Como veis, el resultado indica lafuente donde se encuentra eltexto, Rubrik/categoría del texto,la línea en la que aparece y elcontexto.

Si clicáis en “Quelle” veréis eltexto completo.

Page 4: Corpus  alemán
Page 5: Corpus  alemán

-„Kontextsuche“: permite la búsqueda de una o más palabras y otras

palabras que aparezcan en su contexto.

Resultados de la búsqueda

Page 6: Corpus  alemán

-„Phrasensuche“: podemos buscar frases completas en el corpus.

Resultados de la búsqueda

Page 7: Corpus  alemán

Operadores de búsqueda y comodines

Los operadores nos permiten realizar una búsqueda más exacta, estos

operadores podemos combinarlos con comodines. Los operadores deben

estar entre dos términos de búsqueda separados:

- or: Busca uno de los dos términos.

- and: Busca los dos términos en la

misma fuente.

- ? : cero o un carácter

- * : cero o más carácteres

Page 8: Corpus  alemán

El KORPUS C4 es una iniciativa que reúne los corpus del Digitalen

Wörterbuch der deutschen Sprache des 2. Jahrhunderts (DWDS), el

Austrian Academy Corpus (ACC), el Korpus Südtirol y el Schweizer

Textkorpus (CHTK).

Este corpus online es muy útil y tiene varias opciones para clasificar

la información.

Page 9: Corpus  alemán

Filtros/Filter:

Puedes reducir los textos a un año o un período concreto, puedes elegir la

categoría de los textos (textos literarios, periodísticos…), puedes buscar textos de

un autor en concreto, así como el título, etc.

Clasificación/Sortieren:

La función de exportación/Export es solo para usuarios. Se recomiendaregistrarse en la página (es gratuito hacerlo) para un mayor aprovechamiento dela herramienta.

Page 10: Corpus  alemán

Opciones/Optionen:

Puedes modificar las opciones de visualización de las búsquedas (numero de

resultados por página, información que aparece en cada columna…).

Ejemplos/Beispiele:

En este apartado se explica

cómo realizar una búsqueda

de forma óptima.

Page 11: Corpus  alemán

Hemos aplicado el filtro de categoría textual (textos literarios) y clasificado la

información por el año (descendente).

En las dos columnas de la izquierda vemos la procedencia del texto y el año. Al

clicar sobre “Zeit” podemos ver la palabra en su contexto, además de la fuente

(título, autor, editorial, año y página).

Resultados de la búsqueda

Page 13: Corpus  alemán

Además, DWDS te permite crear tu propio corpus online con solo registrarte

(es gratuito) al que podrás ir exportando textos de DWDS o descargarlos en

formato txt para usarlos con un programa de concordancias.

Este es el portal actual de DWDS, pero existe otro anterior, el Retro-Web

(esquina superior derecha).

Page 14: Corpus  alemán

Os dejo unas capturas para que veáis el resultado de búsqueda en elportal actual, pero en adelante os explicaré como funciona Retro-Webseite.

Podemos modificar la presentación

y filtrar los resultados.

Podéis ver los comodines y operadores de búsqueda aquí: http://www.dwds.de/help/ddc/

Page 15: Corpus  alemán

El portal Retro-Webseite de DWDS tiene algunas funciones propias de programas

de concordancia como las Kollokationen.

La desventaja de este portal es que solo puedes visualizar las búsquedas de un

corpus cada vez y no de todos como en el nuevo portal.

Bajo el nombre de cada corpus se muestra el

número de tokens que tiene.

Los corpus están clasificados en corpus de

referencia, corpus de periódicos, corpus de

lengua hablada y corpus temáticos.

Opciones de filtro y presentación (ver diapositiva 15)

Page 16: Corpus  alemán

Resultado de la búsqueda

Podéis ver los comodines y operadores de

búsqueda aquí:

http://retro.dwds.de/HilfeSuche/index

Wortverlauf:

Este apartado muestra una gráfica con la frecuencia

de aparición del término buscado por año y

categoría textual.

Page 17: Corpus  alemán

Kollokationen:

En este apartado se nos

muestra la posición de la

palabra buscada y una palabra

en segunda posición.

Nos dice la frecuencia de

aparición de las palabras por

separado y juntas.

Page 19: Corpus  alemán

viel Spaß!

ESPERAMOS QUE OS SEA DE UTILIDAD