Forfatter: Martin Christoffersen COWIterm

52
Cand.ling.merc. Copenhagen Business School Forfatter: Martin Christoffersen COWIterm Optimering af en elektronisk intranetordbog Vejleder: Henrik Køhler Simonsen April 2009

Transcript of Forfatter: Martin Christoffersen COWIterm

Page 1: Forfatter: Martin Christoffersen COWIterm

Cand.ling.merc. Copenhagen Business School

Forfatter:

Martin Christoffersen

COWIterm Optimering af en elektronisk intranetordbog

Vejleder:

Henrik Køhler Simonsen

April 2009

Page 2: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 2

Page 3: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 3

Executive summary

[COWIterm – Optimisation of an electronic intranet dictionary] Throughout 2008, I have had the challenges – and the pleasure – of developing COWIterm, an

electronically based intranet dictionary for the employees of COWI, a Danish engineering consultancy

group. However, the development has been within the frames set by COWI with regards to both data

presentation and data search. Therefore, my purpose in this thesis is to discuss different theories pertaining

to terminology and lexicography as well as existing electronically based intranet dictionaries in order to

examine the possibilities within the electronic online media, for the purpose of optimising COWIterm for

the intended user groups and functions.

The first thing to do when planning a dictionary is to establish the intended user groups, cf Bergenholtz

& Tarp (1994). The primary user group, set by COWI, consists of technicians and engineers with Danish as

their native language, and the functions relevant comprise production of English texts and translation from

Danish to English. Furthermore, I have assumed a secondary user group for whom the same functions

apply, consisting of translators and other language employees.

A secondary function is production of texts in Danish as well as translation from English to Danish by

people not having Danish as a native language, resulting in a tertiary user group consisting also of primarily

technicians and engineers; however; this group is more difficult to define, as it could be anyone not having

Danish as a native language.

I continue with outlining the theory of lexicography (Bergenholtz & Tarp, 1994), and the different word

types are described, lemma and equivalent selection are touched upon, and I establish the contents of a

microstructure (presentation of data) and how these data can be made searchable (the macrostructure).

Afterwards, theories of terminology (Madsen, 1999) are described, including concept systems and the

process of making definitions.

Next, I incorporate theories on online reference works including the theories of the lexicographic

convergence model as well as the lexicographic document template, cf Simonsen (2007) and Burke (1998),

and establish that there are almost unlimited possibilities for data presentation and data search methods,

including the elements of multimedia (sound, images, videos).

In the discussion, I juxtapose the theories of traditional lexicography and terminology with those of

electronic lexicography and internet reference works relevant for COWIterm in order to explore the

optimum layout for an electronic based intranet dictionary such as COWIterm.

I argue inter alia for the implementation of internal subject classifications of COWI's six main business

areas, as this will help identifying 1) relevant texts to be included in the corpora; 2) relevant terms in those

texts. Furthermore, it would be necessary to include annual reports and contracts as well as other

economic and legally binding documents in the corpora, as the secondary user group can be assumed to

produce and translate such texts.

Page 4: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 4

I base my conclusion on a model, showing the ideal way of constructing an electronically based intranet

dictionary such as COWIterm, consisting of a result page in the upper third of the screen, above it only an

input field for making a new search as well as the possibility of selecting a subject and a text genre for the

new search. In the lower two-thirds of the screen, the information related to the term clicked upon in the

result list appears, and space is reserved for different kinds of multimedia in the left hand side of the entire

screen.

Page 5: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 5

0 Indholdsfortegnelse

1 Indledning ........................................................................................................................... 7

2 Problem .............................................................................................................................. 8

3 Afgrænsning ........................................................................................................................ 9

3.1 Teoretisk afgrænsning ............................................................................................................. 9

3.1.1 Fagleksikografi .............................................................................................................................................. 9

3.1.2 Terminologi ................................................................................................................................................... 9

3.2 Empirisk afgrænsning .............................................................................................................. 9

4 Metode ............................................................................................................................. 10

4.1 Specialet ............................................................................................................................... 10

4.2 COWIterm ............................................................................................................................. 10

5 Brugergrupper ................................................................................................................... 12

6 Ordbogsfunktioner ............................................................................................................ 14

7 Teori ................................................................................................................................. 15

7.1 Fagleksikografi ...................................................................................................................... 15

7.1.1 Ordtyper ...................................................................................................................................................... 16

7.1.2 Lemmaselektion .......................................................................................................................................... 17

7.1.3 Ækvivalentselektion .................................................................................................................................... 18

7.1.4 Mikrostruktur .............................................................................................................................................. 19

7.1.5 Makrostruktur ............................................................................................................................................. 28

7.2 Terminologi ........................................................................................................................... 30

7.2.1 Begrebssystemer......................................................................................................................................... 30

7.2.2 Definitioner ................................................................................................................................................. 31

7.2.3 Dannelse af og krav til fagudtryk ................................................................................................................ 34

7.3 Elektronisk virksomhedsleksikografi ...................................................................................... 36

7.3.1 Elektronisk makrostruktur .......................................................................................................................... 36

7.3.2 Elektronisk mikrostruktur ........................................................................................................................... 37

8 Diskussion ......................................................................................................................... 39

8.1 Lemma- og ækvivalentselektion ............................................................................................. 39

8.2 Diskussion af makrostruktur .................................................................................................. 41

8.3 Diskussion af mikrostruktur ................................................................................................... 42

8.4 Brugermedbestemmelse........................................................................................................ 48

9 Konklusion ........................................................................................................................ 50

10 Litteraturliste ................................................................................................................. 52

Page 6: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 6

Ovenstående indholdsfortegnelse kan simplificeres ved nedenstående model, som specialet struktureres

efter. Man kan øverst på hver side følge med i, hvor langt henne man er i specialet.

Page 7: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 7

1 Indledning Virksomheder agerer i stigende grad i et internationalt og videnstungt miljø med mere og mere

internationalt samarbejde. For at kunne give det rigtige tilbud til de rigtige kunder er det vigtigt, at

kunderne – og de interne afdelinger imellem – ikke forvirres af inkonsekvent og uklart sprogbrug. Det er

derfor vigtigt, at en ensartet terminologi anvendes, for internt i virksomheden at kunne koordinere

sådanne projekter, da misforståelser kan være kostbare i både tid og penge (Almsten & Kristensen, 2008, s.

26). Kirchmeier-Andersen (2003) argumenterer for, at "virksomheder skal være omhyggelige med deres

sproglige kommunikation, ellers risikerer de at miste kunder og penge, og i værste fald at blive offentligt til

grin".

"[E]n konsekvent sprogbrug [bliver] mere og mere nødvendig hvis man vil arbejde systematisk med den

viden der ligger gemt i de elektroniske dokumenter" (Kirchmeier-Andersen, 2003, s. 17), og term- og

videnbaser er vigtige værktøjer i opbyggelsen og vedligeholdelsen af den rigtige sprogstrategi (Kirchmeier-

Andersen, 2003, s. 18).

Dette er ikke mindst relevant for store, internationale virksomheder som COWI, med deres mange

tusinde medarbejdere, hvis sprogbrug og kommunikation – både internt og udad til – sagtens kan blive

meget rodet og uensartet, hvis ikke der er nedfældet retningslinjer. COWI udfører løbende projekter på

stort set alle kontinenter og med mange forskellige samarbejdspartnere – hvilket er tydeligt ved nogle få

klik på COWIs hjemmeside, jævnfør COWI A/S – så vigtigheden af en ensartet terminologi kan ikke

underdrives, og Geeb (1998) argumenterer for en fleksibel og innovativ intranetløsning. Terminologi

"handler om ord og om velfungerende kommunikation" (Almsten & Kristensen, 2008, s. 26), og den rette

terminologi er derfor også afgørende for COWIs billede udad til.

Page 8: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 8

2 Problem I løbet af 2008 har jeg haft fornøjelsen af og udfordringerne med at arbejde med udviklingen af

COWIterm – en intranetordbog mellem dansk og engelsk til brug for virksomheden COWIs medarbejdere.

Under udarbejdelsen har jeg, meget naturligt, været nødsaget til at læse leksikografisk og terminologisk

teori, og i processen er jeg selv flere gange kommet på idéer, der kunne gøre ordbogen mere brugervenlig.

Desuden har jeg fået idéer udefra til, hvordan ordbogen kunne forbedres – med ordbogens målgrupper og

funktioner, jævnfør Bergenholtz & Tarp (1994, s. 16-25), in mente. COWI har imidlertid, i hvert fald som

udgangspunkt, ønsket en ganske simpel ordliste med et tilhørende kommentarfelt, da det ville være det

nemmeste at sætte op og gå videre ud fra.

På basis af disse erkendelser og erfaringer er det derfor mit formål med dette speciale

at analysere og diskutere forskellige datasøgnings- og datapræsentationsmetoder i

virksomhedsordbøger med henblik på forbedring af COWIterm

For på bedst mulig vis at finde frem til en løsning vil udforskningen af følgende underspørgsmål indgå i

min analyse og besvarelse:

Hvilke datasøgningsmetoder diskuteres i litteraturen og i praksis?

o Ville det i COWIterm være relevant at kunne filtrere efter fag?

o Ville det i COWIterm være relevant at kunne filtrere efter tekstgenre?

Hvilke datapræsentationsmetoder findes i litteraturen og i praksis?

o Hvilke datapræsentationsmuligheder ville være relevante i COWIterm?

o Er det administrativt forsvarligt kun at have et kommentarfelt til alle andre angivelser end

lemma/ækvivalent?

o Hvor meget skal brugerne selv have lov til at skræddersy den mængde data, de bliver

præsenteret for?

Page 9: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 9

3 Afgrænsning Jeg har afgrænset dette speciale både teoretisk og empirisk, og nedenfor har jeg anført hvilke

afgrænsninger, der vil blive taget til hjælp for at kunne centrere analysen omkring mit problem.

3.1 Teoretisk afgrænsning Min teori består af litteratur, der især behandler fagleksikografi og terminologi. De to områder vil kort

blive beskrevet herunder:

3.1.1 Fagleksikografi

"Leksikografi er udarbejdelse af ordbøger" (Bergenholtz & Tarp, 1994, s. 27). Deraf kan så udledes, at

fagleksikografi er udarbejdelse af fagordbøger. Der findes imidlertid forskellige former for leksikografi.

Udover den praktiske leksikografi, som er det egentlige arbejde med udarbejdelsen af ordbøger, findes der

tre typer metaleksikografi, hvori leksikografernes teoretiske overvejelser om og undersøgelser af ordbøger

bliver behandlet (Bergenholtz & Tarp, 1994, s. 27). Det drejer sig om brugerforskning, ordbogskritiske

undersøgelser samt systematisk ordbogsforskning. Inden for brugerforskning undersøges

brugervenligheden i diverse ordbøger og generelle brugervejledninger opstilles; leksikografer inden for

ordbogskritiske undersøgelser udarbejder ordbogsanmeldelser og modeller til dette arbejde; og endelig

udarbejder leksikografer inden for systematisk ordbogsforskning nye eller forbedrede teorier, der kan

bruges ved udarbejdelse af nye ordbøger. (Bergenholtz & Tarp, 1994, s. 28). I dette speciale er det primært

systematisk ordbogsforskning, der vil blive fokuseret på.

3.1.2 Terminologi

Definitionen på en term er ifølge Madsen (1999) "et sprogligt tegn, som har en specifik betydning i et

fagsprog" (Madsen, 1999, s. 16), og terminologi bliver derved studiet af og arbejdet med termer (udtrykket

fagterm er altså en pleonasme). Termer kan for langt størstedelen også være en del af et begrebssystem

inden for det pågældende fag (Madsen, 1999, s. 13). I lingvistikken snakker man om, at en term både har et

udtryk og et indhold. Udtrykket, hvilket i de fleste tilfælde vil være et fagudtryk, når det kommer til

COWIterm, er den skrevne repræsentation af termen, og indholdet er et ligeledes fagligt begreb, som

består af karakteristiske træk. En intension består af ét eller af en række karakteristiske træk, hvorunder

entiteter ude i virkeligheden kan høre. Den samling entiteter, der defineres af en sådan intension kaldes for

en ekstension (Madsen, 1999, s. 16-18). "[U]dtrykket entitet refererer til et hvilket som helst fænomen, det

være sig materielt eller immaterielt" (Madsen, 1999, s. 18).

En terminologi kan også henvise til den samling termer, som er speciel for et bestemt fag, men denne

betydning vil der i dette speciale blive set bort fra.

3.2 Empirisk afgrænsning Min empiri består primært af de tekster, jeg har fået adgang til af COWI med henblik på at udarbejde en

ingeniørteknisk ordbog med tilføjelse af andre relevante ord såsom økonomiske og juridiske termer samt

andre ord, der generelt kan være besværlige at oversætte.

Sekundært inkluderes diskussion af datasøgnings- og datapræsentationsmetoder i andre elektroniske

virksomhedsordbøger.

Page 10: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 10

4 Metode I dette kapitel vil jeg beskrive, hvorledes resten af specialet vil udforme sig, og dernæst vil jeg give en

kort beskrivelse af tilblivelsen af COWIterm.

4.1 Specialet På baggrund af de indledende afsnit (Indledning, Problem, Afgrænsning og Metode) vil jeg beskrive teori

inden for de relevante områder, leksikografi og terminologi. I forening med mit problem vil jeg her fokusere

på, hvilke relevante søgemuligheder og datapræsentatiosmetoder, der findes i litteraturen og i praksis.

Dernæst vil jeg i diskussionen, på baggrund af teoriafsnittet samt de forslag og tilføjelser til løsningen af

mit problem, som jeg har udarbejdet under mit arbejde med COWIterm, udlede, hvordan ordbogsartikler

bør opstilles i en elektronisk onlineordbog som COWIterm.

Til sidst vil jeg i konklusionen svare på, hvordan COWIterm optimalt set bør opstilles for at tilgodese så

stor en del af brugergruppen som muligt på baggrund af både teori og diskussion.

4.2 COWIterm Fra marts til december 2008 har jeg, via min kontaktperson i COWI, Anja Fabech Jensen, haft adgang til

to ens korpora på dansk henholdsvis engelsk, hvert bestående af 178 tekster af meget varierende længde

(fra under en halv side og op til 17 siders løbende tekst), med henblik på at udvælge relevante termer til

brug i COWIterm. Teksterne er løbende blevet udvalgt dels på baggrund af mine månedlige

statusrapporteringer, hvor det har været muligt at identificere hvilke områder under COWI, der har været

underrepræsenteret i COWIterm. De engelske tekster er blevet produceret på baggrund af de danske

kildetekster (se Figur 1). Arbejdet er foregået således, at jeg har identificeret relevante termer i den danske

tekst og parret dem med ækvivalenter i den engelske tekst. Derefter er de blevet lemmatiseret og tilføjet

COWIterm. Et udsnit af den færdige ordbog i tekstformat kan ses i Figur 2.

Figur 1 Et tekstpar. Kildetekst på dansk og måltekst på engelsk.

Page 11: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 11

Figur 2 Lille uddrag af COWIterm, som den færdige version så ud i tekstformat. Ændringer og rettelser må i skrivende stund forventes at være indarbejdet.

Page 12: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 12

5 Brugergrupper Det er vigtigt først at gøre sig klart, hvem ordbogens målgruppe er, samt hvor meget sproglig

henholdsvis faglig viden denne gruppe besidder. Dette er en forholdsvis simpel opgave ved

koncernordbøger, da målgruppen mere eller mindre allerede er defineret (Bergenholtz & Tarp, 1994, s. 15-

18+73). I begyndelsen af arbejdet med COWIterm blev det defineret for mig, at ordbogen primært skulle

anvendes til oversættelse til og tekstproduktion på engelsk, og at den primære målgruppe for COWIterm er

teknikere og ingeniører. Tillige har jeg antaget en sekundær brugergruppe, som består af oversættere og

andre sprogmedarbejdere, da det må formodes, at denne gruppe også vil benytte ordbogen som et værktøj

i deres arbejdsforløb. En sekundær funktion er oversættelse til og produktion på dansk af personer med

andet modersmål end dansk, hvilket resulterer i en tertiær målgruppe.

I Figur 3 har jeg angivet hvor stor fremmedsproglig indsigt henholdsvis faglighed, de tre grupper

besidder, samt hvor store ordbogskundskaber, de formodes at have. Tillige har jeg sat mig selv ind i figuren

som referencepunkt. Grunden til, at der skal skelnes mellem brugere med forskellig faglighed henholdsvis

fremmedsproglig indsigt gør sig gældende dels med hensyn til hvilke elementer, der skal indarbejdes i

ordbogsartiklerne, og dels med hensyn til sproget og den tekst, som artiklerne består af. Lægfolk har oftest

brug for flere informationer end fagfolk har, og ligeledes har folk med lille sproglig viden brug for flere

informationer omkring for eksempel uregelmæssig bøjning og ordforbindelser end folk med stor sproglig

viden (Bergenholtz & Tarp, 1994, s. 17).

Graden af ordbogskundskaber er vigtig i den henseende, at folk, der ikke er vante til at slå op i ordbøger,

skal hjælpes mere på vej, både i søgeforløbet men også i selve artiklerne. Selvom mediet er skiftet fra papir

til et elektronisk medium, er det stadig de samme typer information, brugerne forventer at – og som de

oftest kan – finde. Graden af ordbogskundskaber kan give udslag i udformningen af artiklerne samt

mængden og udformningen af forkortelser, for eksempel i forbindelse med de faglige markeringer, da

nogle kan have svært ved at tyde disse tekstuelle og sproglige signaler.

Jeg har antaget i Figur 3, at en persons ordbogskundskaber er nogenlunde analoge med vedkommendes

Figur 3 Hvor stor viden COWIterms brugergrupper besidder. Model videreudviklet fra Bergenholtz & Tarp (1994), jævnfør punkt 7.1.4 Mikrostruktur (under ordforbindelser).

Page 13: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 13

fremmedsproglige indsigt, da det må formodes, at oversættere og andre sprogmedarbejdere jævnligt slår

op i en ordbog og dermed opbygger erfaring på dette område i modsætning til teknisk uddannede, der som

oftest ikke har med sprog at gøre.

COWIterms primære brugergruppe (rød cirkel) består af fagfolk inden for ingeniørfag og de besidder en

stor faglighed bestående af teknisk viden. Til gengæld er graden af deres fremmedsproglige indsigt

begrænset. Graden af denne gruppes ordbogskundskaber er ligeledes lav, hvilket til sammen gør, at

ordbogen og dens tekstuelle og sproglige signaler skal være meget let tilgængelige for at denne gruppe kan

få nytte af ordbogen.

COWIterms sekundære brugergruppe (blå cirkel), som består af oversættere og andre

sprogmedarbejdere, ligger ikke langt fra mig selv; dog må det formodes, at denne gruppe er i besiddelse af

noget mere faglighed end mig selv. Da de dog ikke arbejder med tekniske processer og maskiner til

hverdag, har jeg angivet denne gruppe til at besidde middel faglighed, dog ikke langt fra grænsen til stor

faglighed. Denne gruppe besidder tillige stor fremmedsproglig indsigt samt en høj grad af

ordbogskundskaber.

Den tertiære brugergruppe består, ligesom den primære brugergruppe, af personer med høj faglighed

og viden inden for teknik og ingeniørfag. Deres fremmedsproglige indsigt er dog sværere at definere, da det

er en blandet gruppe af alle udefrakommende, der kunne tænkes at benytte COWIterm, men da denne

gruppe ikke har dansk som modersmål og man ikke kan antage, at gruppen har engelsk som modersmål, er

de ringere stillet end den primære gruppe. Ligeledes er det ukendt, hvor ofte de slår op i en ordbog samt

graden af kendskab til vestligt producerede ordbøger, og til sammen gør alt dette, at gruppen i Figur 3 er

defineret til at have mindre fremmedsproglig (i dette tilfælde dansk) indsigt end den primære målgruppe.

Hvad angår fremmedsproglig indsigt i den primære gruppe kunne man forestille sig, at en vis del heraf

besidder terminologi på fremmedsproget, men at de mangler grammatik og generel sproglig viden til at

kunne skrive eller oversætte en tekst, hvorimod man i den sekundære gruppe kunne forestille sig, at det er

den fagsproglige viden (terminologi), der halter bagefter.

Som det kan ses af Figur 3 (grønne cirkler) har jeg flyttet mig i løbet af ordbogsprojektet. Dels har jeg

lært samt kender nu til mere teknisk terminologi og sprogbrug, og dels besidder jeg nu flere

ordbogskundskaber, da jeg forstår motivationen for de forskellige valg i ordbøger.

Page 14: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 14

6 Ordbogsfunktioner Som tidligere nævnt er COWIterm primært intenderet til funktionerne oversættelse til og produktion på

engelsk. Til produktion af tekster på et fremmedsprog angiver Bergenholtz & Tarp (1994) en række

elementer, der bør inkorporeres, og disse udgør 1) ortografi, genus, udtale, uregelmæssighed,

kollokationer, andre informationer om sprogbrug; 2) norm, faglig markering og/eller faglig forklaring

(Bergenholtz & Tarp, 1994, s. 21). Tillige diskuteres, om dataene skal placeres i en ordliste, der går fra

dansk-engelsk eller engelsk-dansk, men det anbefales, at data præsenteres i begge ordlister (Bergenholtz &

Tarp, 1994, s. 19-20).

Til oversættelse anbefales det at inkorporere følgende elementer: 1) til modersmålet: ordklasse, genus,

udtale, uregelmæssighed; 2) til fremmedsproget: ortografi, genus, udtale, uregelmæssighed, kollokationer,

andre informationer om sprogbrug; 3) ækvivalent(er); 4) eventuelt om graden af ækvivalens; 5) norm, faglig

markering og/eller kort forklaring (Bergenholtz & Tarp, 1994, s. 21).

Hvad angår produktion på og oversættelse til dansk af den tertiære målgruppe, er det de samme

elementer som angivet ovenfor, der er relevante. Dette er tilfældet, fordi dansk for den tertiære

brugergruppe er et fremmedsprog, og dermed gælder de samme retningslinjer som for oversættelse af

dansk til engelsk og produktion på engelsk for den primære og sekundære brugergruppe, for hvem engelsk

er fremmedsproget. Dog er den tertiære brugergruppe yderligere handikappet i denne forbindelse, da

engelsk ikke kan siges at være modersmålet.

Som det kan ses af overstående, er der sammenfald mellem nogle af de informationer, der medtages i

forbindelse med de to funktioner, hvilket letter arbejdet med at producere ordbøger, der kan benyttes i

multiple situationer. Hvis alle informationer alligevel bliver gjort tilgængelige for alle brugere på begge

sprog, er det dog af mindre betydning, hvilke informationer der præsenteres i hvilken forbindelse.

Eftersom ordbogen sekundært også er til brug for folk med andet modersmål end dansk, er der ligeledes

forklaringer, eksempler med mere ved det danske lemma, hvilket igen gør, at ordbogen bliver anvendelig til

reception og forståelse af tekster på dansk (Bergenholtz & Tarp (1994, s. 20-21).

Page 15: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 15

7 Teori I det følgende kapitel vil jeg beskrive den teori, som vil ligge til grund for diskussionen af mit problem,

det vil sige, som allerede nævnt i underkapitel 3.1 Teoretisk afgrænsning, teori omhandlende

fagleksikografi og terminologi samt teori omkring onlineleksikografi.

7.1 Fagleksikografi Madsen (1999) inddeler det terminologiske arbejdsforløb i tre faser, "som resulterer i udarbejdelse af

terminologiske artikler til en termbase eller en fagordbog" (Madsen, 1999, s. 124):

1) Forarbejde

- Afgrænsning af arbejdsområdet

- Indsamling af dokumentationsmateriale og kontakt med fageksperter

- Bedømmelse og udvælgelse af dokumentationsmateriale

- Eventuel efterjustering af afgrænsningen

2) Terminologisk arbejde

Parallelt for begge sprog:

- Identificering af termer og indsamling af oplysninger (definitioner, teksteksempler etc.)

- Systematisering (udarbejdelse af begrebssystemer)

Efter registrering af terminologi på begge sprog:

- Sammenligning mellem de to sprogs begreber (definitioner og begrebssystemer)

3) Terminografisk arbejde

- Udarbejdelse af terminologiske enheder (artikler)

(Madsen, 1999, s. 124)

Denne arbejdsmetode er ikke helt ulig den, som Bergenholtz & Tarp (1994) beskriver, og som vil blive

præsenteret i det følgende.

Når man planlægger en ordbog, skal man først og fremmest fastlægge ens brugergruppe og derudfra i

hvilke situationer, ordbogen skal anvendes (Bergenholtz & Tarp, 1994, s. 15). Dette er som regel en

forholdsvis simpel opgave ved udarbejdelsen af branche- og koncernordbøger i forhold til ved

udarbejdelsen af andre ordbøger, da brugergruppen her allerede er defineret, jævnfør kapitel 5

Brugergrupper. Dog skal man alligevel gøre sig nogle overvejelser i denne forbindelse, såsom hvor stor

faglig henholdsvis sproglig viden, den enkelte bruger besidder (Bergenholtz & Tarp, 1994, s. 17-18), samt

om ordbogen skal benyttes ved reception, produktion eller oversættelse af tekster (Bergenholtz & Tarp,

1994, s. 15).

Ordbogens empiri baseres optimalt set på et tekstkorpus svarende til de tekster, som brugergruppen må

forventes at skulle beskæftige sig med (Bergenholtz & Tarp, 1994, s. 15), da disse tekster indeholder den

terminologi, som brugerne eftersøger. Hermed bliver der som sådan ikke tale om et enkelt eller nogle få

fagområder, da en virksomhedsbaseret intranetordbog som COWIterm kan spænde over så vidt forskellige

fag og begreber som regnskabsnormer over erstatningssager til produktsortiment.

Page 16: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 16

Bergenholtz & Tarp (1994) beskriver alle elementer indeholdt i en ordbog, og behandler derfor kun på et

begyndende og nu forældet stadium elektroniske ordbøger, men mange af grundelementerne og

overvejelserne omkring for eksempel opbygningen af mikrostrukturen er stadig yderst relevante. Jeg vil i

det følgende starte med at definere de forskellige ordtyper og angive retningslinjer for, hvordan disse

behandles. I tilknytning hertil kommer en kort redegørelse for lemma- og ækvivalentselektion. Herefter vil

jeg gå mere i dybden med de forskellige dele af mikrostrukturen efterfulgt af en gennemgang af

makrostrukturer.

7.1.1 Ordtyper

Når man skal udvælge hvilke ord, der skal lemmatiseres, må man først have gjort sig nogle tanker

omkring, hvad et ord er. Bergenholtz & Tarp (1994) nævner ortografiske, fonologiske, grammatiske samt

leksikalske ord.

Et ortografisk ord er en sammensætning af bogstaver, der har mellemrum eller sætningstegn omkring

sig, men det kan ikke indeholde mellemrum og/eller sætningstegn, da det så ville udgøre to eller flere

ortografiske ord. Selvom et begreb som "fuldstændigt endossement" ville kunne slås op i rette ordbog – og

i visse sammenhænge også anses som et enkelt ord – består det af to ortografiske ord: "fuldstændigt" og

"endossement". Ofte er det sådan med termer, der består af flere ortografiske ord, at betydningen ikke er

kompositionel, hvilket vil sige, at man ikke kan udlede betydningen af de begreber, der indeholdes i de

enkelte ortografiske ord (Bergenholtz & Tarp, 1994, s. 100) (Trask, s. 1) (Madsen, 1999, s. 14).

Fonologiske ord findes i talesprog, og "kan isoleres ved hjælp af grænsesignaler, som kan være endda

meget forskellige fra sprog til sprog" (Bergenholtz & Tarp, 1994, s. 100). Således deles en talestrøm på for

eksempel engelsk op i fonologiske ord ved at tælle hovedtryk: Ét hovedtryk dækker ét fonologisk ord, og

således kan hele eller dele af sætninger udgøre et enkelt fonologisk ord uden hensyntagen til opdelingen i

ortografiske ord (Trask, s. 2).

Et grammatisk ord kan bestå af kun en ordstamme eller af en stamme samt et fleksionsmorfem. Dette

kan illustreres ved hjælp af stammen "træ" og fleksionsmorfemet "-er". Desuden kan visse ortografiske ord

repræsentere flere grammatiske ord (Bergenholtz & Tarp, 1994, s. 100) (Trask, s. 4-5).

Et leksem (også kaldet leksikalsk ord) er betegnelsen for en gruppe grammatiske ord med samme

stamme og fleksionsparadigme. For eksempel er "træ" og "træer" to forskellige repræsentationer af det

abstrakte leksem TRÆ. Det er som hovedregel leksemerne, der lemmatiseres i ordbøger, da denne form

helt og fuldkomment udgør stammen og derfor ikke har yderligere affikser eller fleksionsmorfemer

tilknyttet. Derfor omtales denne repræsentation af leksemet (leksemer er jo abstrakte enheder) som

grundformen. Det kan dog være hensigtsmæssigt ligeledes at lemmatisere uregelmæssigt dannede

grammatiske ord, da disse ellers kan være svære at finde i ordbogen. I sådan en situation er hovedformålet

med artiklen at henvise til det rette leksem, hvor forklaring med mere så vil være angivet (Bergenholtz &

Tarp, 1994, s. 100-101) (Trask, s. 3).

Herudover kan man også med fordel lemmatisere orddele (også kaldet streglemmata), det vil sige

affikser og ordstammer, da en sådan selektion kan give "brugeren indblik i regelmæssige orddannelser, som

ikke alle kan lemmatiseres" (Bergenholtz & Tarp, 1994, s. 115) samt forkortelser, da disse er hyppige i visse

fagsprog, og det er ikke altid indlysende, hvilken uforkortet term forkortelsen står i stedet for (Bergenholtz

Page 17: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 17

& Tarp, 1994, s. 105+115). Initialord er en type forkortelser, der dannes ved at trække

begyndelsesbogstaverne i en ordrække sammen. Initialord (eller initialforkortelser, som de også kaldes),

der kan udtales som et selvstændigt ord (for eksempel "NATO"), kaldes for et akronym, jævnfør Trask (s. 9-

10) samt Madsen (1999, s. 108). Andre eksempler på forkortelser er ellipseord og teleskopord. Ellipseord

dannes ved afkortning, hvor enten den første eller den sidste del af ordet skæres væk. Det er oftest sådan,

at det fulde ord er gammeldags eller i hvert fald sjældnere brugt end det afkortede ord. Teleskopord

dannes ved at udtage forskellige dele af ofte flerordstermer og sætte dem sammen, så de kan udtales som

et selvstændigt ord. Dette er dog en noget sjældnere praksis på dansk end på engelsk (Trask, s. 9-11)

(Madsen, 1999, s. 108-109).

Madsen (1999) skelner herudover mellem tre typer ord, nemlig rodord, sammensætning og afledning.

Således består rodord kun af en rod uden nogen former for affikser, hvor afledninger består af en rod samt

et eller flere affikser. Rodord og afledninger er til sammen, hvad Bergenholtz & Tarp (1994) kalder for

grammatiske ord. Sammensætninger betegnes som bestående af minimum to ordstammer med eller uden

affikser, der på dansk skrives som ét ortografisk ord (ofte med et bindebogstav, som regel "e" eller "s"),

men som på engelsk tit består af to ortografiske ord (Madsen, 1999, s. 102). Sammensætninger som

beskrevet her er analogt med hvad Bergenholtz & Tarp (1994, s. 101) benævner ordgruppeleksemer.

Derudover nævnes også ordgrupper (Madsen, 1999, s. 106), der dækker over det samme som

flerordstermer, som består af to eller flere ortografiske ord.

Det foreslås, at hvis ikke grundformen benyttes i det pågældende fagsprog, skal den grammatiske form,

der benyttes, lemmatiseres. Grundformen kan man så anføre eventuelt udelukkende som et

henvisningslemma (Bergenholtz & Tarp, 1994, s. 101).

Det foreslås også, at man lemmatiserer relevante grammatiske termer, og især de termer, der bliver

anvendt ved grammatiske angivelser. På denne måde behøver brugeren ikke at søge hjælp andetsteds for

at finde ud af, i hvilke sammenhænge et bestemt ord kan bruges (Bergenholtz & Tarp, 1994, s. 115).

Udover Madsens (1999) og Bergenholtz & Tarps (1994) inddeling af ord, diskuterer Trask (What Is A

Word?) en række andre ordtyper i dybden, som jeg af pladshensyn ikke vil komme nærmere ind på her.

7.1.2 Lemmaselektion

Bergenholtz & Tarp (1994, s. 101-102) diskuterer en række forskellige måder at finde frem til den rette

terminologi på, når man arbejder med enkelte fagområder. Det er dog ikke relevant her, da specialet ikke

omhandler et bestemt fag men en koncerns samlede fagsprog, som spænder over en uudtømmende række

fag og fagområder.

"Det er ikke ualmindeligt, at bilingvale ordbøger bliver vendt, dvs. at Lb-ækvivalenterne [sic] i en La-Lb-

ordbog bliver selekterede til en -Lb-La-ordbog" (Bergenholtz & Tarp, 1994, s. 102), hvilket kun kan anbefales

for ikke-kulturbundne fag. Under alle omstændigheder ved vending af ordbøger skal man sørge for at læse

ordbogen igennem og rydde op i eventuelle enslydende lemmata samt kontrollere ækvivalentrelationer,

diverse forklaringer samt eksempler (Bergenholtz & Tarp, 1994, s. 102).

Normalt udgøres lemmabestanden i fagordbøger af

Page 18: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 18

1) rene termer

2) både rene termer og andre udtryk, som ikke er fællessproglige

3) alle udtryk, om hvilke det antages, at de forekommer regelmæssigt

4) udtryk, som forekommer med en fastlagt mindstefrekvens i et givet fagsprogligt korpus

(Bergenholtz & Tarp, 1994, s. 103)

Ved flerfagsordbøger bliver man nødt til at anvende enten model 2) eller 3), skønt disse "indebærer

introspektive skøn, som ikke sikrer en systematisk og konsekvent selektion" (Bergenholtz & Tarp, 1994, s.

104).

7.1.3 Ækvivalentselektion

"Det er […] af største betydning, at leksikografen har et pålideligt, aktuelt, systematisk

sammensat og lettilgængeligt redskab til sin rådighed, når ækvivalenterne skal udvælges. Et

tekstkorpus, der er sammensat med ovennævnte mål for øje, udgør et sådant redskab"

(Bergenholtz & Tarp, 1994, s. 105-106).

Har man ikke noget korpus til sin rådighed, anbefales det, at man kontrollerer ækvivalenter til brug i en

bilingval ordbog frembragt på anden vis ved at foretage opslag i faglige, monolingvale L2-ordbøger og

eventuelt sammenholde disse resultater med opslag i tilsvarende L1-ordbøger. Giver dette stadig ikke noget

entydigt resultat, må man søge i yderligere materiale såsom lærebøger eller tekster fra producenter,

optimalt set på begge sprog (Bergenholtz & Tarp, 1994, s. 107).

Derudover er der fem procedurer, der bør gennemgås, når der skal selekteres ækvivalenter i korpora:

1) Leksikografen vil via introspektion have kendskab til en række lemmatas ækvivalenter, som så

hurtigt kan verificeres ved søgning i et L2-korpus.

2) Ved tilfælde, hvor man ikke er helt sikker, men alligevel kan afgrænse mulighederne, kan man søge i

korpusset på de muligheder, man mener at have, eventuelt meget gerne med trunkeringer, så man

er sikker på at få alle former og dermed alle sammenhænge med.

3) Hvis ikke en brugbar ækvivalent findes ved hjælp af ovenstående metoder, kan man prøve at søge

på ord i den kontekst, hvori lemmaet står. Dog skal man kun søge på ord, hvor der med stor

sandsynlighed kan antages en enkelt ækvivalent uden heller at søge på for generelle, samt for

sammenhængen uvæsentlige, søgeord.

4) Hvis hverken introspektion, kvalificerede gæt eller sproglig kontekst kan hjælpe en til at finde den

rette ækvivalent, må man skabe sig et overblik over, hvilket produkt teksten omhandler. Herefter

kan man så søge i L2-korpus efter samme produkt og finde termen i en parallel sammenhæng.

5) Denne sidste mulighed for ækvivalentselektion ved hjælp af korpus er forholdsvis tidskrævende og

derfor den sidste udvej. Den indebærer en gennemlæsning af de nærmeste afsnit omkring

forekomsterne af lemmaet og derefter søgning efter andre ord inden for det tema, hvori lemmaet

indgår. De L2-tekster, hvor de fremkomne fund indgår, læses omhyggeligt igennem, indtil man

støder på en parallel tematisk kontekst. Denne metode må anvendes oftest, når der skal udarbejdes

bilingvale ordbøger inden for kulturbundne fag.

(Bergenholtz & Tarp, 1994, s. 107-109)

Page 19: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 19

7.1.4 Mikrostruktur

Mikrostrukturen er den måde, hvorpå selve ordbogsartiklerne er opbygget. Når man slår et ord op,

hvilke forskellige oplysninger kan man så finde, og hvordan er de repræsenteret (Bergenholtz & Tarp, 1994,

s. 216). Det være sig udtale, grammatiske angivelser, faglige og sproglige markeringer, ækvivalent(er),

faglige forklaringer, ordforbindelser, eksempler, synonymer og antonymer samt henvisninger.

Bergenholtz & Tarp (1994) belyser vigtigheden af, at der er system i, i hvilken rækkefølge de forskellige

elementer i en ordbogsartikel bliver præsenteret. Dette kan man gøre ved først at lave et skema over hvilke

informationer, der skal stå hvor i artiklen – blandt andet fordi det ikke er alle informationer, der skal med i

alle artikler. Det kommer an på lemmaet; på både ordklassen (det er jo for eksempel kun verber, der kan

være transitive) og på hvor meget forklaring, lemmaet har brug for. Netop for at sikre, at de forskellige

ordklasser bliver behandlet til fulde – og ens – kan man oprette et artikelskema for hver ordklasse. Dette er

især relevant, hvis man påtænker også at inkludere fleksioner (Bergenholtz & Tarp, 1994, s. 216).

Bergenholtz & Tarp (1994) er her selv lidt ustrukturerede, måske fordi det lange afsnit omkring

mikrostruktur i bogen nærmest er løbende tekst. Jeg vil dog i det følgende prøve at skabe lidt orden i det.

Jeg vil i øvrigt ligeledes kun fokusere på funktionerne oversættelse og produktion, da disse er de primære

funktioner i projektet hos COWI, jævnfør kapitel 6 Ordbogsfunktioner.

Udtaleangivelse er noget, der angives i mange ordbøger, og det kan gøres på forskellige måder alt efter,

hvor detaljeret det skal være. Man kan gøre det i selve lemmaet ved hjælp af trykstreger, eller man kan

danne et separat felt umiddelbart efter lemmaet – før enhver grammatisk angivelse – med fonetisk skrift.

Det samme gør sig selvsagt gældende for en udtaleangivelse for ækvivalenten. Oplysninger om udtale er

ikke direkte relateret til ordbogsfunktionerne oversættelse og produktion, da disse omhandler skrevet

sprog, men det kan alligevel være en fordel at have med, "da kendskab til udtalen for mange mennesker

har en hukommelsesstøttende funktion" (Bergenholtz & Tarp, 1994, s. 136+220).

Grammatiske oplysninger til lemmaet bør "placeres i et grammatisk felt efter lemmaet, men før

ækvivalenten, og grammatiske oplysninger til ækvivalenten bør placeres i et grammatisk felt efter denne"

(Bergenholtz & Tarp, 1994, s. 217). Det bør således altid være sådan, at oplysninger specielt tilhørende

lemmaet kommer umiddelbart efter lemmaet og før ækvivalenten, og at oplysninger specielt tilhørende

ækvivalenten kommer umiddelbart efter ækvivalenten og før eventuelle øvrige oplysninger, der har

relevans for både lemma og ækvivalent.

Bergenholtz & Tarp (1994) angiver de forskellige elementer, som grammatikfeltet kan og i de fleste

tilfælde bør indeholde, hvilke er: ordklasse, køn, morfologi og syntaks. Det er ligeledes vigtigt at

standardisere rækkefølgen af de feltinterne oplysninger indeholdt i grammatikfeltet, da det vil lette

arbejdet for brugeren med at finde de relevante oplysninger (Bergenholtz & Tarp, 1994, s. 217). Især

ved verber skal man passe på ikke at forvirre brugeren; det anbefales således kun at angive

fleksionsmønstre ved uregelmæssige bøjninger, da de regelmæssige bøjninger som regel ikke vil være

noget problem, og derfor kan være forvirrende. Hvis det skulle vise sig, at et forholdsvist kompliceret

grammatisk fænomen går igen ved flere lemmata, kan det være en fordel at oprette – og henvise til

bestemte dele af – en ordbogsgrammatik (Bergenholtz & Tarp, 1994, s. 114-115).

Page 20: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 20

Faglige markeringer til lemmata og/eller ækvivalenter angives oftest som forkortelser, og angiver korte

faglige oplysninger. Der findes to hovedtyper, som defineres som "faglige markeringer, der angiver, hvilket

fagligt tilhørsforhold et lemma/en ækvivalent har, og faglige markeringer, der angiver et sprogligt

semantisk indhold inden for et eller flere fagsprog" (Bergenholtz & Tarp, 1994, s. 226). Disse to hovedtyper

deles yderligere op. Der findes således faglige markeringer, der angiver en bestemt terms faglige eller

delfaglige tilhørsforhold. Især ved polysemi kan den faglige markering også tilkendegive egenskaber ved

den respektive ækvivalent, eventuelt med angivelse af hvilket produkt, materiale eller funktion,

egenskaben dækker. Ligeledes kan den faglige markering "give oplysninger, om det drejer sig om f.eks.

processen eller funktionen, eller om det apparat, der udfører denne proces eller funktion" (Bergenholtz &

Tarp, 1994, s. 155). Endelig kan der angives en faglig norm som en særlig type faglig forklaring, såsom "DS"

(Dansk Standard) og "ISO". Dette kræver dog, at brugeren er bekendt med normen for at kunne få det fulde

udbytte af denne, men fordelen er, at vedkommende kan være sikker på, at han har lokaliseret den rigtige

term (Bergenholtz & Tarp, 1994, s. 154-155+226).

En faglig markering kan have forskellige funktioner, og optimalt set vil den supplere den faglige

forklaring, så den faglige forklaring ikke behøver at indeholde angivelse omkring fagområde. Men den

faglige markering kan også stå i stedet for en faglig forklaring og alligevel være fuldt tilstrækkelig til brug

for visse funktioner (Bergenholtz & Tarp, 1994, s. 156).

De faglige markeringer kan være særdeles nyttige, men de skal bruges med omtanke, og man må altid

tage hensyn til ordbogens funktioner samt brugergruppe: "Er de faglige markeringer korrekt anvendt, vil

en fagmand kunne have stort udbytte af ordbogen i forbindelse med produktion på og reception af et

fremmedsprog, samt i forbindelse med oversættelse til og fra modersmålet" (Bergenholtz & Tarp, 1994,

s. 157). Det anbefales i langt de fleste tilfælde også at inkorporere faglige forklaringer, specielt ved

kulturbundne termer (jævnfør afsnittet om faglige forklaringer nedenfor) (Bergenholtz & Tarp, 1994, s.

157).

Spørgsmålet om, hvornår der skal gives faglige markeringer, er der ikke noget entydigt svar på, men det

anbefales, at man ved flerfaglige ordbøger bringer flest mulige angivelser om fagligt tilhørsforhold. I den

forbindelse, skal man være påpasselig ved udformningen af de forskellige forkortelser, der anvendes

som faglige markeringer. Disse skulle meget gerne være så sigende, at det er muligt at gætte sig til

meningen af dem og altså således, at de fordrer et minimum af opslag til forkortelseslisten i

brugervejledningen (Bergenholtz & Tarp, 1994, s. 158-159).

Til sidst er der spørgsmålet om beskrivelsessproget, som anbefales skrevet på brugerens modersmål,

men i det omfang det kan lade sig gøre, er det en god idé alligevel at anvende internationalismer – især

hvis brugergruppen kan have forskellige modersmål (Bergenholtz & Tarp, 1994, s. 160).

Placeringen af den faglige markering bør være efter eventuelle grammatiske oplysninger, men hvis

termen kan anvendes inden for flere forskellige fag med forskellige betydninger, anvendes

polysemiindeks, og i så fald kan den faglige markering stå enten før eller efter de grammatiske

oplysninger: Hvis de grammatiske oplysninger dækker både lemma samt alle delbetydningerne, placeres

disse umiddelbart efter lemmaet, og altså før den faglige markering, men hvis delbetydningerne har

forskellige grammatiske egenskaber, bør disse placeres efter den faglige markering (Bergenholtz & Tarp,

1994, s. 226-227).

Page 21: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 21

Placeringen af det vel nok mest betydningsfulde element i en bilingval produktions- og

oversættelsesordbog, ækvivalenten – samt rækkefølgen af eventuelt flere ækvivalenter – er ikke så ligetil,

som man ellers kunne foranlediges til at tro.

"Som udgangspunkt kan man sige, at i oversættelses- og produktionsordbøger bør ækvivalentfeltet

placeres forholdsvis tidligt i rækkefølgen af felter, da ækvivalenten her spiller en betydelig rolle"

(Bergenholtz & Tarp, 1994, s. 224). Således undgår man at skulle lede for længe efter ækvivalenten, når

man skal oversætte eller producere et stykke tekst og hurtigt skal have fat i oversættelsen af et bestemt

ord. Men der er også andre faktorer, der spiller ind ved placeringen af ækvivalentfeltet, såsom om der er

tale om kulturbundne eller ikke-kulturbundne fag.

Ved ikke-kulturbundne fag vil forklaringen til lemma og ækvivalent langt oftest være den samme, så her

bør ækvivalenten i en oversættelses- og/eller produktionsordbog stå før forklaringsfeltet, da

forklaringen i så fald vil dække begge termer. Ved kulturbundne fag "vil de faglige forklaringer til mange

lemmata være indholdsmæssigt forskellige fra forklaringerne til ækvivalenterne, for så vidt der

overhovedet findes ækvivalenter" (Bergenholtz & Tarp, 1994, s. 224). I dette tilfælde kan man gøre en af

to ting: Man kan enten give en samlet forklaring, der dækker både lemma og ækvivalent, eller man kan

give dem hver sin forklaring (Bergenholtz & Tarp, 1994, s. 224). Hvis man vælger at give dem hver sin

forklaring, er det vigtigt at placere lemmaets forklaring efter lemmaet og ækvivalentens forklaring efter

ækvivalenten, da der så ikke vil være tvivl om, hvilken forklaring der hører til hvad. Dog bør den faglige

forklaring komme efter eventuelle grammatiske oplysninger og udtaleangivelser (Bergenholtz & Tarp,

1994, s. 225). Det samme gør sig selvsagt gældende ved polyseme lemmata, hvor artiklen, ud over

polysemiindeks, bør struktureres på en sådan måde, at forklaringerne til de enkelte ækvivalenter

kommer umiddelbart efter disse.

I forbindelse med organiseringen af flere ækvivalenter til ét lemma, "er der flere faktorer, der skal tages

hensyn til, bl.a. antallet af ækvivalenter" (Bergenholtz & Tarp, 1994, s. 221). Både monoseme lemmata

og polyseme lemmata kan have flere ækvivalenter på det pågældende sprog. Ved monoseme lemmata

foreslår Bergenholtz & Tarp (1994), at man i de fleste tilfælde samler alle ækvivalenter i

ækvivalentfeltet, men i visse tilfælde kan man også placere blot én ækvivalent i ækvivalentfeltet og de

resterende i synonymfeltet. Der er forskellige omstændigheder, der spiller ind i forbindelse med denne

strukturering og også i forbindelse med hvilken ækvivalent, man i så fald skal placere i ækvivalentfeltet.

Ligeledes, hvis man vælger at placere flere ækvivalenter i ækvivalentfeltet henholdsvis synonymfeltet,

hvordan disse så skal organiseres. Overvejelser, som for eksempel om der i faget, der dækkes, er brug

for stilistisk variation, såsom inden for erhvervskorrespondance, eller om dette ikke kan tilrådes, såsom i

fag inden for teknik, er nogle, leksikografen bliver nødt til at gøre sig. Hvis det er et fag, hvor stilistisk

variation tilskyndes, bør alle ækvivalenter placeres i ækvivalentfeltet, mens man i fag inden for teknik

som regel skal holde samme term gennem hele teksten for at undgå forvirring, og derfor har man kun

behov for en enkelt ækvivalent. Hvad angår organiseringen af ækvivalenterne, kan man benytte en ren

alfabetisk tilgangsmåde og enten placere samtlige ækvivalenter i ækvivalentfeltet i alfabetisk

rækkefølge; eller man kan placere den første ækvivalent i den alfabetiske rækkefølge i ækvivalentfeltet

og de øvrige i synonymfeltet (også i alfabetisk rækkefølge). Denne fremgangsmåde er klart nemmest og

mindst tidskrævende for leksikografen men derimod ikke til så stor hjælp for den ufagkyndige.

Leksikografen kan også vælge at lave en frekvensanalyse på de forskellige ækvivalenter og følgende

Page 22: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 22

placere dem alle i ækvivalentfeltet herefter. Eller man kan placere den ækvivalent med den højeste

frekvens i ækvivalentfeltet og resten i synonymfeltet – enten alfabetisk eller efter frekvens. Til sidst er

der også den mulighed, at leksikografen selv tager stilling til brugen af de forskellige ækvivalenter og

efterfølgende placerer dem herefter (Bergenholtz & Tarp, 1994, s. 221-222).

Det er ikke anbefalelsesværdigt i en fagordbog at placere alle ækvivalenter til polyseme lemmata i

ækvivalentfeltet – i hvert fald ikke uden polysemiindeks samt "en eller anden form for

betydningsadskillende markering" (Bergenholtz & Tarp, 1994, s. 223). Hvis to eller flere ækvivalenter

forefindes inden for samme betydningsadskillende markering, må man gøre sig de samme tanker som

ovenfor (Bergenholtz & Tarp, 1994, s. 222-223). Dog skal man holde sig for øje, at "[u]anset hvilken

løsning man vælger, må rækkefølgen af ækvivalenter hhv. synonymfeltet klart fremgå af ordbogens

brugervejledning" (Bergenholtz & Tarp, 1994, s. 223), hvilket understreger nødvendigheden af en

udførlig brugervejledning til en hvilken som helst ordbog.

Det er blandt andet her, at der kommer til at herske lidt tvivl om rækkefølgen af felter i mikrostrukturen.

I beskrivelsen af både den faglige forklaring og af kollokationsfeltet foreslås, at de hver især placeres

umiddelbart efter det grammatiske felt til ækvivalenten. Jeg vil dog mene, at det mest naturlige vil være

først at få en forklaring på, hvad lemmaet omhandler, så man er sikker på at have fat i det rigtige lemma og

så derefter finde frem til eventuelle kollokationer.

Ved ikke-kulturbundne fag vil det være naturligt at placere den faglige forklaring efter ækvivalenten, da

forklaringen således dækker både lemma og ækvivalent, og det er hurtigere for brugeren at finde

ækvivalenten. Ved kulturbundne fag vil forklaringerne til henholdsvis lemma og ækvivalent ofte være

forskellige, hvorfor man her kan gøre en af to ting. Enten kan man lave én forklaring til lemmaet og én til

ækvivalenten, eller man kan lave en sammenfattende forklaring til både lemma og ækvivalent og indsætte

den efter ækvivalenten. Både ved kulturbundne og ikke-kulturbundne fag fungerer det bedst, hvis den

faglige forklaring står efter eventuelle grammatiske oplysninger og udtaleangivelser. Ved polysemi skal

forklaringerne selvsagt stå logisk, for eksempel med en forklaring af lemma og forklaringer ved hver af

delbetydningerne (Bergenholtz & Tarp, 1994, s. 224-225).

"Det kan […] være meget svært at give nøjagtige retningslinjer for, hvornår der er behov for faglige

forklaringer ved tekstproduktion og oversættelse, da det i høj grad vil afhænge af forudsætningerne hos

den konkrete bruger" (Bergenholtz & Tarp, 1994, s. 146). Det er derimod lettere at give retningslinjer for

mængden af faglige forklaringer, hvis ordbogen tillige intenderer funktionen reception og/eller faglig

indføring i faget. Hvis ordbogen tillige indeholder ord fælles med almensproget, må man gøre op med

sig selv, om det er relevant ligeledes at forklare disse (Bergenholtz & Tarp, 1994, s. 146-147).

Ved faglig indføring har brugeren selvsagt brug for mange flere informationer, end oversætteren og

tekstproducenten har, da man må gå ud fra, at en, der producerer fagtekster, har styr på fagområdet

men at vedkommende har brug for ordbogen som et hukommelsesstøttende værktøj. Oversætteren kan

i princippet oversætte de fleste ord udelukkende ved hjælp af en ækvivalentangivelse, men for at kunne

oversætte en samlet tekst har oversætteren ligeledes brug for i hvert fald et minimum af faglig viden

(Bergenholtz & Tarp, 1994, s. 146).

Page 23: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 23

Alle egentlige termer, som er kendetegnet ved at have deres plads i en fagsystematik (der på den ene

eller anden måde definerer fagområdets grænser), bør forklares. Dette kan enten ske i selve

ordbogsartiklen, hvor termen er lemma, eller – under brug af henvisninger fra og til de respektive

termer – i andre artikler eller såkaldte overbliksartikler. Overbliksartikler er kendetegnede ved at give en

samlet forklaring til relaterede termer. Dette kan være relevant for eksempel i forbindelse med

synonymi og antonymi, underbegreber og overbegreber samt ved ordklasseskift (Bergenholtz & Tarp,

1994, s. 147).

Der er tilfælde, hvor den faglige forklaring leder brugeren hen på det rigtige lemma eller den rigtige

ækvivalent. Dette er tilfældet ved homonymi og polysemi, hvor en faglig forklaring kan være af

altafgørende betydning med hensyn til at vælge den rigtige term (Bergenholtz & Tarp, 1994, s. 148).

Der stilles forskellige krav til den faglige forklaring, alt efter om ordbogen henvender sig til lægfolk eller

fagfolk. En fagmand vil stille krav til en præcis, videnskabelig definition og vil synes, at det meste i en

forklaring udarbejdet til lægfolk vil være overflødigt og banalt (Bergenholtz & Tarp, 1994, s. 148).

Ligeledes er der forskel på, om der er tale om kulturbundne eller ikke-kulturbundne fag, da det især ved

kulturbundne fag kan være relevant at give komparative oplysninger, da der sjældent findes

fuldækvivalens i disse fag (Bergenholtz & Tarp, 1994, s. 151).

Hvad angår stilen, skal man ikke være bange for at variere fra artikel til artikel. Der er artikler, der kan

klare sig med en kortfattet definition, nogle gange bestående af en ufuldstændig sætning uden subjekt

og finit verbum, og der er andre, der kræver længere forklaringer, hvor ufuldstændige sætninger bliver

for besværlige at arbejde med. En varieret stil højner både læseværdigheden samt det æstetiske indtryk

og er dermed at foretrække (Bergenholtz & Tarp, 1994, s. 153).

Det diskuteres kun kort og vagt hvilket sprog, man skal bruge til forklaringssproget; dog nævnes det, at

det som tommelfingerregel bør være brugerens modersmål (Bergenholtz & Tarp, 1994, s. 154).

Efter det grammatiske felt og den faglige forklaring til ækvivalenten er det praktisk at placere

ordforbindelserne, der i øvrigt bør struktureres på en sådan måde, at den ækvivalente ordforbindelse

følger umiddelbart efter ordforbindelsen på udgangssproget. Der skelnes mellem tre typer ordforbindelser:

normal ordforbindelse, som også kaldes kollokation; fast ordforbindelse, som også kaldes idiom; samt

stivnet ordforbindelse, som også kaldes ordsprog eller sentens. De enkelte ord i en stivnet ordforbindelse

kan ikke udskiftes og udgør herved en egen helhed med en bestemt betydning. De faste ordforbindelser

kan der varieres begrænset i og kun i det omfang, der er konvention omkring det. Faste ordforbindelser er

kendetegnet ved, at betydningen af ordforbindelsen ikke kan forklares ved hjælp af summen af de enkelte

ord. Normale ordforbindelser, derimod, kan netop forklares ved hjælp af summen af de enkelte ord

(Bergenholtz & Tarp, 1994, s. 118).

I fagsprog er der som regel mange flerordstermer, og man bliver da nødt til at overveje, hvorvidt disse

flerordstermer samt kollokationer skal lemmatiseres. Der findes fem metoder, hvad angår anførelse af

ordforbindelser i fagordbøger:

1) Lemmatisering af flerordstermer, mens ikke-terminoloigske ordforbindelser (kollokationer) angives

i ordbogsartiklerne.

Page 24: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 24

2) Lemmatisering af både flerordstermer og kollokationer, men ingen angivelse om ordforbindelser i

ordbogsartiklerne

3) Ingen lemmatisering af ordforbindelser, idet alle oplysninger om både flerordstermer og

kollokationer gives i ordbogsartiklerne

4) Flerordstermer og kollokationer både som lemmata og som angivelser i ordbogsartiklerne

5) Implicitte informationer om ordforbindelser i ordbogsartiklernes faglige forklaring eller i anførte

sætningseksempler

Model 1) er den mest fordelagtige for brugeren men ikke for leksikografen, da den kræver mere arbejde

end både 2) og 3) (Bergenholtz & Tarp, 1994, s. 119-121).

Der hersker stor uenighed om definitionen på en kollokation, men det kan siges, at situationen i

fagsprog er lidt anderledes end i det almene sprog. Både i almensprog og i fagsprog er det ikke bare

enhver række ord, der betragtes som kollokationer. I fagsprog kan man endvidere tage udgangspunkt i

et fagligt relevanskriterium, hvilket vil sige, at det nødvendigvis ikke er alle kollokationer i en fagtekst,

der er fagligt relevante. For det første er fællessproglige kollokationer ikke relevante i en fagordbog, og

for det andet kan der også være fagsproglige kollokationer i en fagtekst, som ikke er relevante inden for

lige netop det respektive fagområde (Bergenholtz & Tarp, 1994, s. 118+121-122).

Rent metodisk ved søgning efter kollokationer til en bilingval tovejsfagordbog, har man i praksis tre

muligheder ved anvendelse af korpora:

1) Man kan til L1-L2-ordbogen foretage en selektion af kollokationer i L1-tekster og oversætte disse til

L2, hvorefter man på lignende vis til L2-L1-ordbogen selekterer kollokationer i L2-tekster og

oversætter disse til L1.

2) Man kan nøjes med kun at selektere kollokationerne fra L1-tekster, oversætte disse til L2 og

indarbejde dem i L1-L2-ordbogen. Til L2-L1-ordbogen vendes kollokationerne, hvilket vil sige, at de

selekterede og oversatte L1-L2-kollokationer optages direkte i L2-L1-ordbogen.

3) Til sidst kan man gøre som i 2), blot starter man med at selektere kollokationer fra L2-tekster.

(Bergenholtz & Tarp, 1994, s. 122)

Model 2) og 3) har den fordel, at de er mindre arbejdskrævende end 1), da der kun skal selekteres

kollokationer én gang. Det kan synes ligegyldigt, om man selekterer på det ene eller på det andet sprog,

men nogle fags fagsprog er mere udviklet på nogle sprog end på andre, hvorfor det vil være en fordel at

selektere på disse – inden for faget – mere udviklede sprog. En anden fordel ved 2) og 3) er, at

kollokationsangivelserne bliver helt identiske i de to ordbøger, hvilket i praksis aldrig vil kunne lade sig

gøre ved brug af mulighed 1). Dog kan man risikere, at man ikke vil få hyppigt benyttede kollokationer

på L1 med, hvis man udelukkende søger i L2-tekster, selvom L1-kollokationerne sagtens kan oversættes til

L2 (Bergenholtz & Tarp, 1994, s. 122-123).

Page 25: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 25

Det står klart, at mængden af nødvendige kollokationer hænger sammen med brugerens faglighed og

fremmedsproglige indsigt samt ordbogens intenderede funktioner, jævnfør kapitel 5 Brugergrupper og 6

Ordbogsfunktioner. Den funktion, der fordrer flest kollokationer, er oversættelse og dernæst produktion

af tekster på fremmedsproget (Bergenholtz & Tarp, 1994, s. 123).

Der er oprettet fire brugertyper med forskellige fremmedsproglige og faglige kompetencer (Bergenholtz

& Tarp, 1994, s. 124):

Brugertype 1 har både lille faglig samt lille fremmedsproglig viden

Brugertype 2 har lille faglig men stor fremmedsproglig viden

Brugertype 3 har stor faglig, men lille fremmedsproglig viden

Brugertype 4 har både stor faglig og stor fremmedsproglig viden

Det er uhensigtsmæssigt at sætte især brugertype 1, men også brugertype 2 til oversættelse L1-L2, men i

så fald det hænder, har begge brugertyper brug for mange kollokationer. Brugertype 3 har ligeledes

brug for mange kollokationer. De har godt nok den faglige indsigt men mangler den fremmedsproglige

viden, hvilket til tider kan give et temmelig ubehjælpeligt sprog. Hvis brugertype 4 har kendskab til

fagsproget på fremmedsproget, har de selvsagt brug for mange færre kollokationer end de andre

brugere. Hvis ikke dette er tilfældet, har også denne gruppe brug for mange kollokationer. Ovenstående

gælder ligeledes for produktion på L2 (Bergenholtz & Tarp, 1994, s. 124-126).

Hvordan ordforbindelserne indbyrdes skal organiseres, er der mange bud på, og det nævnes, at man kan

lave en alfabetisk rækkefølge "enten efter kollokationernes første substantiv, adjektiv, verbum, ikke-

funktionsord (artikel), eller kollokationernes mest betydende ord" (Bergenholtz & Tarp, 1994, s. 218). Det

nævnes, at man kan lave en frekvensrelateret organisering af kollokationerne, men samtidig siges det,

at det i oversættelses- og produktionsordbøger (hvilket er funktionerne for COWIterm) er mest normalt

med en alfabetisk organisering (Bergenholtz & Tarp, 1994, s. 118+218). Dog vil det nok være mest

praktisk også at organisere ordforbindelserne således, at de tre typer ligeledes er delt op. Om man så vil

have de stivnede eller de normale ordforbindelser først, må man tage op til overvejelse – men det ville

nok være mest praktisk med de stivnede først, da der højst sandsynligt er færrest af dem (og flest

normale ordforbindelser), og de derfor er nemmere at overskue og skimme igennem for at komme

videre til den næste kategori.

Hvad angår eksempler, foreslår Bergenholtz & Tarp (1994), at de placeres efter kollokationerne. Hvis

eksemplerne er på begge sprog, bør oversættelsen komme lige efter eksemplet på udgangssproget, så det

følger den naturlige rækkefølge lemma-ækvivalent (Bergenholtz & Tarp, 1994, s. 221).

Ofte indeholder faglige forklaringer også eksempler, men disse giver typisk ikke "eksempler på brugen af

det søgte ord, eller … i en anden betydning end den, den faglige forklaring giver" (Bergenholtz & Tarp,

1994, s. 138).

Der skelnes mellem tre forskellige slags eksempler: Belæg, belægseksempler, og kompetenceeksempler.

Belæg er helt uændrede sætninger taget direkte fra en autentisk kilde. De kan være med eller uden

kildeangivelse alt efter ordbogens funktion. Der er den fordel ved belæg, at brugeren kan være helt

sikker på, at det er sådan, den fagsproglige virkelighed ser ud. Da det er autentisk tekst, kan der til

Page 26: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 26

gengæld være indsneget sig en fejl, eller belægget kan give udtryk for en anden sprogbrug end den

gængse (Bergenholtz & Tarp, 1994, s. 140).

Et belægseksempel er dannet ud fra belæg, dog har leksikografen udeladt fagligt og sprogligt irrelevante

dele. Fordelen ved et belægseksempel er, at brugeren ikke skal bruge tid på at gennemlæse de

unødvendige dele og derved udelukkende får relevante informationer. Ulempen er, at det kræver mere

arbejde af leksikografen (Bergenholtz & Tarp, 1994, s. 141).

Til sidst kan leksikografen selv danne eksemplerne. Fordelen ved disse kompetenceeksempler er, at de

er meget tidsbesparende for leksikografen, til gengæld hænder det også, at de let bliver stereotype og

"virker desuden sprogligt uægte, de er ikke ukorrekte, men mangler mange af de implicitte oplysninger,

som kun den autentiske sprogbrug kan give" (Bergenholtz & Tarp, 1994, s. 141). Dette gør sig særligt

gældende i forhold til ordforbindelser, grammatiske forhold samt faglige sammenhænge (Bergenholtz &

Tarp, 1994, s. 141).

I ordbøger tiltænkt som hjælp ved oversættelse bør der som minimum gives L2-eksempler ved L1-

lemmata og omvendt, og gerne både L1- og L2-eksempler, da dette vil hjælpe brugeren. (Bergenholtz &

Tarp, 1994, s. 142).

I bilingvale ordbøger med oversættelse til og tekstproduktion på ækvivalentsproget kan det ikke

anbefales at oversætte L1-eksempler direkte til L2-eksempler. Uanset om der er tale om kulturbundet

eller ikke-kulturbundet fagsprog, vil det være noget nær umuligt for selv den bedste leksikograf at

ramme den rigtige stil ved oversættelse af små deltekster, og en sådan oversættelse vil også tage

uforholdsmæssig lang tid. "I en tovejs-ordbog taler meget derfor for at anbringe Lb-eksempler i la-Lb-

delen og La-eksempler i Lb-La-delen og ikke at oversætte eksempler i nogen af delene" (Bergenholtz &

Tarp, 1994, s. 143).

Synonymer og antonymer bør angives som noget af det sidste i artiklen med synonymiangivelse før

antonymiangivelse. Samme overvejelser angående den feltinterne strukturering gør sig gældende her som

for ækvivalenter (Bergenholtz & Tarp, 1994, s. 219).

I almensproget findes der ikke to ord, der kan siges at være hinandens fulde synonym. "Der vil for to

eller flere synonymer dels være mindre stilistiske forskelle, dels grammatiske forskelle, dels forskellige

kollokative indskrænkninger" (Bergenholtz & Tarp, 1994, s. 128). Der skelnes ligeledes mellem forskellige

former for antonymi, som blandt andet kan deles op i konversion, som vi for eksempel finder i køb –

salg, komplementaritet, som i mandlig – kvindelig, samt relativ modsætning som i stor – lille. I fagsprog

vil det oftest være den relative modsætning, der forekommer, "idet forekomsten af et fænomen

udelukker et eller flere andre fænomener" (Bergenholtz & Tarp, 1994, s. 128). I fagsprog er der ikke

samme krav til variation, som der er i det almene sprog, faktisk tværtimod: Leksikalsk afveksling bør

undgås i rene fagtekster, "da tekstrecipienten ellers måtte tro, at det drejer sig om forskellige

fænomener" (Bergenholtz & Tarp, 1994, s. 128).

Synonymi- og antonymioplysninger i fagordbøger findes

1) eksplicit som en del af den faglige forklaring

2) implicit i den faglige forklaring

Page 27: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 27

3) gennem en henvisning til et andet lemma

4) gennem angivelse af et dobbeltlemma

5) som angivelse efter et synonymisymbol

6) gennem to eller flere ækvivalenter uden adskillende markeringer

Den bedste metode for angivelse af synonymer og antonymer får man ved en kombination af 3) og 5)

(Bergenholtz & Tarp, 1994, s. 129-130).

Synonymi- og – især – antonymiangivelser i en fagordbog bidrager til den generelle indsigt i faget. Dog

er det kun en hjælp ved tekstproduktion, såfremt producenten har et højt fagligt kendskab. Det er først

og fremmest relevant at anføre synonymer og antonymer til lemmaet, hvorimod det kun i få situationer

kan være fordelagtigt at anføre dem til ækvivalenten. Én situation, hvor dette kan være relevant, er, når

lemma og ækvivalent i kraft af fagsproget på de respektive sprog er næsten identiske

internationalismer, hvoraf man ikke kan læse nogen yderligere betydning, hvis ikke man er bekendt med

fagsproget.

Leksikografen kan få afløb for sine frustrationer over at sidde inde med en række forskellige

ækvivalenter ved at angive en enkelt ækvivalent og så resten, eller i hvert fald et par stykker, som

synonymer. Når der på denne måde ikke gives yderligere forklaringer af synonymerne, bør det fremgå af

brugervejledningen, at det er ækvivalenten, der skal anvendes, medmindre brugeren har så stor faglig

kundskab, at vedkommende kan identificere en mere præcis term i synonymrækken (Bergenholtz &

Tarp, 1994, s. 130-131).

Placeringen af feltet til henvisninger bør stå sidst i artiklen. "Henvisninger har til formål at føre brugeren

fra et sted i ordbogen til et andet eller henvise ham til en kilde uden for ordbogen (teknisk norm, citatkilde

osv.)" (Bergenholtz & Tarp, 1994, s. 227). I ordbøger findes der ofte krydshenvisningsartikler, hvor

henvisningen i så fald udgør størstedelen af artiklen. En sådan artikel består som oftest af et lemma, en

grammatisk angivelse og selve henvisningen. I andre artikler med henvisninger fungerer henvisningen som

et supplement til de øvrige oplysninger; hovedsageligt den faglige forklaring. Henvisningsfeltet bør altid

indeholde enten et sprogligt eller et grafisk symbol (se, se også, ->). Ved flere forskellige typer henvisninger

bør det altid være de ordlisteinterne henvisninger, der står først efterfulgt af de ordlisteeksterne

henvisninger.

Hvad angår rækkefølgen inden for den enkelte type henvisning, placeres de ordlisteinterne henvisninger i

alfabetisk rækkefølge, evt. den vigtigste først og så de andre efterfølgende i alfabetisk orden. Hvad angår

de ordlisteeksterne henvisninger, placeres de som regel i numerisk rækkefølge, eftersom de som oftest

refererer til paragraffer i for eksempel brugervejledningen, ordbogsgrammatikken eller en nummereret

kilde i bibliografien (Bergenholtz & Tarp, 1994, s. 227-228). Her kunne det så være relevant at lave en

yderligere opdeling, hvor man skelnede mellem oplysninger til stede direkte i ordbogen – men uden for

ordlisten (brugervejledning, ordbogsgrammatik) – og oplysninger, hvor man blev nødt til at skulle indhente

andet materiale (kilder i bibliografien).

Til sidst kan man til både lemma og ækvivalent, ordforbindelser samt synonymer og antonymer angive

sproglige markeringer, jævnfør Bergenholtz & Tarp (1994, s. 133). De mest relevante for fagordbøger er de

Page 28: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 28

diakrone, diatopiske samt de diafrekvente angivelser, medmindre der er tale om fagordbøger, der

intenderer også at inkludere talt fagsprog eller 'værkstedssprog', eller der er tale om fagordbøger, der

dækker et fag, der har mange overlapninger til almensproget (som eksempelvis handelskorrespondance). I

stedet for disse standardiserede markører anbefales det at indarbejde oplysninger om påfaldende

sprogbrug direkte i den faglige forklaring (Bergenholtz & Tarp, 1994, s. 135).

Tillige er det relevant at udnytte mulighederne inden for det online medium i forbindelse med

mikrostrukturen, hvilke vil blive diskuteret og belyst i underkapitel 7.3 Elektronisk virksomhedsleksikografi.

7.1.5 Makrostruktur

Traditionelt er der forskellige måder, hvorpå man kan systematisere selve ordlisterne. Dette kaldes for

makrostrukturen, og det kan foregå alfabetisk, som kan være glatalfabetisk eller i henhold til niche- eller

redeprincippet; eller systematisk, altså ved hjælp af en fagsystematik (Bergenholtz & Tarp, 1994, s. 11).

Nedenfor vil jeg kort diskutere denne traditionelle metode, hvorpå man opbygger makrostrukturen. En

diskussion af en moderne og onlinetilpasset makrostruktur følger i underkapitel 7.3.1 Elektronisk

makrostruktur.

7.1.5.1 Alfabetisk makrostruktur

Tilgangsalfabetet i en ordbog er det alfabet, der bliver brugt til at alfabetisere lemmata. Det er ofte, men

ikke altid, lig med et sprogs normale alfabet og kan derudover indeholde tal samt forskellige tegn, som det

er vigtigt at forholde sig til, hvad angår placering i forhold til hinanden og i forhold til bogstaverne i sprogets

normale alfabet (Bergenholtz & Tarp, 1994, s. 206). Igen understreges vigtigheden af en udførlig

brugervejledning: "[U]anset hvorledes rækkefølgen af bogstaver og tegn (grafemer) er i et konkret

tilgangsalfabet, bør dette altid være angivet i brugervejledningen, hvis tilgangsalfabetet ikke er identisk

med det almindelige alfabet for lemmatas sprog" (Bergenholtz & Tarp, 1994, s. 207).

Når først tilgangsalfabetet er blevet fastlagt, skal der tages stilling til, om man vil alfabetisere efter

bogstav for bogstav-metoden eller ord for ord-metoden; "[h]vis man alfabetiserer efter bogstav-for-

bogstav metoden [sic] er det kun bogstaverne henholdsvis grafemerne i grafemrækkefølgen, der har

betydning. Der tages således ingen hensyn til mellemrum i flerordslemmata" (Bergenholtz & Tarp, 1994, s.

208). Hvis man derimod vælger ord for ord-metoden, vil mellemrummet, også kaldet blanktegn, som regel

være det første tegn i tilgangsalfabetet (selvom dette måske ikke altid står i brugervejledningen – dog bør

der stå, om det er bogstav for bogstav- eller ord for ord-metoden, der anvendes) (Bergenholtz & Tarp,

1994, s. 208). Fordelen ved at anvende ord for ord-metoden frem for bogstav for bogstav-metoden er, at

"alle flerordslemmata, som begynder med samme ord, og som indgår i identiske betydningsforhold,

placeres efter hinanden, uden at denne rækkefølge brydes af et eller flere lemmata med helt andre

betydninger" (Bergenholtz & Tarp, 1994, s. 208).

Endelig kan en alfabetisk makrostruktur enten være glatalfabetisk, nichealfabetisk eller redealfabetisk,

og de vil alle her blive beskrevet kort. En glatalfabetisk ordliste er en ordliste, hvor hvert enkelt lemma har

fået tildelt sin egen artikel. Der er ikke nogen tilhørende sublemmata, det vil sige, at andre lemmata ikke er

'gemt væk' under samme artikel (Bergenholtz & Tarp, 1994, s. 209).

I en nichealfabetisk ordliste samles lemmata i nicher, hvor et enkelt lemma er nicheindgangslemma til

en række nichelemmata, som kan anføres som dellemmata, der består af et pladssymbol (som regel ~ eller

Page 29: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 29

-), som symboliserer den del af nichelemmaet, der udgøres af hele eller en del af nicheindgangslemmaet

efterfulgt af resten af grafemstrengen til nichelemmaet (Bergenholtz & Tarp, 1994, s. 209-210).

Hvis man vælger en redealfabetisk struktur er det for at "bevare sammenhængen mellem lemmata, som

indeholder samme ordstamme" (Bergenholtz & Tarp, 1994, s. 210), og med sådan en struktur er det altså

tilladt at bryde med tilgangsalfabetet. Det er dog kun tilladt for redelemmata at bryde tilgangsalfabetets

rækkefølge, ikke for redeindgangslemmata. Der gælder i øvrigt de samme betragtninger som ved

nichestrukturen ovenfor, hvad angår dellemmata (Bergenholtz & Tarp, 1994, s. 210).

Bergenholtz & Tarps (1994) argumentation for at vælge enten niche- eller redestrukturen er

pladsbesparelse. Dette er knapt så relevant, når informationerne kommer op på en skærm og ligger på en

harddisk. Desuden vil det være mere besværligt både at programmere samt at sætte pænt op blandt andet

med hensyn til søgefunktioner, hvis man skulle have fat i et niche- eller redelemma. Der vil af disse grunde i

det følgende ikke yderligere tages hensyn til hverken niche- eller redeprincippet.

7.1.5.2 Systematisk makrostruktur

Ved den alfabetiske ordning er det sproglige tegns udtryksside det centrale udgangspunkt,

hvorimod indholdssiden står i centrum ved den systematiske ordning. I sidstnævnte foreligger

en ordning efter begrebssystemer på grundlag af definitioner, der bl.a. tjener til at afgrænse

dem i forhold til i hinanden og fastslå de indbyrdes relationer. (Bergenholtz & Tarp, 1994, s.

212)

Det vil sige, at det er hierarkiske konstruktioner, der definerer over-, under- og sidebegreber, hvilket gør,

at man hurtigt kan få et overblik over de respektive termers indbyrdes forhold, og selve artiklerne uddyber

disse samt termernes definitioner. Sådanne konstruktioner kan sættes op grafisk med streger mellem over-

og underbegreber samt ved hjælp af såkaldte notationssystemer med tal og punktummer, hvor der for hver

underordning tilføjes en decimal. Der skal dog altid i en ordbog opbygget efter det systematiske princip

indeholdes et alfabetisk register, der sikrer, at man kan finde den relevante term uden at skulle bladre frem

og tilbage mellem de forskellige fagområder og hierarkiske konstruktioner (Bergenholtz & Tarp, 1994, s.

212-213); jævnfør også Madsen (1999).

Man kan kombinere alfabetisk og systematisk struktur på mange forskellige måder, blandt andet ved at

lade hovedstrukturen være systematisk, for eksempel inddelt efter temaer, men opdele lemmata inden for

de enkelte temaer alfabetisk (Bergenholtz & Tarp, 1994, s. 214). Et andet, konkret, eksempel, Bergenholtz

& Tarp (1994) nævner, er en makrostrukturelt alfabetisk ordnet fransk-dansk/engelsk-dansk/tysk-dansk

retsplejeordbog, hvor artiklerne indeholder henvisninger til over-, under- og sideordnede begreber: "Der er

således tale om en ordbog med alfabetisk makrostruktur, men hvis tilblivelse bygger på en strukturering af

begreberne i begrebssystemer" (Bergenholtz & Tarp, 1994, s. 214)

Bergenholtz & Tarp (1994) nævner, at ordbøger generelt oftest er ordnet alfabetisk – dels på grund af

det store og tidskrævende arbejde det er at lave udtømmende begrebssystemer – men at den systematiske

makrostruktur er mest udbredt inden for de naturvidenskabelige, det vil sige de ikke-kulturbundne, fag.

Page 30: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 30

7.2 Terminologi I introduktionen til teorien om terminologi kom jeg ind på, at indholdet af en term er et fagligt begreb,

som igen består af karakteristiske træk. Disse karakteristiske træk kan for eksempel være "formål, funktion,

konstruktion, bestanddele, placering og oprindelse" (Madsen, 1999, s. 17). Nogle karakteristiske træk er

adskillende, det vil sige, at de definerer indholdet i et begreb i modsætning til supplerende træk, der ikke er

afgørende for begrebet. Det er de adskillende træk, man tager med i en definition, hvorimod de

supplerende træk ikke er nødvendige for at definere begrebet, om end det i visse tilfælde kan lette

brugerens forståelse. Det er de karakteristiske træk, der anvendes ved udarbejdelse af begrebssystemer

såvel som ved definitioner (Madsen, 1999, s. 17+52). Se Madsen (1999, s. 53) for en inddeling af

hovedtyper af karakteristiske træk.

Forskellige begreber kan godt have ens udtryk. Dette eksemplificeres for eksempel ved udtrykket hane,

som har minimum tre betydninger: inden for områderne vvs, ornitologi og skydevåben. Men selvom

udtrykkene er ens, er der her stadig tale om tre forskellige termer, da der er tale om tre forskellige

begrebsindhold (Madsen, 1999, s. 17).

For at uddybe begreberne intension og ekstension kan man sige, at "intensionen udpeger en mængde af

referenter (begrebets ekstension), og ekstensionen er mængden af de entiteter, som en term refererer til"

(Madsen, 1999, s. 18).

7.2.1 Begrebssystemer

Når man skal udarbejde fagordbøger, der dækker ét eller få fag(områder), er det ideelt med en

systematisk arbejdsmetode til udarbejdelse af begrebssystemer, "hvorved relationerne mellem de

forskellige begreber bestemmes, og der skabes et grundlag for udarbejdelse af hensigtsmæssige

definitioner" (Madsen, 1999, s. 20). Der findes imidlertid forskellige relationsarter i forbindelse med

begrebssystemer. De mest almindelige er de hierarkiske relationer, som underopdeles i generiske og del-

helheds-relationer. Af de ikke-hierarkiske relationer er de temporale relationer de mest anvendte. Disse,

samt andre knapt så hyppigt forekommende relationer, vil kort blive beskrevet nedenfor.

"Der består en generisk relation mellem over- og underbegreber, hvor underbegreber er typer af et

overbegreb" (Madsen, 1999, s. 21). Det vil sige, at et underbegreb skal arve samtlige af overbegrebets træk

samt mindst ét ekstra træk, der udover at adskille det fra overbegrebet tillige adskiller det fra eventuelle

sideordnede begreber (Madsen, 1999, s. 21).

"Der består en del-helheds-relation mellem begreber, som refererer til en helhed og dens bestanddele"

(Madsen, 1999, s. 22). Underbegrebet er altså en del af overbegrebet, som dækker over helheden. Del-

helheds-relationer kan endvidere inddeles i bestanddelsrelationer, opdelingsrelationer, materialerelationer

samt mængde-element-relationer (Madsen, 1999, s. 23).

Bestanddelsrelationer er karakteriserede ved dels at der er fysisk kontakt mellem de entiteter,

begreberne refererer til, og ved dels at være "en helhed og dennes funktionelt forskellige bestanddele,

f.eks. et legeme og arme, ben, etc." (Madsen, 1999, s. 23).

En opdelingsrelation består mellem begreber, "der refererer til en helhed og de dele, der fremkommer

ved en deleoperation" (Madsen, 1999, s. 23), og som eksempel nævner Madsen (1999, s. 23) relationen

mellem skive og brød.

Page 31: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 31

Et eksempel på en materialerelation kan være den mellem bog og papir, da den repræsenterer "en

entitet og det materiale (eller de materialekomponenter), som indgår i entiteten" (Madsen, 1999, s. 23-

24). Herunder hører også relationer "mellem begreber, som refererer til en helhed og de ingredienser,

som indgår i helheden" (Madsen, 1999, s. 23).

En anden type del-helheds-relationer er mængde-element-relationerne, hvor underbegrebet, i stedet

for at referere til en egentlig bestanddel, refererer til en "entitet som indgår i eller hører til den entitet

som overbegrebet refererer til" (Madsen, 1999, s. 24). Som eksempel nævner Madsen (1999, s. 24)

blandt andre relationen mellem alfabetet og bogstaverne og mellem en forening og dens medlemmer.

Til sidst nævner Madsen (1999, s. 24) også en omslutningsrelation, der som sådan ikke er en del af del-

helheds-relationerne, men som i hvert fald er snævert forbundet hermed. Som eksempel nævner hun

en møllehat, der omgiver de forskellige elementer, men alt efter hvordan man betragter det, kan man

tale om to begreber, "nemlig møllehat i betydningen 'skal' samt i betydningen 'den enhed som består af

alle de øvrige elementer, inklusive skallen'" (Madsen, 1999, s. 24).

Temporale relationer "bruges til at karakterisere forholdet mellem begreber i en proces, et forløb e.l."

(Madsen, 1999, s. 25). Som eksempel nævnes en vaskeproces og de dertil hørende faser. Ved temporale

relationer taler man ikke om over- og underbegreber, da man ikke kan opbygge hierarkiske konstruktioner.

Man taler derfor om forudgående og efterfølgende begreber (Madsen, 1999, s. 25). For at understrege, at

det ofte er muligt at opfatte tingene på flere måder, anføres det, at de forskellige faser i en vaskeproces

også kan beskrives som en del-helheds-relation med vask som overbegreb (Madsen, 1999, s. 25).

Madsen (1999) beskriver tillige kort en del andre relationsarter, men dem vil jeg ikke komme nærmere

ind på her; de fleste relaterer sig til den temporale relation.

For yderligere omkring opbygning og inddelingskriterier af begrebssystemer, se Madsen (1999, s. 27-51).

7.2.2 Definitioner

"For terminologen er det nødvendigt at bestemme hvilke træk, der karakteriserer et begreb, således at

det kan placeres korrekt i forhold til andre begreber i et begrebssystem og dermed adskilles fra disse"

(Madsen, 1999, s. 74). Det er tillige nødvendigt at udarbejde definitioner, hvis terminologen skal kunne

vurdere, om der er tale om ækvivalens mellem begreber på forskellige sprog. Definitioner er for en bruger

af en termbase relevante i forbindelse med forståelsen af tekster, mens de for en oversætter kan være

afgørende for forståelsen og dermed korrekt oversættelse af tekster. Hvis der for eksempel kun er delvis

ækvivalens, kan oversætteren bruge definitionerne til at afgøre, om det er den rette term at benytte i den

pågældende situation (Madsen, 1999, s. 74).

Der kan være forskellige definitioner i forskellige kilder, og i den situation må terminologen i kontakt

med en eller flere fageksperter for at få afklaret tvetydigheden. Tillige er det mest hensigtsmæssigt, hvis

definitioner, der hentes fra forskellige kilder ensrettes og harmoniseres, for "[h]vis definitioner er udformet

på forskellig måde, medfører det uklarhed og dermed forvirring hos brugeren" (Madsen, 1999, s. 75).

I forbindelse med definitioner benyttes en bestemt terminologi. Det begreb, der defineres, kaldes

således definiendum, mens betydningsbeskrivelsen kaldes definiens. Definitor er betegnelsen for det tegn

Page 32: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 32

(for eksempel et kolon eller et lighedstegn) eller verbale udtryk (for eksempel "er" eller "består af"), der

står mellem definiendum og definiens (Madsen, 1999, s. 75).

7.2.2.1 Definitionsmetoder

Der findes en række forskellige definitionsmetoder, og der vil i det følgende fortrinsvist blive fokuseret

på analysemetoden, da den anføres som den mest hensigtsmæssige. Sekundært vil jeg komme ind på et

par af de andre metoder. Analysemetoden bygger på en analyse af begrebets karakteristiske træk, og til

denne metode regnes indholds-, omfangs- samt bestanddelsdefinitioner (Madsen, 1999, s. 76)

Indholdsdefinitioner kaldes også intensionelle definitioner og består ideelt set af en anførelse af det

nærmeste overbegreb og dernæst af de træk, der adskiller begrebet fra sideordnede begreber. Som det

kan udledes af dette, skal der udarbejdes et begrebssystem for at kunne danne en definition, da man ellers

ikke kan være sikker på at kende nærmeste overbegreb. I definitionen skal ikke indgå en definition af

overbegrebet. I fald man har brug for en sådan, må man finde overbegrebets ordbogsartikel for at se hvilke

træk, der er tale om. Ved begreber, der har to eller flere sideordnede overbegreber, skal de alle anføres i

starten af definitionen. (Madsen, 1999, s. 76-77+80).

Det diskuteres, hvor snævert man skal definere, idet der på denne måde kan komme flere forskellige

definitioner af samme begreb, hvis det indgår i forskellige sammenhænge. Dette kræver dog af

terminologen, at vedkommende skal sætte sig ind i eventuelle andre fagområder, som begrebet kan

relateres til, hvilket er både tidskrævende og uhensigtsmæssigt (Madsen, 1999, s. 81).

Definitioner, der udelukkende består af anførelse af overbegrebet regnes også som en

indholdsdefinition. Det er dog ikke tilstrækkeligt ved faglige begreber, da man således ikke kan skelne

det fra sideordnede begreber (Madsen, 1999, s. 81).

Indholdsdefinitioner, som anfører et overbegreb samt adskillende træk, betegnes som den eneste

rigtige definitionsmetode, da man "[k]un vha. denne metode får […] forståelse for en terms betydning,

hvilket bl.a. giver mulighed for at konstatere, om to begreber på forskellige sprog er ækvivalente"

(Madsen, 1999, s. 82)

Ved omfangsdefinitioner (som også kaldes ekstensionelle definitioner), anføres alle de underbegreber,

der refererer til begrebets ekstension. Det er altså ikke karakteristiske træk, der nævnes i denne

definitionsform men udelukkende typer af det pågældende begreb. Det gør det således svært for en

bruger, der ikke er fortrolig med faget at sætte sig ind i, hvad et bestemt begreb betyder især ved

kulturbundne fag. Ligeledes er det svært og tidskrævende for terminologen at udarbejde sådanne

definitioner, da samtlige underbegreber skal med. Hvis bare et enkelt underbegreb udelades, som brugeren

kender til, vil brugeren forvirres og undre sig over definitionen på dette (Madsen, 1999, s. 82-83). Desuden

må man formode, at ordbogens andre artikler i så tilfælde falder i troværdighed.

Ved bestanddelsdefinitioner "opregnes alle de begreber, som refererer til de bestanddele, som indgår i

den helhed, hvortil helhedsbegrebet refererer" (Madsen, 1999, s. 83). Denne definition er uhensigtsmæssig

på samme måde som omfangsdefinitionerne, da det bliver et problem for terminologen at udarbejde og for

brugeren at forstå sådanne definitioner af ukendte eller komplicerede begreber (Madsen, 1999, s. 83).

Page 33: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 33

Udover analysemetoden findes blandt andre også syntesemetoden, men der findes forskellige

definitioner på og eksempler til denne metode. Ifølge Frandsen (1982) (citeret i Madsen (1999)) er det mest

karakteristiske træk ved syntesemetoden, at der ikke anføres noget overbegreb. Derimod indledes det

"med et begreb, 'som har et vist mål af karakteristiske træk fælles med definiendum, men hvor forholdet

ikke er nærmere undersøgt'" (Madsen, 1999, s. 85) (Frandsen, 1982). Sådanne definitioner betragter

Madsen (1999) dog som efter analysemetoden, og det vil jeg også gøre. Det anbefales så vidt muligt at

indarbejde nærmeste overbegreb i starten af definitionen (Madsen, 1999, s. 85).

Den implikative metode (også kaldet kontektsmetoden) består af et stykke tekst, som kan være taget

direkte ud af den empiriske basis for den terminologiske behandling af fagområdet, og som indeholder

oplysninger af forklarende art om begrebet.

7.2.2.2 Regler for udarbejdelse af definitioner1

Først og fremmest skal definitioner være korte og enkle. Hermed forstås at de så vidt muligt ikke består

af mere end én sætning, og at de afsluttes uden punktum. Desuden anbefales det også at starte med lille

begyndelsesbogstav. Der skal tages hensyn til brugergruppen under udarbejdelse af definitionerne, hvilket i

dette tilfælde vil sige fageksperter og sprogmedarbejdere. Fageksperter har som oftest brug for færre

oplysninger end andre, og hvad angår sprogmedarbejderne, skal man passe på ikke at inkludere for

specifikke faglige oplysninger, da de så vil have svært ved at forstå definitionen. Både for fagfolk og

oversættere gælder det, at definitioner skal være klare, hvilket vil sige, at de så vidt muligt ikke bør

indeholde fagspecifikke termer, og at disse i så fald skal være defineret andetsteds i ordbogen. Alternativt

kan man give en forklaring på termen direkte i definitionen for eksempel ved hjælp af en indskudt eller

parentetisk sætning.

Inden for et overordnet emne kan visse begreber optræde i såkaldte begrænsede anvendelsesområder,

hvilket i så fald fremgå af selve definitionen.

Definitioner i samme ordbog bør være konsistente, hvilket vil sige ens i opbygning og begreberne bør

"afgrænses klart i forhold til hinanden, og de må ikke være indbyrdes modsigende" (Madsen, 1999, s. 92).

Det kan for eksempel være forvirrende, hvis to sideordnede begreber er defineret på forskellig vis såsom

ved to forskellige typer træk.

En definition må hverken være for snæver eller for bred, da den så ikke dækker den pågældende term

præcist. En for snæver definition vil på denne måde måske dække et underbegreb til den pågældende term

(selvom man ikke har intentioner om at indlemme et sådant underbegreb), og på samme måde kan en for

bred term dække flere vidt forskellige både over- og sideordnede begreber. Ligeledes skal man passe på

ikke at lave cirkeldefinitioner, hvilke kan forekomme både mellem to definitioner men også inden for

samme definition. Ifølge Madsen (1999) er der en cirkeldefinition, når der i en definition "defineres et

begreb direkte eller indirekte ved begrebet selv" (s. 93).

Det siger sig selv, at definitioner skal være præcise, hvilket vil sige, at de ikke bør indeholde vage eller

vurderende sammenlignende oplysninger, og man bør undgå at beskrive, hvad et begreb ikke er.

1 Dette punkt er udarbejdet på grundlag af Madsen (1999, s. 88-95).

Page 34: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 34

Alle disse anbefalinger overholdes nemmest ved at gå frem efter indholdsdefinitionsmetoden, der, som

tidligere nævnt, er den mest anvendelige for både bruger og terminolog.

7.2.3 Dannelse af og krav til fagudtryk

Madsen (1999) gennemgår, "hvorledes termer dannes, og hvilke krav man må stille ved termdannelse og

termudvælgelse" (s. 97), og dette vil jeg se nærmere på nedenfor.

Det hænder, om end sjældent, at terminologen skal være med til at danne helt nye fagudtryk. Som

oftest skal vedkommende i stedet overveje hvilket synonymt udtryk, der er relevant i den pågældende

forbindelse. Terminologiarbejde kan være enten deskriptivt eller normativt, hvilket vil sige, at terminologen

ved uoverensstemmelse mellem definitioner af et bestemt begreb kan vælge enten at beskrive forskellene,

eller vedkommende kan beslutte sig for en bestemt opfattelse, der følgende vil ligge til grund for det videre

arbejde med artiklerne. Den normative metode anvendes, når for eksempel Dansk Standard skal

standardisere terminologi, hvor der normalt kun vil være angivet ét udtryk, højst med ét synonym, samt en

opremsning af de frarådede udtryk. Fordelen ved standardiseret faglig terminologi er, at det letter

kommunikationen, og da der ikke er de samme krav til variation som til almensproget, skal man ikke tage

hensyn til dette (Madsen, 1999, s. 97-98).

7.2.3.1 Krav til fagudtryk

Et fagudtryk skal være selvforklarende, systemrigtigt (dvs. i overensstemmelse med det

begrebssystem, hvori det hører hjemme), endvidere kort, præcist, gængs,

afledningsproduktivt og i overensstemmelse med det pågældende sprogs grammatiske og

ortografiske regler. Fagudtrykket må ikke være pleonastisk (PIN-nummer, nyrenoveret), ikke

flertydigt (dvs. ikke være et homonym eller polysem), helst ikke have synonymer, og det skal

vælges således, at der tages hensyn til international ensartethed. (Madsen, 1999, s. 110)

At overholde disse retningslinjer på én gang er noget nær umuligt, og derfor er det ofte nødvendigt med

en prioritering af hvilke krav, der går forud for andre.

Et selvforklarende udtryk skal så vidt muligt ved hjælp af de enkelte elementer, som udtrykket består

af, afspejle begrebets kendetegnende, karakteristiske træk. Ligeledes bør der så vidt muligt være

overensstemmelse mellem definitionen og de træk, der fremgår af udtrykkets enkelte elementer. Det

anbefales ofte at anvende såkaldte iboende træk ved udarbejdelse af fagudtryk, men Madsen (1999, s. 111)

pointerer, at det ofte er bedre at anvende træk såsom formål og funktion i stedet.

Fagudtryk skal så vidt muligt afspejle begrebernes generiske begrebsrelationer og således være

systemrigtige, hvilket vil sige, at det semantisk overordnede element så vidt muligt skal svare til

overbegrebet. Dette har dog i praksis ofte kun relevans for generiske relationer (Madsen, 1999, s. 111).

Fagudtryk skal være så korte som muligt uden dog derved at skære noget af udtrykkets væsentligste

træk væk. Dette vil også sige, at et udtryk skal være så præcist, at det indeholder samtlige de træk, der

adskiller begrebet fra andre begreber (Madsen, 1999, s. 113).

"Kravet om at bevare gængse fagudtryk konkurrerer […] med kravet om gennemskuelighed" (Madsen,

1999, s. 114) (min fremhævning), da det hænder, at udviklingen gør visse udtryk forældede; som eksempel

nævnes blyant. Problemet er, at hvis udtrykket er så indprentet i sprogbrugen hos folk, som for eksempel

Page 35: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 35

blyant, kan det være overordentligt svært og uhensigtsmæssigt at prøve at ændre det (Madsen, 1999, s.

114).

Fagudtryk skal være i overensstemmelse med de til enhver tid gældende regler for ortografi og

grammatik på det pågældende sprog. Som eksempel nævnes en term, som oftest findes som enten aktivt

slam anlæg eller aktivt slamanlæg. Selvom den sidste skrivemåde er i overensstemmelse med

retningsskrivningsreglen om, at "[h]vis en ordforbindelse udtales med hovedtryk (stærkt tryk) på det første

led og bitryk (svagere tryk) på det andet, skrives forbindelsen i ét ord" (Sprognævn & Litteraturselskab,

2007), er begge skrivemåder stadig forkerte, da det ikke, som man ellers kunne foranlediges til at tro ud fra

den sidste skrivemåde, er anlægget, men slammet, der er aktivt. Derfor foreslås det at anvende aktivt slam-

anlæg (med bindestreg) i stedet, da bindestregen viser, at det er slammet og ikke anlægget, der er aktivt

(Madsen, 1999, s. 116).

Det anbefales så vidt muligt at anvende nationale fagudtryk frem for fremmedsproglige, selvom dette

kan stride mod, at fagudtryk skal være gængse. Det hører dog heller ikke til sjældenhederne, at dette krav

tilsidesættes, jævnfør fagområderne elektronik og computere (Madsen, 1999, s. 116).

Ligeledes skal et fagudtryk helst være afledningsproduktivt, da det således kan indsættes i flere

sammenhænge. Således er fx natursprog mere afledningsproduktivt end naturligt sprog. Fagudtryk følger

generelt almenudtryks bøjningsregler, men der er i fagsproget visse undtagelser, især hvad angår udtryk,

som også indgår i almensproget såsom svejst og skruetrækkerindsatse. Ligeledes adskiller homografer sig

ofte fra hinanden ved at skifte køn (Madsen, 1999, s. 116).

Ligesom Bergenholtz & Tarp (1994) anbefaler Madsen også brugen af internationalismer dog med den

problemstilling, at det strider imod kravet om at anvende nationale udtryk (1999, s. 117).

Ét begreb bør kun have ét udtryk med én betydning, hvilket kaldes enentydighed. Dette er vanskeligt at

efterleve, og eventuelle synonymer bør medtages i termbasen/ordbogen med anførelse af hvilket udtryk,

der anbefales samt anførelse af frarådede udtryk. Der gælder således også, at homonymi og polysemi bør

undgås (Madsen, 1999, s. 117).

Page 36: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 36

7.3 Elektronisk virksomhedsleksikografi Størstedelen af leksikografisk teori udformet til papirordbøger er stadig yderst relevant, selvom der er

tale om et medieskift fra papir til et elektronisk onlinemedium. Men som det vil blive tydeliggjort af det

følgende, tilbyder det nye medium betydelige forbedringer og nye muligheder, hvad angår

brugermedbestemmelse i forbindelse med organisering og opbygning af mikrostrukturen samt mulige

brugertilgange til makrostrukturen.

7.3.1 Elektronisk makrostruktur

[I]t is questionable whether we can talk about a macrostructure in the traditional sense, as

the TeleLex database [...] makes it almost irrelevant to talk about the physical location and

arrangement of data in a constantly changing and highly dynamic lemma list. (Simonsen,

2002, s. 226)

TeleLex, som Simonsen her refererer til, er en onlineordbog, der blev udviklet til TDC i forbindelse med

et erhvervsforskerprojekt, jævnfør Simonsen (2002).

Dette citat anskueliggør, hvordan der i moderne elektronisk og online leksikografi ikke er tale om

makrostruktur i betydningen, hvordan data er opstillet og sorteret, men at det, som Burke (1998)

diskuterer, snarere drejer sig om søgemuligheder.

Som både Simonsen (2002) og Burke (1998) diskuterer og viser, kan brugeren af en onlineordbog, alt

efter hvordan programmeringen er udført (hvilket er uden for dette speciales område), arrangere og

skræddersy søgemetoden nøjagtigt som vedkommende ønsker det. Til TeleLex er for eksempel udviklet en

søgemetode, hvor brugerne kan kombinere den alfabetiske søgemetode med søgning efter fag, jævnfør

Simonsen (2002).

Burke (1998) fortsætter med at udforske de forskellige muligheder og lister en lang række muligheder,

som han har fundet frem til, at leksikografer og forlag i forening har vurderet, at der var brugere til. Han

konkluderer i den forbindelse, at det i onlineordbøger burde gøres muligt at søge på blandt andet

ordformer og -klasser, en bestemt endelse, dialekter, sprogbrug (juridisk, teknisk, økonomisk, forskellige

former for jargon og slang med mere), antal stavelser samt om et ord indeholder et eller flere bestemt(e)

bogstav(er). Samtidig siger han dog, at det skal vurderes ved hver enkelt ordbog hvilke søgemuligheder, der

er relevante: "It has to be decided on a lexicon-by-lexicon basis what aspects of the content of entries is

worth encoding so as to be searchable" (Burke, 1998). De valg, man foretager, skal således understøtte

ordbogens funktioner i prioriteret rækkefølge.

Burke (1998) argumenterer tillige for en søgemetode, der dels henviser brugeren til lemmata, der ligner

det søgte, i tilfælde hvor søgningen giver nul resultater, samt på lignende vis henviser brugeren til det

ubøjede lemma, der er forklaret i ordbogen, i tilfælde hvor vedkommende har slået en bøjet form op. Dette

er specielt relevant i bilingvale ordbøger, da ikke-indfødte brugere af det pågældende sprog ofte har

ringere kendskab til sproglige og metasproglige regler på sproget end indfødte (Burke, 1998). Dette gælder

særligt fagsprog, da almensproglige ord ofte, som allerede nævnt under punkt 7.2.3.1 om krav til fagudtryk,

optages i fagsproglige sammenhæng med ændrede bøjningsformer eller kønsskifte.

Page 37: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 37

Se i øvrigt diskussionen omhandlende stemming i Burke (1998), hvor den betydning, der vedrører

elektroniske ordbøger, anvendes her, og ikke den, der vedrører computational morphology.

Simonsen (2007) diskuterer og anvender to modeller, som han kalder for leksikografisk

konvergensmodel (første gang anvendt i Simonsen (2002), men nu væsentligt videreudviklet og forbedret)

henholdsvis leksikografisk dokumentskabelon og anskueliggør således, hvordan det er muligt at

implementere dels data fra internettet såvel som fra intranettet og dels dokumentskabeloner og

trækstrukturer for forskellige tekstgenrer i forbindelse med søgning.

Den leksikografiske konvergensmodel gør det muligt direkte fra ordbogen at søge efter data 1) på

internettet, fra for eksempel Google; 2) på virksomhedens intranet; 3) i nationale korpora (fra begge

sprogområder, hvis det drejer sig om en bilingval ordbog); 4) i virksomhedens korpora. Den leksikografiske

dokumentskabelon gør det muligt for brugeren ved angivelse af tekstgenre i forbindelse med søgningen at

få information om den pågældende tekstgenres 1) kommunikative formål; 2) trækstrukturer; 3) retoriske

strategier (Simonsen, 2007).

7.3.2 Elektronisk mikrostruktur

Som Burke (1998) diskuterer, og Simonsen (2002) anskueliggør, er det i elektroniske onlineordbøger

muligt at tilføje mange flere data til ordbogsartiklerne – både hvad angår tekst, lyd og billeder.

Brugeren af TeleLex, jævnfør Simonsen (2002), bliver præsenteret for en mikrostruktur delt op i

moduler, alt efter om vedkommende skal producere, oversætte eller læse/forstå tekster (analogt med

ordbogsfunktionen reception af tekster, jævnfør Bergenholtz & Tarp (1994)).

Burke (1998) argumenterer for, at forkortelser skal skrives ud, og at der skal meget mere forklarende

metasprog ind i artiklerne. Dette vil jeg dog mene kun har relevans for folk, der er uøvede ud i at slå op i

ordbøger og som en konsekvens heraf, kunne man, som mediet muliggør, og som Burke (1998) også viser,

gøre dette valgfrit.

Ligeledes foreslås det, at der for utrænede sprogbrugere som minimum listes de mest brugte

bøjningsformer af de mest besværlige ord. Hvor meget, der skal vises til hvilken type ord, kan på linje med

ovenstående være op til den enkelte bruger, ligesom det kan være relevant at opstille flere eksempler samt

længere og mere beskrivende definitioner til rådighed for de brugere, der måtte ønske dette. Dette er især

anvendeligt i bilingvale ordbøger, da personer med anden kulturbaggrund herved lettere vil kunne forstå

den anden kultur, og der vil for eksempel kunne gives små anbefalinger til hvad der er og ikke er gode

samtaleemner i den pågældende kultur (Burke, 1998). Ovenstående kan sammenfattes i følgende citat:

"However, in online lexicons, brevity is no longer as crucial, leaving completeness the prime virtue in

definitions" (Burke, 1998).

Multimedia af enhver art er en oplagt mulighed i elektroniske onlineordbøger. Således diskuterer Burke

(1998) anvendeligheden af, at anvende lydklip, ikke bare i forbindelse med udtalen af ordet, men også til

for eksempel at tydeliggøre over for brugeren, hvordan et dyr siger, foruden de oplagte muligheder som at

anvende billeder til at vise hvordan en bestemt ting ser ud (Burke (1998) udleder af Svensén (1993), at

"color illustrations and color photos are indispensible for conveying the meaning of color words, and in

differentiating some kinds of plants and animals"). I specialiserede biltekniske ordbøger kunne man

Page 38: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 38

forestille sig, at det ville være relevant med endog op til flere lydklip af en bestemt type motor, hvilket ville

give en ekstra dimension i forhold til interesserede og studerende inden for faget.

Ved polysemi og homonymi argumenterer Burke (1998) for en søgefunktion, der gør det muligt at liste

betydningerne i forskelligt prioriterede rækkefølger. Det være sig for eksempel det 'vigtigste' begreb først

(eller sidst) eller det ældste udtryk først (eller sidst). Ligeledes kunne man forestille sig, at det kunne være

muligt at prioritere efter ordklasse, abstraktionsniveau (for eksempel tog i betydningen et transportmiddel

der kører på skinner, over for tog som værende præteritum af tage – dette konkrete eksempel indebærer,

at bøjede former også medtages i ordbogen); om det tilhører plante-, dyre- eller mineralriget; om det

forekommer naturligt eller om det er menneskeskabt og så videre.

Ved at programmere ordbogens søgefunktion til at kunne skræddersys på mange forskellige måder, kan

ordbogen tjene forskellige funktioner og hermed forskellige brugerbehov, jævnfør kapitel 5 Brugergrupper

og 6 Ordbogsfunktioner; (Burke, 1998).

Som det her er blevet tydeliggjort, er der utallige muligheder for at skræddersy indstillingerne for

datapræsentation og datasøgningsmuligheder, men man skal også passe på, at man ikke stiller brugeren

over for for mange valg, så det bliver rodet og uoverskueligt.

Page 39: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 39

8 Diskussion I dette kapitel vil jeg sammenholde ovenstående teori med de datapræsentationsmetoder og –

søgemuligheder, der er relevante for COWIterms intenderede brugere og funktioner som diskuteret i

kapitel 5 Brugergrupper og 6 Ordbogsfunktioner ovenfor.

8.1 Lemma- og ækvivalentselektion Som diskuteret under punkt 7.1.2 Lemmaselektion kan ordbøger inden for ikke-kulturbundne fag

sagtens vendes, og jeg vil argumentere for, at dette også er muligt med ordbøger bestående af delvist

kulturbundne fag, hvis blot man er opmærksom på at læse den vendte ordbog igennem med henblik på at

tilrette den til denne brug.

Under punkt 7.1.2 ovenfor er tillige defineret i grove træk, hvordan lemmata normalt er selekteret, og

det må i COWIterm betegnes at være model 2), der er gået ud fra. Der er således selekteret både rene

termer men også andre udtryk, som ikke er fællessproglige. I tillæg til dette er der også, som angivet i

underkapitel 4.2 om metoden for COWIterm, selekteret fællesord, som kan antages at være besværlige at

oversætte. Dette anskueliggøres af Figur 4, som repræsenterer et lille udsnit af det færdige arbejde. Her er

det tydeligt, at der er selekteret termer ikke kun fra tekniske fag, men også termer omhandlende

virksomhedstyper (a.m.b.a), aktiehandel (A-aktie, A-aktionær), økonomiske termer (acontofakturering),

samt figurative og fællessproglige udtryk (adelsmærke, abonnement).

I COWIterm er der ikke skelnet stort mellem de forskellige ordtyper beskrevet under punkt 7.1.1

ovenfor, og det vil jeg heller ikke gøre i mit forsøg på at forbedre den. Jeg vil gå frem efter ord for ord-

metoden som anbefalet af Bergenholtz & Tarp (1994). Dette vil gøre det nemmere for ordbogsbrugeren at

finde det relevante lemma, dels fordi øjet – når det støder på lemmata med blanktegn – ikke hele tiden skal

springe frem og tilbage for at sammenholde bogstavet efter blanktegnet med rækkefølgen af grafemer i det

efterfølgende lemma; og dels fordi man kan komme ud i situationer, hvor det relevante lemma ikke findes i

ordbogen. Her kan en oversættelse muligvis stykkes sammen af relaterede lemmata samt ækvivalenter,

som er placeret omkring den placering, hvor det relevante lemma skulle have været placeret efter ord for

ord-metoden.

Jeg vil gå frem efter model 1) hvad angår selektering af flerordstermer og ordforbindelser, som

beskrevet under punkt 7.1.4 Mikrostruktur (under ordforbindelser). Dette vil sige, at flerordstermer bliver

lemmatiseret på lige fod med enkeltordstermer, men ikke med kollokationer og andre ordforbindelser;

disse vil blive angivet under de relevante ordbogsartikler. Bergenholtz & Tarp (1994, s. 121) angiver dette

som den model, der har flest fordele for brugeren, men som også udgør et mere besværligt arbejde end

model 2) og 3). Dette er jeg dog ikke ubetinget enig i; godt nok skal man ved model 2) kun tænke på

kollokationer og ikke andre ordforbindelser, men i model 3) skal alle flerordstermer og kollokationer samt

andre ordforbindelser inkorporeres under de respektive artikler, og der er hermed et stort arbejde i at

identificere hvilke flerordstermer og ordforbindelser, der skal ind under hvilke indgangslemmata. Dette

betyder i forhold til Figur 4, at adgang til et nyt marked ikke skal have sin egen artikel, da det må betegnes

som en kollokation og ikke en flerordsterm, og derfor bør indlemmes under et andet indgangslemma; i

dette tilfælde enten adgang eller marked, eller alternativt under begge med en henvisning til den ene af

dem, hvor den fulde beskrivelse anføres.

Page 40: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 40

Som beskrevet i underkapitel 4.2 om metoden for COWIterm bliver alle termer selekteret fra to korpora

på henholdsvis dansk og engelsk, som består af repræsentative artikler og tekster, som brugergrupperne

forventes at skulle beskæftige sig med. Disse korpora udgør den optimale basis for selektering af termer,

jævnfør underkapitel 7.1 Fagleksikografi. Dog er halvdelen af teksterne oversatte, jævnfør underkapitel 4.2,

primært fra dansk til engelsk, hvilket har den svaghed, at det ikke er fuldstændig autentisk sprog.

Da COWIterm er en elektronisk baseret intranetordbog, kan søgefunktionen, som vist af både Burke

(1998) og Simonsen (2002), programmeres således, at der ved søgning på en term (grafemstreng)

fremkommer samtlige lemmata, der indeholder denne grafemstreng og altså ikke kun eksakte resultater,

men også flerordslemmata og sammensætninger, der indeholder denne grafemstreng. En udvidelse til

dette ville være, at alle ord i en artikel gøres søgbare, og søgeresultaterne kunne således opstilles efter

relevans.

Dette har dog den svaghed, at der ved en grafemstreng med høj frekvens i ordbogsartiklerne vil

fremkomme uoverskueligt mange søgeresultater, som det vil være besværligt og tidskrævende for

brugeren at gennemgå. Dette kunne på lige fod med det ovenfor i praksis viste samt det nedenfor

diskuterede også gøres valgfrit for brugeren – eventuelt ved hver søgning eller som en generel indstilling,

der bliver gemt sammen med resten af brugerens søgeprofil, jævnfør underkapitel 7.3 Elektronisk

virksomhedsleksikografi, 8.2 Diskussion af makrostruktur og 8.3 Diskussion af mikrostruktur.

Figur 4 COWIterm som det endelige arbejde så ud. Det er her tydeligt at se, at der er selekteret såvel fagsproglige som almensproglige ord.

Page 41: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 41

Det vil være relevant at berøre emnet omkring kulturbundne kontra ikke-kulturbundne fag, da det er

nævnt flere steder ovenfor. Det er i COWIterm nødvendigt at medtage termer fra begge fagtyper (jævnfør

Figur 4), da COWI spænder over mange vidt forskellige fag, og da det vil være nødvendigt at producere for

eksempel årsregnskaber på engelsk. Ifølge Bergenholtz & Tarp (1994) bevirker dette, at det ved nogle

termer vil være nødvendigt at lave længere kontrasterende faglige forklaringer, da der i kulturbundne fag

ikke altid kan forventes fuld ækvivalens, og dermed må forskellen forklares, jævnfør punkt 7.1.4

Mikrostruktur (under faglige forklaringer).

8.2 Diskussion af makrostruktur Den traditionelle diskussion, der omhandler alfabetisk kontra systematisk makrostruktur, jævnfør punkt

7.1.5 ovenfor, er ikke så relevant, når det drejer sig om elektronisk baserede intranetordbøger som

COWIterm. Ved enkeltfagsordbøger eller ordbøger med få fag kan det dog være meget relevant med en

systematisk arbejdsproces. Derved får man gjort sig klart, hvordan de enkelte begreber relaterer sig til

hinanden, hvilket igen letter arbejdet med udformningen af definitioner, jævnfør punkt 7.1.5.2 Systematisk

makrostruktur, 7.2.1 Begrebssystemer samt 7.2.2 Definitioner ovenfor. COWIterm indeholder dog så

mange forskellige fag, at det vil være et uoverkommeligt arbejde at udforme begrebssystemer til samtlige

af disse.

Dette ligger også til grund for, at udarbejdelsen af definitioner ikke kan blive efter Madsens (1999)

principper. Madsen (1999) og Bergenholtz & Tarp (1994) er uenige om, hvorledes definitioner (Bergenholtz

& Tarp (1994) kalder dem for faglige forklaringer) skal udformes. Førstnævnte mener, at der skal være

stringente retningslinjer for indholdet og opbygningen af definitioner, da de definerede begreber på denne

måde lettere kan skelnes fra side-, over- og underordnede begreber, hvorimod sidstnævnte mener, at en

sådan fremgangsmåde leverer et kedeligt resultat, og at der godt må være variation i de forskellige

definitioner, da dette letter blandt andet læsbarheden, jævnfør punkt 7.2.2 Definitioner og 7.1.4

Mikrostruktur.

Samme problemstilling stod også Simonsen (2002) over for ved udarbejdelsen af TeleLex, og her blev i

stedet udarbejdet en intern fagklassifikation, der definerede inden for hvilke af TDC's fagområder, der

skulle medtages termer. COWI angiver selv inde på deres hjemmeside, jævnfør COWI A/S, at de rådgiver

inden for områderne natur, samfund, transport, bygninger, industri samt forsyning. Det er selvfølgelig nogle

meget brede hovedområder, og det ville derfor være nødvendigt at lave interne fagklassifikationer inden

for hvert enkelt område samt inden for økonomi og regnskab og til dels inden for jura, da den sekundære

brugergruppe, som består af oversættere og andre sprogmedarbejdere, jævnfør kapitel 5 Brugergrupper

ovenfor, må forventes at skulle producere og oversætte blandt andet årsregnskaber, kontrakter og andre

økonomiske samt juridisk bindende dokumenter på og til engelsk.

I COWIterm kunne man forestille sig, at brugerne ville have glæde af en søgemetode som den, der er

udviklet i Simonsen (2002), så der kunne søges både alfabetisk og/eller inden for fagområde, eventuelt

inden for flere tilgrænsende fagområder på én gang, jævnfør punkt 7.3.1 Elektronisk makrostruktur.

Ligeledes kunne det være relevant at implementere den leksikografiske dokumentskabelon, jævnfør

punkt 7.3.1 Elektronisk makrostruktur, da brugerne således vil kunne udforme tekster, der overholder

retningslinjerne for de respektive tekstgenrer.

Page 42: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 42

En model af startsiden med de ovenfor diskuterede emner er vist i Figur 5. Her er der også reserveret

plads ude i siden til en brugervejledning til startsiden og de muligheder, som brugeren har. Brugeren kan

vælge fag og tekstgenre ved hjælp af drop down-bokse eller alternativt ved at vælge flere forskellige fag og

genrer i en liste.

I elektronisk baserede intranetordbøger som COWIterm kunne det være relevant at implementere en

søgemetode, der dels lister de forskellige lemmata i henhold til relevans i forhold til den søgte

grafemstreng, hvilket også indebærer en angivelse af de mest relevante lemmata, hvis der ingen resultater

er for den søgte grafemstreng, for eksempel på grund af uoverensstemmelser mellem brugerens søgning

og indhold i COWIterm; dels lister den ubøjede form, hvis der søges på en bøjet eller uregelmæssig form.

Figur 5 Model af COWIterms foreslåede startside

8.3 Diskussion af mikrostruktur Som vist ovenfor i punkt 7.1.4 omhandlende den traditionelle mikrostruktur anbefaler Bergenholtz &

Tarp (1994) en bestemt rækkefølge i forbindelse med opbyggelsen af mikrostruktur til oversættelses- og

produktionsformål. Som Burke (1998) diskuterer og Simonsen (2002) anskueliggør (jævnfør punkt 7.3.2),

kan mikrostrukturen i elektronisk baserede intranetordbøger som COWIterm skræddersys af brugeren, så

vedkommende selv kan bestemme hvilke informationer, der bliver vist og i hvilken rækkefølge, de bliver

vist.

Ligeledes diskuteret ovenfor, jævnfør punkt 7.3.2 Elektronisk mikrostruktur, kan billeder bidrage enormt

til forståelse af definitionen af en fysisk genstand, men det er ikke alt, der umiddelbart kan anskueliggøres

Page 43: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 43

ved billeder. Tilføjelsen af videoklip (eller alternativt GIF-animationer) er endnu en mulighed for at forbedre

forståelsen for brugeren. Dette element er især relevant ved beskrivelsen af processer, handlinger,

arbejdsfunktioner og lignende.

Selvom brugeren i TeleLex, jævnfør punkt 7.3.2 Elektronisk mikrostruktur, har mulighed for at vælge

moduler af mikrostrukturen, bliver dataene internt i modulerne stadig præsenteret efter en nøje fastlagt

mikrostruktur. Man kan forestille sig muligheden for at lade brugeren selv organisere, i hvilken rækkefølge

data bliver præsenteret, da mediet muliggør dette. Jeg vil dog argumentere for, at det er de færreste

tilfælde, hvor dette vil være nødvendigt og relevant; derfor er en nøje fastlagt mikrostruktur stadig yderst

relevant, selvom brugeren har mulighed for at udtage dele af den.

Figur 6 viser, hvordan COWIterm ser ud ved søgning på afdække. Som det kan ses, er der fire danske

lemmata med blandet synonymi- og homonymiindeks samt tilsvarende fire engelske ækvivalenter. Det var

et ønske fra COWI, at der kun skulle være én dansk term og én engelsk term i hver artikel, og at kun de

danske termer skulle være nummererede ved flere forekomster, da det er den dansk-engelske ordliste, der

er den principale og den engelsk-danske, der er den subsidiære ordliste, jævnfør Bergenholtz & Tarp (1994,

s. 190-193). Hertil er et enkelt kommentarfelt, der i dette tilfælde er blevet brugt til at angive synonymer til

den danske term til hjælp ved produktion på og oversættelse til engelsk, da brugeren ikke ud fra de danske

lemmata kan læse, om det for eksempel betyder tildække, undersøge eller afsløre samt hvilken ækvivalent,

der i så fald skal anvendes ved de respektive betydninger.

Figur 6 COWIterm som den ser ud, når der søges på afdække.

Page 44: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 44

At der er tale om synonymer til den danske term anskueliggøres af forkortelsen "dk.", der angiver, at det

følgende refererer til den danske term, samt "=", der angiver synonymi, jævnfør punkt 7.1.4 Mikrostruktur

(under synonymer og antonymer), hvor det er metode nummer 5), der er anvendt, og ifølge Bergenholtz &

Tarp (1994) er den optimale opstilling af synonymer og antonymer en kombination af 3), hvilket er en

henvisning til et andet lemma, og 5), hvilket i dette tilfælde er let at implementere, idet man sørger for at

lemmatisere de relevante og ikke allerede lemmatiserede termer.

Ligeledes kan man i Figur 6 se den leksikografiske konvergensmodel, jævnfør punkt 7.3.1 Elektronisk

makrostruktur, i anvendelse. Som det tydeligt ses, er COWIterm dog ikke fuldt optimeret til brug med

denne, da brugeren næppe vil have nytte af at kunne søge på afdække 4 direkte på Google eller nogle af de

andre steder, og brugeren bliver hermed nødt til selv at korrigere for dette, når det nye vindue med for

eksempel Googles søgeside åbnes. Det er således upraktisk, at der udelukkende kan søges på den sidste

forekomst af lemma henholdsvis ækvivalent de respektive steder, og det er et yderligere problem, at

nummereringen indgår i selve lemmaet.

Dette problem kunne løses ved at inkorporere en resultatside, hvorved brugeren efter at have udfyldt

søgeruden og klikket "Søg" får en resultatside frem på skærmen, som det også er tilfældet i TeleLex,

jævnfør Simonsen (2002). Men i stedet for blot at få en resultatside frem med klikbare lemmata (som

følgende åbner ordbogsartiklen på hele siden, således at man bliver nødt til at klikke "Tilbage" for at

komme tilbage til resultatlisten, hvis det alligevel ikke var det lemma, man søgte), kunne man have

resultatlisten på for eksempel den øverste tredjedel af siden, med mulighed for at scrolle ned i listen, hvis

der er for mange resultater til, at de alle kan vises. Man kan så markere et lemma, hvis fulde artikel

efterfølgende bliver vist på den nederste del af siden – ligeledes med mulighed for at scrolle, hvis der er for

Figur 7 Model af muligheden for både at vise resultatliste samt ordbogsartikel for det i resultatlisten markerede lemma.

Page 45: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 45

mange informationer til, at de alle umiddelbart kan vises. Der er reserveret plads til eventuelle multimedia

ude i siden af skærmbilledet. En model heraf er vist i Figur 7, hvor den leksikografiske konvergensmodel

samt den leksikografiske dokumentskabelon er inkorporerede i selve ordbogsartiklen. Når der klikkes på

enten den danske eller den engelske tekstgenre, vises et nyt vindue med kommunikative formål,

trækstrukturer samt typisk anvendte retoriske strategier for tekstgenren, jævnfør Simonsen (2007).

Om den engelske version af den leksikografiske dokumentskabelon udelukkende skal være en oversat

kopi af den danske, altså med de kommunikative formål, trækstrukturer og retoriske strategier, der er

relevante i danske sammenhænge og til danske målgrupper, eller om den skal afspejle konventionen inden

for et engelsktalende sprogområde kan diskuteres; alternativt kan der udvikles flere forskellige

dokumentskabeloner alt efter geografisk anvendelsesområde og målgruppe. Man kunne også forestille sig,

at man udviklede engelsksprogede dokumentskabeloner til ikke-engelsktalende sprogområder som en

måde at lette kommunikationen mellem parterne. Dette kunne specielt være relevant i COWIs tilfælde i

kraft af virksomhedens globale virkeområde. Hvad angår multimedia ude i siden skal der selvfølgelig kun

være angivelse af de forskellige typer, i det omfang den enkelte multimedietype er repræsenteret ved det

pågældende lemma.

Ved anvendelse af modellen i Figur 7 kan synonymer og antonymer, der er lemmatiserede, gøres synligt

klikbare ved farveskift, understregning eller andet. Det samme gør sig gældende for henvisninger.

Figur 7 er en maksimerende model, dels hvad angår forbedringen af COWIterm; og dels hvad angår data

præsenteret i ordbogsartiklen, hvilket vil sige, at det her er den maksimale grad af information, brugerne af

COWIterm kan få om lemmaet præsenteret på begge sprog.

Ved polyseme og homonyme lemmata kunne man angive nummerering før lemmaet i resultatlisten

tillige med en kort forklaring eller et synonym efter lemma, grammatiske oplysninger og faglig markering.

Således kan brugeren hurtigt og nemt identificere den rette term og dermed hurtigere finde frem til den

rette ækvivalent, definition, kollokation, det rette eksempel med videre.

Det er kun i de færreste artikler, det er nødvendigt at angive fag ved både lemma og ækvivalent – oftest

er det kun nødvendigt ved lemmaet. Hvis man dog har tænkt sig at vende ordbogen fra L1 til L2, vil det lette

arbejdet, hvis der er de samme data ud for termerne på begge sprog, eller man kan programmere

søgerutinen til at undertrykke fagangivelser ud for ækvivalenterne. Ligeledes er det i langt de fleste tilfælde

kun nødvendigt at få præsenteret ordklasse ud for lemmaet.

Modellen i Figur 7 præsenterer de nævnte data, der er nødvendige for oversættelse og produktion af

tekster til og på engelsk, jævnfør kapitel 6 Ordbogsfunktioner. Det er dog nødvendigt at maksimere

grammatikfeltet i selve artiklen til at inkludere samtlige de informationer nævnt i punkt 7.1.4 Mikrostruktur

(under grammatiske oplysninger), samt at angive de relevante sproglige markeringer, jævnfør punkt 7.1.4

(under sproglige markeringer). Dog er jeg uenig med Bergenholtz & Tarp (1994) i, at sproglige markeringer

bør inkorporeres i de faglige forklaringer, da dette tvinger brugeren til at læse hele den faglige forklaring i

ordbogsartiklen igennem, jævnfør punkt 7.1.4, og det er for eksempel ret afgørende, om en bestemt term

kun bruges i britisk engelsk eller amerikansk engelsk.

Page 46: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 46

Grammatikfeltet ud for lemmaet i resultatlisten bør minimeres til for eksempel kun at indeholde

ordklasse samt fleksioner. Fleksionsmønstret er her relevant, da termer, der er homografisk med fællesord,

ofte skifter køn, jævnfør punkt 7.2.3.1 Krav til fagudtryk.

Jeg er enig med Bergenholtz & Tarp (1994) i, at det i flerfaglige ordbøger er vigtigt med mange

angivelser om fagligt tilhørsforhold, jævnfør punkt 7.1.4 Mikrostruktur (under faglige markeringer), men da

de som oftest angives som forkortelser, skal man passe på ved udformningen af dem, da forkortelserne

gerne skulle være så gennemskuelige som muligt.

Figur 8 anskueliggør mængden af forkortelser i anvendelse i COWIterm på tidspunktet for

ibrugtagningen. Langt de fleste af forkortelserne er faglige angivelser, og det kræver ikke langs tid arbejde

med COWIterm for at se, at det er nødvendigt med mange flere fagangivelser end de her præsenterede,

hvis det skal fungere optimalt. Det kan dog blive ret problematisk med så mange forkortelser, da brugere,

der ikke benytter COWIterm ofte nok til at huske forkortelserne fra gang til gang, bliver nødt til at

konsultere listen, hvis de ikke kan gætte sig frem til betydningen, eller hvis de vil være helt sikre på

fagangivelsen. Især brugere med lav grad af ordbogskundskaber (jævnfør Figur 3 samt kapitel 5

Figur 8 Forkortelser anvendt i COWIterm.

Page 47: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 47

Brugergrupper) vil have problemer med forkortelserne, da de måske ikke forventer dem samt heller ikke er

helt klar over, om og hvor de kan finde betydningen af dem, hvorimod brugere med en høj grad af

ordbogskundskaber af erfaring ved, at der skal være en liste med forkortelser og deres betydninger

placeret lettilgængeligt.

Jeg har forsøgt at lave forkortelserne så gennemsigtige som muligt, så de fleste af dem skulle være til at

gætte uden at konsultere listen, jævnfør punkt 7.1.4 Mikrostruktur (under faglige markeringer). Det er

alligevel et irritationsmoment, hvis man bliver nødt til at skulle søge flere steder for at være sikker på, at

den information, man har fundet frem til i artiklen, er den helt korrekte og i situationen relevante. Især hvis

mængden af forkortelser fordobles, tredobles eller firdobles, kan det være besværligt at huske dem alle

sammen samt at være sikker på, at det er den rigtige forkortelse, da mange herved nemt kan komme til at

ligne hinanden. En mulighed i COWIterm, da det er en elektronisk baseret intranetordbog, ville være at

gøre det valgfrit for brugeren, om forkortelser skal skrives ud, og hvis brugeren vælger ikke at få dem

skrevet ud, kan en pop-up-beskrivelse af forkortelsen vises som standard, når brugeren holder musen

henover den, jævnfør punkt 7.3.2 Elektronisk mikrostruktur.

Både Figur 6 og Figur 9 illustrerer COWIterms opbygning, som består af lemma, ækvivalent og

kommentarfelt samt implementering af den leksikografiske konvergensmodel, som diskuteret ovenfor,

jævnfør punkt 7.3.1 Elektronisk makrostruktur. Eksemplet i Figur 9 viser en kollokation, som i henhold til

diskussionen i punkt 8.1 Lemma- og ækvivalentselektion, vil skulle inkluderes under en anden artikel.

Eksemplet i Figur 9 kan dog bruges til at anskueliggøre det upraktiske i kun at have et kommentarfelt til

samtlige oplysninger udover lemma og ækvivalent. Kommentarfeltet bliver her anvendt til to oplysninger,

som begge skal være på både dansk engelsk, hvilket giver fire elementer, samt en adskiller mellem

kommentarer relaterende til den danske henholdsvis den engelske term.

De to oplysninger, der gives på begge sprog, er en forklaring af termen, og et eksempel af typen belæg

(jævnfør punkt 7.1.4 Mikrostruktur (under eksempler)), der er taget direkte fra en af de tekster, jeg har

arbejdet med under udarbejdelsen af COWIterm. Som det tydeligt ses, indeholder kommentarfeltet mange

oplysninger, og det er svært og tidskrævende at finde den rette information, især hvis man skal have fat i

informationer relaterende til den engelske term. Tillige er det utænkeligt at inkludere flere oplysninger i

dette kommentarfelt, uden at det bliver mere rodet og uoverskueligt, så for eksempel de grammatiske

oplysninger må her vige for forklaring og teksteksempel.

Det er i øvrigt minimalt med kommentarer i COWIterm, jævnfør Figur 10, der illustrerer mængden af

kommentarer i COWIterm ved søgning på bro, og specielt grammatiske oplysninger er blevet nedprioriteret

som et ønske fra COWI, da det blev antaget, at den primære brugergruppe ikke ville have meget nytte – og

måske blot ville forvirres af – grammatiske angivelser.

Figur 9 Her illustreres det upraktiske ved kun at have et kommentarfelt til alle øvrige oplysninger end lemma og ækvivalent.

Page 48: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 48

8.4 Brugermedbestemmelse På linje med brugermedbestemmelse som beskrevet ovenfor i forbindelse med datapræsentation og -

søgning kunne man tilføje endnu et element af brugermedbestemmelse i form af kommentarer til

ordbogen i overordnet forstand samt specifikt til en ordbogsartikel; og desuden forslag til nye termer, som

en bruger gerne vil have lemmatiseret. Brugerinvolvering er også diskuteret af Burke (1998), godt nok i

forbindelse med udarbejdelse af ordbøger til indfødte sprog, hvor han foreslår, at en lille gruppe brugere

kan agere som reference, hvis leksikografen har brug for autoritativ hjælp, og brugermedbestemmelse er

ligeledes inkorporeret i TeleLex på interessant vis, jævnfør Simonsen (2002).

Som det er tilfældet i TeleLex, jævnfør Simonsen (2002), kunne man i COWIterm gemme brugernes

indstillinger fra gang til gang, så når brugeren loggede sig på (det være sig via virksomhedens intranet eller

udefra), var vedkommendes indstillinger gemt fra sidste besøg, så vedkommende ikke skulle indstille de

foretrukne indstillinger hver gang. Samtidigt skulle man hurtigt og nemt kunne ændre disse

Figur 10 Anskueliggørelse af mængden af kommentarer implementeret i COWIterm ved søgning på bro.

Page 49: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 49

standardindstillinger, eller lave indstillinger, der kun gælder for den aktuelle søgning eller den aktuelle

session (det tidsrum, der går, fra en bruger logger sig på til vedkommende logger af igen).

Hermed er det kun fantasien, der sætter grænser for programmører henholdsvis leksikografer, og der

er, som Burke udtrykker det, " as many macrostructures in a given lexicon as there are search methods that

the programmers and lexicographers have provided" (1998).

Page 50: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 50

9 Konklusion Den elektronisk baserede intranetordbog, COWIterm, tilgængelig for virksomheden COWIs

medarbejdere, var fuldt ud anvendelig, som den var på ibrugtagningstidspunktet. Ikke desto mindre var det

et stort projekt for mig, da den optog meget af min tid, og netop fordi jeg arbejdede så meget med den,

fandt jeg det interessant at finde ud af, hvordan den kunne optimeres, så brugergrupperne kunne få mere

nytte af den.

I det ovenstående har jeg forsøgt at sammenstille den relevante valgte teori med eksisterende

elektronisk baserede intranetordbøger for på bedst mulig vis at besvare dette speciales problem.

Som det er tydeligt ved en gennemlæsning af underkapitel 7.3 Elektronisk virksomhedsleksikografi er

der næsten uanede muligheder, hvad angår søgemuligheder og datapræsentationsmetoder, og jeg har i

kapitel 8 Diskussion prøvet at spore mig ind på, hvilke datasøgnings- og datapræsentationsmetoder, der er

relevante at inkorporere i COWIterm.

Hvad angår datasøgningsmetoder, har jeg set på, om det er relevant for brugerne af COWIterm at kunne

filtrere efter fagområde samt tekstgenre (den leksikografiske dokumentskabelon). Jeg mener bestemt, at

begge dele kan være nyttige for brugerne, med de i diskussionen ovenfor anførte overvejelser taget i

betragtning. Brugerne vil ved filtrering efter fag kunne undgå for mange og irrelevante søgeresultater, både

i takt med at COWIterm vokser, og især hvis det besluttes at gøre hele teksten i ordbogsartiklerne søgbar.

Filtrering efter fag vil kræve en intern fagklassifikation for hvert af COWIs seks hovedforretningsområder 1)

for at kunne identificere relevante tekster til inkludering i korpora på både dansk og engelsk, og 2) for at

kunne identificere de relevante termer, ordforbindelser, synonymer og antonymer, eksempler med videre i

disse tekster. Som også allerede diskuteret ovenfor vil det være nødvendigt i korporaerne at inkludere

tekster omhandlende økonomi og regnskab samt visse typer juridiske tekster for at kunne matche de

teksttyper, som brugerne selv skal dels producere og dels oversætte.

Ligeledes vil det være relevant at kunne søge efter tekstgenre med efterfølgende angivelse af en

skabelon af den valgte tekstgenre, der indeholder kommunikative formål, trækstrukturer samt retoriske

træk, da dette vil være til stor hjælp for de af COWIs medarbejdere, der skal producere tekster til internt

såvel som til eksternt brug. Dette er med til at sikre en ensartet kommunikation virksomheden igennem,

hvilket, som tidligere nævnt, kan være af stor værdi for virksomheden, jævnfør kapitel 1 Indledning.

Hvad angår datapræsentationsmetoder kan det som vist være helt op til brugeren hvilke data, der skal

præsenteres – og hvordan. Optimalt set kunne man opstille en todelt løsning, hvad angår præsentation af

mikrostrukturen; for det første ved at inddele den i moduler og lade brugeren angive, om vedkommende

skal benytte ordbogen til at oversætte, producere og/eller læse og forstå tekster, som det er tilfældet i

TeleLex, jævnfør punkt 7.3.2 Elektronisk mikrostruktur. Denne metode skulle i så fald inkludere de

beskrevne elementer relevante for oversættelse og produktion, jævnfør kapitel 6 Ordbogsfunktioner. I

tillæg til dette kunne brugeren blive bedt om at angive, om vedkommende var teknisk eller sprogligt

uddannet, hvilket ville have effekt på den måde, de tekstuelle og sproglige signaler (såsom forkortelser)

blev opstillet (udskrevet/forkortet), da dette siger noget om, vedkommendes ordbogskundskaber og

dermed kender og forstår disse signaler.

Page 51: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 51

For det andet kan man gøre et vindue med 'avancerede indstillinger' tilgængeligt, så den øvede bruger

selv kan definere fuldt ud, hvilke data vedkommende vil have præsenteret i hvilken rækkefølge. Tillige med

dette kan man gøre det valgfrit i hvilket omfang, brugeren vil have data præsenteret, hvis man, som

diskuteret ovenfor, jævnfør underkapitel 8.3 Diskussion af mikrostruktur, for eksempel vil have forkortelser

skrevet ud, have mere information i definitionen eller vil udelade eventuel etymologi i definitionen.

Desuden vil der helt sikkert være forskellige præferencer inden for layout, farver, teksttyper med videre,

hvilket dog må anses for andenprioritet, da det er dataene i ordbogen, der er det primære element,

eftersom disse skal anvendes som et værktøj af COWIs medarbejdere.

I COWIterm, som den var på ibrugtagningstidspunktet, var der som diskuteret ovenfor i underkapitel 8.3

Diskussion af mikrostruktur udelukkende ét felt til samtlige andre oplysninger end lemma og ækvivalent.

Hvis man skulle inkludere både alle grammatiske angivelser, faglige og sproglige markeringer, definitioner,

ordforbindelser, eksempler med videre på både dansk og engelsk ville det være helt uoverskueligt og noget

nær umuligt at finde frem til den relevante information ved brug af kun et enkelt felt.

Jeg vil lægge ovenstående til grund for at henvise til Figur 5 og Figur 7 som den ideelle måde at opstille

COWIterm på, da denne model giver hurtigt overblik, samtidig med at man nemt og hurtigt kan gå videre til

næste term på resultatlisten tillige med, at det er hurtigt at lave en ny søgning. Denne model giver samtlige

informationer relevant for elektronisk baserede intranetordbøger som COWIterm, inkluderende alt fra

grammatiske angivelser og definitioner til lyd (både hvad angår udtale men også muligheden for at

inkludere lyde karakteristiske for definiendum, det være sig dyr såvel som maskiner med videre), billeder

og videoklip.

Page 52: Forfatter: Martin Christoffersen COWIterm

Martin Christoffersen COWIterm

Side | 52

10 Litteraturliste Almsten, L. K., & Kristensen, K. (2008). Terminologi er kommunikation. Magasinet for Kommunikation og

sprog , 26-29.

Bergenholtz, H., & Tarp, S. (1994). Manual i fagleksikografi. Herning: forlaget systime a/s.

Burke, S. M. (1998). The Design of Online Lexicons. Evanston: Northwestern University, Evanston, Illinois.

COWI A/S. (u.d.). COWI A/S, forside. Hentede 28. April 2009 fra COWI A/S: http://www.cowi.dk

Frandsen, L. (1982). Definition. Objekter, metoder og regler. København: Handelshøjskolen i København.

Geeb, F. (1998). Koncernrelateret miljø- og energiordbog. Hermes, Journal of Linguistics, nr. 20 , 203-210.

Kirchmeier-Andersen, S. (2003). Virksomhedens sproglige identitet. I Ind med sproget! En artikelsamling om

sproget i og for erhvervslivet (s. 11-21). København: Lingtech A/S.

Madsen, B. N. (1999). Terminologi 1 - Principper og metoder. København: Gads Forlag.

Simonsen, H. K. (2002). TeleLex - Theoretical Considerations on Corporate LSP Intranet Lexicography: Design

and Development of TeleLex - an Intranet-based Lexicographic Knowledge and Communications

Management System. Århus: Handelshøjskolen i Århus.

Simonsen, H. K. (2007). Virksomhedsleksikografien viser tænder: leksikografiske løsninger i København Zoo

og Fagerberg A/S. I Nordiske studier i leksikografi 10. Rapport fra Konference om leksikografi i Norden.

Island 22.-26. maj 2007. Akureyri: Nordisk Forening for Leksikografi.

Sprognævn, D., & Litteraturselskab, D. D.-o. (19. Oktober 2007). Forside » Råd og regler »

Retskrivningsregler mv. » Retskrivningsregler » § 18-19. Ét eller flere ord? » § 18. Skrivemåden afhængig af

udtalen. Hentede 22. Marts 2009 fra Sproget.dk: http://www.sproget.dk

Svensén, B. (1993). Practical Lexicography: Principles and Methods of Dictionary-Making. Oxford, USA:

Oxford University Press.

Trask, L. (u.d.). What Is A Word? Hentede 9.. Marts 2009 fra Department of Linguistics and English

Language, University of Sussex: http://www.sussex.ac.uk/linguistics/documents/essay_-

_what_is_a_word.pdf