Forfatter: Martin Christoffersen COWIterm
Transcript of Forfatter: Martin Christoffersen COWIterm
Cand.ling.merc. Copenhagen Business School
Forfatter:
Martin Christoffersen
COWIterm Optimering af en elektronisk intranetordbog
Vejleder:
Henrik Køhler Simonsen
April 2009
Martin Christoffersen COWIterm
Side | 2
Martin Christoffersen COWIterm
Side | 3
Executive summary
[COWIterm – Optimisation of an electronic intranet dictionary] Throughout 2008, I have had the challenges – and the pleasure – of developing COWIterm, an
electronically based intranet dictionary for the employees of COWI, a Danish engineering consultancy
group. However, the development has been within the frames set by COWI with regards to both data
presentation and data search. Therefore, my purpose in this thesis is to discuss different theories pertaining
to terminology and lexicography as well as existing electronically based intranet dictionaries in order to
examine the possibilities within the electronic online media, for the purpose of optimising COWIterm for
the intended user groups and functions.
The first thing to do when planning a dictionary is to establish the intended user groups, cf Bergenholtz
& Tarp (1994). The primary user group, set by COWI, consists of technicians and engineers with Danish as
their native language, and the functions relevant comprise production of English texts and translation from
Danish to English. Furthermore, I have assumed a secondary user group for whom the same functions
apply, consisting of translators and other language employees.
A secondary function is production of texts in Danish as well as translation from English to Danish by
people not having Danish as a native language, resulting in a tertiary user group consisting also of primarily
technicians and engineers; however; this group is more difficult to define, as it could be anyone not having
Danish as a native language.
I continue with outlining the theory of lexicography (Bergenholtz & Tarp, 1994), and the different word
types are described, lemma and equivalent selection are touched upon, and I establish the contents of a
microstructure (presentation of data) and how these data can be made searchable (the macrostructure).
Afterwards, theories of terminology (Madsen, 1999) are described, including concept systems and the
process of making definitions.
Next, I incorporate theories on online reference works including the theories of the lexicographic
convergence model as well as the lexicographic document template, cf Simonsen (2007) and Burke (1998),
and establish that there are almost unlimited possibilities for data presentation and data search methods,
including the elements of multimedia (sound, images, videos).
In the discussion, I juxtapose the theories of traditional lexicography and terminology with those of
electronic lexicography and internet reference works relevant for COWIterm in order to explore the
optimum layout for an electronic based intranet dictionary such as COWIterm.
I argue inter alia for the implementation of internal subject classifications of COWI's six main business
areas, as this will help identifying 1) relevant texts to be included in the corpora; 2) relevant terms in those
texts. Furthermore, it would be necessary to include annual reports and contracts as well as other
economic and legally binding documents in the corpora, as the secondary user group can be assumed to
produce and translate such texts.
Martin Christoffersen COWIterm
Side | 4
I base my conclusion on a model, showing the ideal way of constructing an electronically based intranet
dictionary such as COWIterm, consisting of a result page in the upper third of the screen, above it only an
input field for making a new search as well as the possibility of selecting a subject and a text genre for the
new search. In the lower two-thirds of the screen, the information related to the term clicked upon in the
result list appears, and space is reserved for different kinds of multimedia in the left hand side of the entire
screen.
Martin Christoffersen COWIterm
Side | 5
0 Indholdsfortegnelse
1 Indledning ........................................................................................................................... 7
2 Problem .............................................................................................................................. 8
3 Afgrænsning ........................................................................................................................ 9
3.1 Teoretisk afgrænsning ............................................................................................................. 9
3.1.1 Fagleksikografi .............................................................................................................................................. 9
3.1.2 Terminologi ................................................................................................................................................... 9
3.2 Empirisk afgrænsning .............................................................................................................. 9
4 Metode ............................................................................................................................. 10
4.1 Specialet ............................................................................................................................... 10
4.2 COWIterm ............................................................................................................................. 10
5 Brugergrupper ................................................................................................................... 12
6 Ordbogsfunktioner ............................................................................................................ 14
7 Teori ................................................................................................................................. 15
7.1 Fagleksikografi ...................................................................................................................... 15
7.1.1 Ordtyper ...................................................................................................................................................... 16
7.1.2 Lemmaselektion .......................................................................................................................................... 17
7.1.3 Ækvivalentselektion .................................................................................................................................... 18
7.1.4 Mikrostruktur .............................................................................................................................................. 19
7.1.5 Makrostruktur ............................................................................................................................................. 28
7.2 Terminologi ........................................................................................................................... 30
7.2.1 Begrebssystemer......................................................................................................................................... 30
7.2.2 Definitioner ................................................................................................................................................. 31
7.2.3 Dannelse af og krav til fagudtryk ................................................................................................................ 34
7.3 Elektronisk virksomhedsleksikografi ...................................................................................... 36
7.3.1 Elektronisk makrostruktur .......................................................................................................................... 36
7.3.2 Elektronisk mikrostruktur ........................................................................................................................... 37
8 Diskussion ......................................................................................................................... 39
8.1 Lemma- og ækvivalentselektion ............................................................................................. 39
8.2 Diskussion af makrostruktur .................................................................................................. 41
8.3 Diskussion af mikrostruktur ................................................................................................... 42
8.4 Brugermedbestemmelse........................................................................................................ 48
9 Konklusion ........................................................................................................................ 50
10 Litteraturliste ................................................................................................................. 52
Martin Christoffersen COWIterm
Side | 6
Ovenstående indholdsfortegnelse kan simplificeres ved nedenstående model, som specialet struktureres
efter. Man kan øverst på hver side følge med i, hvor langt henne man er i specialet.
Martin Christoffersen COWIterm
Side | 7
1 Indledning Virksomheder agerer i stigende grad i et internationalt og videnstungt miljø med mere og mere
internationalt samarbejde. For at kunne give det rigtige tilbud til de rigtige kunder er det vigtigt, at
kunderne – og de interne afdelinger imellem – ikke forvirres af inkonsekvent og uklart sprogbrug. Det er
derfor vigtigt, at en ensartet terminologi anvendes, for internt i virksomheden at kunne koordinere
sådanne projekter, da misforståelser kan være kostbare i både tid og penge (Almsten & Kristensen, 2008, s.
26). Kirchmeier-Andersen (2003) argumenterer for, at "virksomheder skal være omhyggelige med deres
sproglige kommunikation, ellers risikerer de at miste kunder og penge, og i værste fald at blive offentligt til
grin".
"[E]n konsekvent sprogbrug [bliver] mere og mere nødvendig hvis man vil arbejde systematisk med den
viden der ligger gemt i de elektroniske dokumenter" (Kirchmeier-Andersen, 2003, s. 17), og term- og
videnbaser er vigtige værktøjer i opbyggelsen og vedligeholdelsen af den rigtige sprogstrategi (Kirchmeier-
Andersen, 2003, s. 18).
Dette er ikke mindst relevant for store, internationale virksomheder som COWI, med deres mange
tusinde medarbejdere, hvis sprogbrug og kommunikation – både internt og udad til – sagtens kan blive
meget rodet og uensartet, hvis ikke der er nedfældet retningslinjer. COWI udfører løbende projekter på
stort set alle kontinenter og med mange forskellige samarbejdspartnere – hvilket er tydeligt ved nogle få
klik på COWIs hjemmeside, jævnfør COWI A/S – så vigtigheden af en ensartet terminologi kan ikke
underdrives, og Geeb (1998) argumenterer for en fleksibel og innovativ intranetløsning. Terminologi
"handler om ord og om velfungerende kommunikation" (Almsten & Kristensen, 2008, s. 26), og den rette
terminologi er derfor også afgørende for COWIs billede udad til.
Martin Christoffersen COWIterm
Side | 8
2 Problem I løbet af 2008 har jeg haft fornøjelsen af og udfordringerne med at arbejde med udviklingen af
COWIterm – en intranetordbog mellem dansk og engelsk til brug for virksomheden COWIs medarbejdere.
Under udarbejdelsen har jeg, meget naturligt, været nødsaget til at læse leksikografisk og terminologisk
teori, og i processen er jeg selv flere gange kommet på idéer, der kunne gøre ordbogen mere brugervenlig.
Desuden har jeg fået idéer udefra til, hvordan ordbogen kunne forbedres – med ordbogens målgrupper og
funktioner, jævnfør Bergenholtz & Tarp (1994, s. 16-25), in mente. COWI har imidlertid, i hvert fald som
udgangspunkt, ønsket en ganske simpel ordliste med et tilhørende kommentarfelt, da det ville være det
nemmeste at sætte op og gå videre ud fra.
På basis af disse erkendelser og erfaringer er det derfor mit formål med dette speciale
at analysere og diskutere forskellige datasøgnings- og datapræsentationsmetoder i
virksomhedsordbøger med henblik på forbedring af COWIterm
For på bedst mulig vis at finde frem til en løsning vil udforskningen af følgende underspørgsmål indgå i
min analyse og besvarelse:
Hvilke datasøgningsmetoder diskuteres i litteraturen og i praksis?
o Ville det i COWIterm være relevant at kunne filtrere efter fag?
o Ville det i COWIterm være relevant at kunne filtrere efter tekstgenre?
Hvilke datapræsentationsmetoder findes i litteraturen og i praksis?
o Hvilke datapræsentationsmuligheder ville være relevante i COWIterm?
o Er det administrativt forsvarligt kun at have et kommentarfelt til alle andre angivelser end
lemma/ækvivalent?
o Hvor meget skal brugerne selv have lov til at skræddersy den mængde data, de bliver
præsenteret for?
Martin Christoffersen COWIterm
Side | 9
3 Afgrænsning Jeg har afgrænset dette speciale både teoretisk og empirisk, og nedenfor har jeg anført hvilke
afgrænsninger, der vil blive taget til hjælp for at kunne centrere analysen omkring mit problem.
3.1 Teoretisk afgrænsning Min teori består af litteratur, der især behandler fagleksikografi og terminologi. De to områder vil kort
blive beskrevet herunder:
3.1.1 Fagleksikografi
"Leksikografi er udarbejdelse af ordbøger" (Bergenholtz & Tarp, 1994, s. 27). Deraf kan så udledes, at
fagleksikografi er udarbejdelse af fagordbøger. Der findes imidlertid forskellige former for leksikografi.
Udover den praktiske leksikografi, som er det egentlige arbejde med udarbejdelsen af ordbøger, findes der
tre typer metaleksikografi, hvori leksikografernes teoretiske overvejelser om og undersøgelser af ordbøger
bliver behandlet (Bergenholtz & Tarp, 1994, s. 27). Det drejer sig om brugerforskning, ordbogskritiske
undersøgelser samt systematisk ordbogsforskning. Inden for brugerforskning undersøges
brugervenligheden i diverse ordbøger og generelle brugervejledninger opstilles; leksikografer inden for
ordbogskritiske undersøgelser udarbejder ordbogsanmeldelser og modeller til dette arbejde; og endelig
udarbejder leksikografer inden for systematisk ordbogsforskning nye eller forbedrede teorier, der kan
bruges ved udarbejdelse af nye ordbøger. (Bergenholtz & Tarp, 1994, s. 28). I dette speciale er det primært
systematisk ordbogsforskning, der vil blive fokuseret på.
3.1.2 Terminologi
Definitionen på en term er ifølge Madsen (1999) "et sprogligt tegn, som har en specifik betydning i et
fagsprog" (Madsen, 1999, s. 16), og terminologi bliver derved studiet af og arbejdet med termer (udtrykket
fagterm er altså en pleonasme). Termer kan for langt størstedelen også være en del af et begrebssystem
inden for det pågældende fag (Madsen, 1999, s. 13). I lingvistikken snakker man om, at en term både har et
udtryk og et indhold. Udtrykket, hvilket i de fleste tilfælde vil være et fagudtryk, når det kommer til
COWIterm, er den skrevne repræsentation af termen, og indholdet er et ligeledes fagligt begreb, som
består af karakteristiske træk. En intension består af ét eller af en række karakteristiske træk, hvorunder
entiteter ude i virkeligheden kan høre. Den samling entiteter, der defineres af en sådan intension kaldes for
en ekstension (Madsen, 1999, s. 16-18). "[U]dtrykket entitet refererer til et hvilket som helst fænomen, det
være sig materielt eller immaterielt" (Madsen, 1999, s. 18).
En terminologi kan også henvise til den samling termer, som er speciel for et bestemt fag, men denne
betydning vil der i dette speciale blive set bort fra.
3.2 Empirisk afgrænsning Min empiri består primært af de tekster, jeg har fået adgang til af COWI med henblik på at udarbejde en
ingeniørteknisk ordbog med tilføjelse af andre relevante ord såsom økonomiske og juridiske termer samt
andre ord, der generelt kan være besværlige at oversætte.
Sekundært inkluderes diskussion af datasøgnings- og datapræsentationsmetoder i andre elektroniske
virksomhedsordbøger.
Martin Christoffersen COWIterm
Side | 10
4 Metode I dette kapitel vil jeg beskrive, hvorledes resten af specialet vil udforme sig, og dernæst vil jeg give en
kort beskrivelse af tilblivelsen af COWIterm.
4.1 Specialet På baggrund af de indledende afsnit (Indledning, Problem, Afgrænsning og Metode) vil jeg beskrive teori
inden for de relevante områder, leksikografi og terminologi. I forening med mit problem vil jeg her fokusere
på, hvilke relevante søgemuligheder og datapræsentatiosmetoder, der findes i litteraturen og i praksis.
Dernæst vil jeg i diskussionen, på baggrund af teoriafsnittet samt de forslag og tilføjelser til løsningen af
mit problem, som jeg har udarbejdet under mit arbejde med COWIterm, udlede, hvordan ordbogsartikler
bør opstilles i en elektronisk onlineordbog som COWIterm.
Til sidst vil jeg i konklusionen svare på, hvordan COWIterm optimalt set bør opstilles for at tilgodese så
stor en del af brugergruppen som muligt på baggrund af både teori og diskussion.
4.2 COWIterm Fra marts til december 2008 har jeg, via min kontaktperson i COWI, Anja Fabech Jensen, haft adgang til
to ens korpora på dansk henholdsvis engelsk, hvert bestående af 178 tekster af meget varierende længde
(fra under en halv side og op til 17 siders løbende tekst), med henblik på at udvælge relevante termer til
brug i COWIterm. Teksterne er løbende blevet udvalgt dels på baggrund af mine månedlige
statusrapporteringer, hvor det har været muligt at identificere hvilke områder under COWI, der har været
underrepræsenteret i COWIterm. De engelske tekster er blevet produceret på baggrund af de danske
kildetekster (se Figur 1). Arbejdet er foregået således, at jeg har identificeret relevante termer i den danske
tekst og parret dem med ækvivalenter i den engelske tekst. Derefter er de blevet lemmatiseret og tilføjet
COWIterm. Et udsnit af den færdige ordbog i tekstformat kan ses i Figur 2.
Figur 1 Et tekstpar. Kildetekst på dansk og måltekst på engelsk.
Martin Christoffersen COWIterm
Side | 11
Figur 2 Lille uddrag af COWIterm, som den færdige version så ud i tekstformat. Ændringer og rettelser må i skrivende stund forventes at være indarbejdet.
Martin Christoffersen COWIterm
Side | 12
5 Brugergrupper Det er vigtigt først at gøre sig klart, hvem ordbogens målgruppe er, samt hvor meget sproglig
henholdsvis faglig viden denne gruppe besidder. Dette er en forholdsvis simpel opgave ved
koncernordbøger, da målgruppen mere eller mindre allerede er defineret (Bergenholtz & Tarp, 1994, s. 15-
18+73). I begyndelsen af arbejdet med COWIterm blev det defineret for mig, at ordbogen primært skulle
anvendes til oversættelse til og tekstproduktion på engelsk, og at den primære målgruppe for COWIterm er
teknikere og ingeniører. Tillige har jeg antaget en sekundær brugergruppe, som består af oversættere og
andre sprogmedarbejdere, da det må formodes, at denne gruppe også vil benytte ordbogen som et værktøj
i deres arbejdsforløb. En sekundær funktion er oversættelse til og produktion på dansk af personer med
andet modersmål end dansk, hvilket resulterer i en tertiær målgruppe.
I Figur 3 har jeg angivet hvor stor fremmedsproglig indsigt henholdsvis faglighed, de tre grupper
besidder, samt hvor store ordbogskundskaber, de formodes at have. Tillige har jeg sat mig selv ind i figuren
som referencepunkt. Grunden til, at der skal skelnes mellem brugere med forskellig faglighed henholdsvis
fremmedsproglig indsigt gør sig gældende dels med hensyn til hvilke elementer, der skal indarbejdes i
ordbogsartiklerne, og dels med hensyn til sproget og den tekst, som artiklerne består af. Lægfolk har oftest
brug for flere informationer end fagfolk har, og ligeledes har folk med lille sproglig viden brug for flere
informationer omkring for eksempel uregelmæssig bøjning og ordforbindelser end folk med stor sproglig
viden (Bergenholtz & Tarp, 1994, s. 17).
Graden af ordbogskundskaber er vigtig i den henseende, at folk, der ikke er vante til at slå op i ordbøger,
skal hjælpes mere på vej, både i søgeforløbet men også i selve artiklerne. Selvom mediet er skiftet fra papir
til et elektronisk medium, er det stadig de samme typer information, brugerne forventer at – og som de
oftest kan – finde. Graden af ordbogskundskaber kan give udslag i udformningen af artiklerne samt
mængden og udformningen af forkortelser, for eksempel i forbindelse med de faglige markeringer, da
nogle kan have svært ved at tyde disse tekstuelle og sproglige signaler.
Jeg har antaget i Figur 3, at en persons ordbogskundskaber er nogenlunde analoge med vedkommendes
Figur 3 Hvor stor viden COWIterms brugergrupper besidder. Model videreudviklet fra Bergenholtz & Tarp (1994), jævnfør punkt 7.1.4 Mikrostruktur (under ordforbindelser).
Martin Christoffersen COWIterm
Side | 13
fremmedsproglige indsigt, da det må formodes, at oversættere og andre sprogmedarbejdere jævnligt slår
op i en ordbog og dermed opbygger erfaring på dette område i modsætning til teknisk uddannede, der som
oftest ikke har med sprog at gøre.
COWIterms primære brugergruppe (rød cirkel) består af fagfolk inden for ingeniørfag og de besidder en
stor faglighed bestående af teknisk viden. Til gengæld er graden af deres fremmedsproglige indsigt
begrænset. Graden af denne gruppes ordbogskundskaber er ligeledes lav, hvilket til sammen gør, at
ordbogen og dens tekstuelle og sproglige signaler skal være meget let tilgængelige for at denne gruppe kan
få nytte af ordbogen.
COWIterms sekundære brugergruppe (blå cirkel), som består af oversættere og andre
sprogmedarbejdere, ligger ikke langt fra mig selv; dog må det formodes, at denne gruppe er i besiddelse af
noget mere faglighed end mig selv. Da de dog ikke arbejder med tekniske processer og maskiner til
hverdag, har jeg angivet denne gruppe til at besidde middel faglighed, dog ikke langt fra grænsen til stor
faglighed. Denne gruppe besidder tillige stor fremmedsproglig indsigt samt en høj grad af
ordbogskundskaber.
Den tertiære brugergruppe består, ligesom den primære brugergruppe, af personer med høj faglighed
og viden inden for teknik og ingeniørfag. Deres fremmedsproglige indsigt er dog sværere at definere, da det
er en blandet gruppe af alle udefrakommende, der kunne tænkes at benytte COWIterm, men da denne
gruppe ikke har dansk som modersmål og man ikke kan antage, at gruppen har engelsk som modersmål, er
de ringere stillet end den primære gruppe. Ligeledes er det ukendt, hvor ofte de slår op i en ordbog samt
graden af kendskab til vestligt producerede ordbøger, og til sammen gør alt dette, at gruppen i Figur 3 er
defineret til at have mindre fremmedsproglig (i dette tilfælde dansk) indsigt end den primære målgruppe.
Hvad angår fremmedsproglig indsigt i den primære gruppe kunne man forestille sig, at en vis del heraf
besidder terminologi på fremmedsproget, men at de mangler grammatik og generel sproglig viden til at
kunne skrive eller oversætte en tekst, hvorimod man i den sekundære gruppe kunne forestille sig, at det er
den fagsproglige viden (terminologi), der halter bagefter.
Som det kan ses af Figur 3 (grønne cirkler) har jeg flyttet mig i løbet af ordbogsprojektet. Dels har jeg
lært samt kender nu til mere teknisk terminologi og sprogbrug, og dels besidder jeg nu flere
ordbogskundskaber, da jeg forstår motivationen for de forskellige valg i ordbøger.
Martin Christoffersen COWIterm
Side | 14
6 Ordbogsfunktioner Som tidligere nævnt er COWIterm primært intenderet til funktionerne oversættelse til og produktion på
engelsk. Til produktion af tekster på et fremmedsprog angiver Bergenholtz & Tarp (1994) en række
elementer, der bør inkorporeres, og disse udgør 1) ortografi, genus, udtale, uregelmæssighed,
kollokationer, andre informationer om sprogbrug; 2) norm, faglig markering og/eller faglig forklaring
(Bergenholtz & Tarp, 1994, s. 21). Tillige diskuteres, om dataene skal placeres i en ordliste, der går fra
dansk-engelsk eller engelsk-dansk, men det anbefales, at data præsenteres i begge ordlister (Bergenholtz &
Tarp, 1994, s. 19-20).
Til oversættelse anbefales det at inkorporere følgende elementer: 1) til modersmålet: ordklasse, genus,
udtale, uregelmæssighed; 2) til fremmedsproget: ortografi, genus, udtale, uregelmæssighed, kollokationer,
andre informationer om sprogbrug; 3) ækvivalent(er); 4) eventuelt om graden af ækvivalens; 5) norm, faglig
markering og/eller kort forklaring (Bergenholtz & Tarp, 1994, s. 21).
Hvad angår produktion på og oversættelse til dansk af den tertiære målgruppe, er det de samme
elementer som angivet ovenfor, der er relevante. Dette er tilfældet, fordi dansk for den tertiære
brugergruppe er et fremmedsprog, og dermed gælder de samme retningslinjer som for oversættelse af
dansk til engelsk og produktion på engelsk for den primære og sekundære brugergruppe, for hvem engelsk
er fremmedsproget. Dog er den tertiære brugergruppe yderligere handikappet i denne forbindelse, da
engelsk ikke kan siges at være modersmålet.
Som det kan ses af overstående, er der sammenfald mellem nogle af de informationer, der medtages i
forbindelse med de to funktioner, hvilket letter arbejdet med at producere ordbøger, der kan benyttes i
multiple situationer. Hvis alle informationer alligevel bliver gjort tilgængelige for alle brugere på begge
sprog, er det dog af mindre betydning, hvilke informationer der præsenteres i hvilken forbindelse.
Eftersom ordbogen sekundært også er til brug for folk med andet modersmål end dansk, er der ligeledes
forklaringer, eksempler med mere ved det danske lemma, hvilket igen gør, at ordbogen bliver anvendelig til
reception og forståelse af tekster på dansk (Bergenholtz & Tarp (1994, s. 20-21).
Martin Christoffersen COWIterm
Side | 15
7 Teori I det følgende kapitel vil jeg beskrive den teori, som vil ligge til grund for diskussionen af mit problem,
det vil sige, som allerede nævnt i underkapitel 3.1 Teoretisk afgrænsning, teori omhandlende
fagleksikografi og terminologi samt teori omkring onlineleksikografi.
7.1 Fagleksikografi Madsen (1999) inddeler det terminologiske arbejdsforløb i tre faser, "som resulterer i udarbejdelse af
terminologiske artikler til en termbase eller en fagordbog" (Madsen, 1999, s. 124):
1) Forarbejde
- Afgrænsning af arbejdsområdet
- Indsamling af dokumentationsmateriale og kontakt med fageksperter
- Bedømmelse og udvælgelse af dokumentationsmateriale
- Eventuel efterjustering af afgrænsningen
2) Terminologisk arbejde
Parallelt for begge sprog:
- Identificering af termer og indsamling af oplysninger (definitioner, teksteksempler etc.)
- Systematisering (udarbejdelse af begrebssystemer)
Efter registrering af terminologi på begge sprog:
- Sammenligning mellem de to sprogs begreber (definitioner og begrebssystemer)
3) Terminografisk arbejde
- Udarbejdelse af terminologiske enheder (artikler)
(Madsen, 1999, s. 124)
Denne arbejdsmetode er ikke helt ulig den, som Bergenholtz & Tarp (1994) beskriver, og som vil blive
præsenteret i det følgende.
Når man planlægger en ordbog, skal man først og fremmest fastlægge ens brugergruppe og derudfra i
hvilke situationer, ordbogen skal anvendes (Bergenholtz & Tarp, 1994, s. 15). Dette er som regel en
forholdsvis simpel opgave ved udarbejdelsen af branche- og koncernordbøger i forhold til ved
udarbejdelsen af andre ordbøger, da brugergruppen her allerede er defineret, jævnfør kapitel 5
Brugergrupper. Dog skal man alligevel gøre sig nogle overvejelser i denne forbindelse, såsom hvor stor
faglig henholdsvis sproglig viden, den enkelte bruger besidder (Bergenholtz & Tarp, 1994, s. 17-18), samt
om ordbogen skal benyttes ved reception, produktion eller oversættelse af tekster (Bergenholtz & Tarp,
1994, s. 15).
Ordbogens empiri baseres optimalt set på et tekstkorpus svarende til de tekster, som brugergruppen må
forventes at skulle beskæftige sig med (Bergenholtz & Tarp, 1994, s. 15), da disse tekster indeholder den
terminologi, som brugerne eftersøger. Hermed bliver der som sådan ikke tale om et enkelt eller nogle få
fagområder, da en virksomhedsbaseret intranetordbog som COWIterm kan spænde over så vidt forskellige
fag og begreber som regnskabsnormer over erstatningssager til produktsortiment.
Martin Christoffersen COWIterm
Side | 16
Bergenholtz & Tarp (1994) beskriver alle elementer indeholdt i en ordbog, og behandler derfor kun på et
begyndende og nu forældet stadium elektroniske ordbøger, men mange af grundelementerne og
overvejelserne omkring for eksempel opbygningen af mikrostrukturen er stadig yderst relevante. Jeg vil i
det følgende starte med at definere de forskellige ordtyper og angive retningslinjer for, hvordan disse
behandles. I tilknytning hertil kommer en kort redegørelse for lemma- og ækvivalentselektion. Herefter vil
jeg gå mere i dybden med de forskellige dele af mikrostrukturen efterfulgt af en gennemgang af
makrostrukturer.
7.1.1 Ordtyper
Når man skal udvælge hvilke ord, der skal lemmatiseres, må man først have gjort sig nogle tanker
omkring, hvad et ord er. Bergenholtz & Tarp (1994) nævner ortografiske, fonologiske, grammatiske samt
leksikalske ord.
Et ortografisk ord er en sammensætning af bogstaver, der har mellemrum eller sætningstegn omkring
sig, men det kan ikke indeholde mellemrum og/eller sætningstegn, da det så ville udgøre to eller flere
ortografiske ord. Selvom et begreb som "fuldstændigt endossement" ville kunne slås op i rette ordbog – og
i visse sammenhænge også anses som et enkelt ord – består det af to ortografiske ord: "fuldstændigt" og
"endossement". Ofte er det sådan med termer, der består af flere ortografiske ord, at betydningen ikke er
kompositionel, hvilket vil sige, at man ikke kan udlede betydningen af de begreber, der indeholdes i de
enkelte ortografiske ord (Bergenholtz & Tarp, 1994, s. 100) (Trask, s. 1) (Madsen, 1999, s. 14).
Fonologiske ord findes i talesprog, og "kan isoleres ved hjælp af grænsesignaler, som kan være endda
meget forskellige fra sprog til sprog" (Bergenholtz & Tarp, 1994, s. 100). Således deles en talestrøm på for
eksempel engelsk op i fonologiske ord ved at tælle hovedtryk: Ét hovedtryk dækker ét fonologisk ord, og
således kan hele eller dele af sætninger udgøre et enkelt fonologisk ord uden hensyntagen til opdelingen i
ortografiske ord (Trask, s. 2).
Et grammatisk ord kan bestå af kun en ordstamme eller af en stamme samt et fleksionsmorfem. Dette
kan illustreres ved hjælp af stammen "træ" og fleksionsmorfemet "-er". Desuden kan visse ortografiske ord
repræsentere flere grammatiske ord (Bergenholtz & Tarp, 1994, s. 100) (Trask, s. 4-5).
Et leksem (også kaldet leksikalsk ord) er betegnelsen for en gruppe grammatiske ord med samme
stamme og fleksionsparadigme. For eksempel er "træ" og "træer" to forskellige repræsentationer af det
abstrakte leksem TRÆ. Det er som hovedregel leksemerne, der lemmatiseres i ordbøger, da denne form
helt og fuldkomment udgør stammen og derfor ikke har yderligere affikser eller fleksionsmorfemer
tilknyttet. Derfor omtales denne repræsentation af leksemet (leksemer er jo abstrakte enheder) som
grundformen. Det kan dog være hensigtsmæssigt ligeledes at lemmatisere uregelmæssigt dannede
grammatiske ord, da disse ellers kan være svære at finde i ordbogen. I sådan en situation er hovedformålet
med artiklen at henvise til det rette leksem, hvor forklaring med mere så vil være angivet (Bergenholtz &
Tarp, 1994, s. 100-101) (Trask, s. 3).
Herudover kan man også med fordel lemmatisere orddele (også kaldet streglemmata), det vil sige
affikser og ordstammer, da en sådan selektion kan give "brugeren indblik i regelmæssige orddannelser, som
ikke alle kan lemmatiseres" (Bergenholtz & Tarp, 1994, s. 115) samt forkortelser, da disse er hyppige i visse
fagsprog, og det er ikke altid indlysende, hvilken uforkortet term forkortelsen står i stedet for (Bergenholtz
Martin Christoffersen COWIterm
Side | 17
& Tarp, 1994, s. 105+115). Initialord er en type forkortelser, der dannes ved at trække
begyndelsesbogstaverne i en ordrække sammen. Initialord (eller initialforkortelser, som de også kaldes),
der kan udtales som et selvstændigt ord (for eksempel "NATO"), kaldes for et akronym, jævnfør Trask (s. 9-
10) samt Madsen (1999, s. 108). Andre eksempler på forkortelser er ellipseord og teleskopord. Ellipseord
dannes ved afkortning, hvor enten den første eller den sidste del af ordet skæres væk. Det er oftest sådan,
at det fulde ord er gammeldags eller i hvert fald sjældnere brugt end det afkortede ord. Teleskopord
dannes ved at udtage forskellige dele af ofte flerordstermer og sætte dem sammen, så de kan udtales som
et selvstændigt ord. Dette er dog en noget sjældnere praksis på dansk end på engelsk (Trask, s. 9-11)
(Madsen, 1999, s. 108-109).
Madsen (1999) skelner herudover mellem tre typer ord, nemlig rodord, sammensætning og afledning.
Således består rodord kun af en rod uden nogen former for affikser, hvor afledninger består af en rod samt
et eller flere affikser. Rodord og afledninger er til sammen, hvad Bergenholtz & Tarp (1994) kalder for
grammatiske ord. Sammensætninger betegnes som bestående af minimum to ordstammer med eller uden
affikser, der på dansk skrives som ét ortografisk ord (ofte med et bindebogstav, som regel "e" eller "s"),
men som på engelsk tit består af to ortografiske ord (Madsen, 1999, s. 102). Sammensætninger som
beskrevet her er analogt med hvad Bergenholtz & Tarp (1994, s. 101) benævner ordgruppeleksemer.
Derudover nævnes også ordgrupper (Madsen, 1999, s. 106), der dækker over det samme som
flerordstermer, som består af to eller flere ortografiske ord.
Det foreslås, at hvis ikke grundformen benyttes i det pågældende fagsprog, skal den grammatiske form,
der benyttes, lemmatiseres. Grundformen kan man så anføre eventuelt udelukkende som et
henvisningslemma (Bergenholtz & Tarp, 1994, s. 101).
Det foreslås også, at man lemmatiserer relevante grammatiske termer, og især de termer, der bliver
anvendt ved grammatiske angivelser. På denne måde behøver brugeren ikke at søge hjælp andetsteds for
at finde ud af, i hvilke sammenhænge et bestemt ord kan bruges (Bergenholtz & Tarp, 1994, s. 115).
Udover Madsens (1999) og Bergenholtz & Tarps (1994) inddeling af ord, diskuterer Trask (What Is A
Word?) en række andre ordtyper i dybden, som jeg af pladshensyn ikke vil komme nærmere ind på her.
7.1.2 Lemmaselektion
Bergenholtz & Tarp (1994, s. 101-102) diskuterer en række forskellige måder at finde frem til den rette
terminologi på, når man arbejder med enkelte fagområder. Det er dog ikke relevant her, da specialet ikke
omhandler et bestemt fag men en koncerns samlede fagsprog, som spænder over en uudtømmende række
fag og fagområder.
"Det er ikke ualmindeligt, at bilingvale ordbøger bliver vendt, dvs. at Lb-ækvivalenterne [sic] i en La-Lb-
ordbog bliver selekterede til en -Lb-La-ordbog" (Bergenholtz & Tarp, 1994, s. 102), hvilket kun kan anbefales
for ikke-kulturbundne fag. Under alle omstændigheder ved vending af ordbøger skal man sørge for at læse
ordbogen igennem og rydde op i eventuelle enslydende lemmata samt kontrollere ækvivalentrelationer,
diverse forklaringer samt eksempler (Bergenholtz & Tarp, 1994, s. 102).
Normalt udgøres lemmabestanden i fagordbøger af
Martin Christoffersen COWIterm
Side | 18
1) rene termer
2) både rene termer og andre udtryk, som ikke er fællessproglige
3) alle udtryk, om hvilke det antages, at de forekommer regelmæssigt
4) udtryk, som forekommer med en fastlagt mindstefrekvens i et givet fagsprogligt korpus
(Bergenholtz & Tarp, 1994, s. 103)
Ved flerfagsordbøger bliver man nødt til at anvende enten model 2) eller 3), skønt disse "indebærer
introspektive skøn, som ikke sikrer en systematisk og konsekvent selektion" (Bergenholtz & Tarp, 1994, s.
104).
7.1.3 Ækvivalentselektion
"Det er […] af største betydning, at leksikografen har et pålideligt, aktuelt, systematisk
sammensat og lettilgængeligt redskab til sin rådighed, når ækvivalenterne skal udvælges. Et
tekstkorpus, der er sammensat med ovennævnte mål for øje, udgør et sådant redskab"
(Bergenholtz & Tarp, 1994, s. 105-106).
Har man ikke noget korpus til sin rådighed, anbefales det, at man kontrollerer ækvivalenter til brug i en
bilingval ordbog frembragt på anden vis ved at foretage opslag i faglige, monolingvale L2-ordbøger og
eventuelt sammenholde disse resultater med opslag i tilsvarende L1-ordbøger. Giver dette stadig ikke noget
entydigt resultat, må man søge i yderligere materiale såsom lærebøger eller tekster fra producenter,
optimalt set på begge sprog (Bergenholtz & Tarp, 1994, s. 107).
Derudover er der fem procedurer, der bør gennemgås, når der skal selekteres ækvivalenter i korpora:
1) Leksikografen vil via introspektion have kendskab til en række lemmatas ækvivalenter, som så
hurtigt kan verificeres ved søgning i et L2-korpus.
2) Ved tilfælde, hvor man ikke er helt sikker, men alligevel kan afgrænse mulighederne, kan man søge i
korpusset på de muligheder, man mener at have, eventuelt meget gerne med trunkeringer, så man
er sikker på at få alle former og dermed alle sammenhænge med.
3) Hvis ikke en brugbar ækvivalent findes ved hjælp af ovenstående metoder, kan man prøve at søge
på ord i den kontekst, hvori lemmaet står. Dog skal man kun søge på ord, hvor der med stor
sandsynlighed kan antages en enkelt ækvivalent uden heller at søge på for generelle, samt for
sammenhængen uvæsentlige, søgeord.
4) Hvis hverken introspektion, kvalificerede gæt eller sproglig kontekst kan hjælpe en til at finde den
rette ækvivalent, må man skabe sig et overblik over, hvilket produkt teksten omhandler. Herefter
kan man så søge i L2-korpus efter samme produkt og finde termen i en parallel sammenhæng.
5) Denne sidste mulighed for ækvivalentselektion ved hjælp af korpus er forholdsvis tidskrævende og
derfor den sidste udvej. Den indebærer en gennemlæsning af de nærmeste afsnit omkring
forekomsterne af lemmaet og derefter søgning efter andre ord inden for det tema, hvori lemmaet
indgår. De L2-tekster, hvor de fremkomne fund indgår, læses omhyggeligt igennem, indtil man
støder på en parallel tematisk kontekst. Denne metode må anvendes oftest, når der skal udarbejdes
bilingvale ordbøger inden for kulturbundne fag.
(Bergenholtz & Tarp, 1994, s. 107-109)
Martin Christoffersen COWIterm
Side | 19
7.1.4 Mikrostruktur
Mikrostrukturen er den måde, hvorpå selve ordbogsartiklerne er opbygget. Når man slår et ord op,
hvilke forskellige oplysninger kan man så finde, og hvordan er de repræsenteret (Bergenholtz & Tarp, 1994,
s. 216). Det være sig udtale, grammatiske angivelser, faglige og sproglige markeringer, ækvivalent(er),
faglige forklaringer, ordforbindelser, eksempler, synonymer og antonymer samt henvisninger.
Bergenholtz & Tarp (1994) belyser vigtigheden af, at der er system i, i hvilken rækkefølge de forskellige
elementer i en ordbogsartikel bliver præsenteret. Dette kan man gøre ved først at lave et skema over hvilke
informationer, der skal stå hvor i artiklen – blandt andet fordi det ikke er alle informationer, der skal med i
alle artikler. Det kommer an på lemmaet; på både ordklassen (det er jo for eksempel kun verber, der kan
være transitive) og på hvor meget forklaring, lemmaet har brug for. Netop for at sikre, at de forskellige
ordklasser bliver behandlet til fulde – og ens – kan man oprette et artikelskema for hver ordklasse. Dette er
især relevant, hvis man påtænker også at inkludere fleksioner (Bergenholtz & Tarp, 1994, s. 216).
Bergenholtz & Tarp (1994) er her selv lidt ustrukturerede, måske fordi det lange afsnit omkring
mikrostruktur i bogen nærmest er løbende tekst. Jeg vil dog i det følgende prøve at skabe lidt orden i det.
Jeg vil i øvrigt ligeledes kun fokusere på funktionerne oversættelse og produktion, da disse er de primære
funktioner i projektet hos COWI, jævnfør kapitel 6 Ordbogsfunktioner.
Udtaleangivelse er noget, der angives i mange ordbøger, og det kan gøres på forskellige måder alt efter,
hvor detaljeret det skal være. Man kan gøre det i selve lemmaet ved hjælp af trykstreger, eller man kan
danne et separat felt umiddelbart efter lemmaet – før enhver grammatisk angivelse – med fonetisk skrift.
Det samme gør sig selvsagt gældende for en udtaleangivelse for ækvivalenten. Oplysninger om udtale er
ikke direkte relateret til ordbogsfunktionerne oversættelse og produktion, da disse omhandler skrevet
sprog, men det kan alligevel være en fordel at have med, "da kendskab til udtalen for mange mennesker
har en hukommelsesstøttende funktion" (Bergenholtz & Tarp, 1994, s. 136+220).
Grammatiske oplysninger til lemmaet bør "placeres i et grammatisk felt efter lemmaet, men før
ækvivalenten, og grammatiske oplysninger til ækvivalenten bør placeres i et grammatisk felt efter denne"
(Bergenholtz & Tarp, 1994, s. 217). Det bør således altid være sådan, at oplysninger specielt tilhørende
lemmaet kommer umiddelbart efter lemmaet og før ækvivalenten, og at oplysninger specielt tilhørende
ækvivalenten kommer umiddelbart efter ækvivalenten og før eventuelle øvrige oplysninger, der har
relevans for både lemma og ækvivalent.
Bergenholtz & Tarp (1994) angiver de forskellige elementer, som grammatikfeltet kan og i de fleste
tilfælde bør indeholde, hvilke er: ordklasse, køn, morfologi og syntaks. Det er ligeledes vigtigt at
standardisere rækkefølgen af de feltinterne oplysninger indeholdt i grammatikfeltet, da det vil lette
arbejdet for brugeren med at finde de relevante oplysninger (Bergenholtz & Tarp, 1994, s. 217). Især
ved verber skal man passe på ikke at forvirre brugeren; det anbefales således kun at angive
fleksionsmønstre ved uregelmæssige bøjninger, da de regelmæssige bøjninger som regel ikke vil være
noget problem, og derfor kan være forvirrende. Hvis det skulle vise sig, at et forholdsvist kompliceret
grammatisk fænomen går igen ved flere lemmata, kan det være en fordel at oprette – og henvise til
bestemte dele af – en ordbogsgrammatik (Bergenholtz & Tarp, 1994, s. 114-115).
Martin Christoffersen COWIterm
Side | 20
Faglige markeringer til lemmata og/eller ækvivalenter angives oftest som forkortelser, og angiver korte
faglige oplysninger. Der findes to hovedtyper, som defineres som "faglige markeringer, der angiver, hvilket
fagligt tilhørsforhold et lemma/en ækvivalent har, og faglige markeringer, der angiver et sprogligt
semantisk indhold inden for et eller flere fagsprog" (Bergenholtz & Tarp, 1994, s. 226). Disse to hovedtyper
deles yderligere op. Der findes således faglige markeringer, der angiver en bestemt terms faglige eller
delfaglige tilhørsforhold. Især ved polysemi kan den faglige markering også tilkendegive egenskaber ved
den respektive ækvivalent, eventuelt med angivelse af hvilket produkt, materiale eller funktion,
egenskaben dækker. Ligeledes kan den faglige markering "give oplysninger, om det drejer sig om f.eks.
processen eller funktionen, eller om det apparat, der udfører denne proces eller funktion" (Bergenholtz &
Tarp, 1994, s. 155). Endelig kan der angives en faglig norm som en særlig type faglig forklaring, såsom "DS"
(Dansk Standard) og "ISO". Dette kræver dog, at brugeren er bekendt med normen for at kunne få det fulde
udbytte af denne, men fordelen er, at vedkommende kan være sikker på, at han har lokaliseret den rigtige
term (Bergenholtz & Tarp, 1994, s. 154-155+226).
En faglig markering kan have forskellige funktioner, og optimalt set vil den supplere den faglige
forklaring, så den faglige forklaring ikke behøver at indeholde angivelse omkring fagområde. Men den
faglige markering kan også stå i stedet for en faglig forklaring og alligevel være fuldt tilstrækkelig til brug
for visse funktioner (Bergenholtz & Tarp, 1994, s. 156).
De faglige markeringer kan være særdeles nyttige, men de skal bruges med omtanke, og man må altid
tage hensyn til ordbogens funktioner samt brugergruppe: "Er de faglige markeringer korrekt anvendt, vil
en fagmand kunne have stort udbytte af ordbogen i forbindelse med produktion på og reception af et
fremmedsprog, samt i forbindelse med oversættelse til og fra modersmålet" (Bergenholtz & Tarp, 1994,
s. 157). Det anbefales i langt de fleste tilfælde også at inkorporere faglige forklaringer, specielt ved
kulturbundne termer (jævnfør afsnittet om faglige forklaringer nedenfor) (Bergenholtz & Tarp, 1994, s.
157).
Spørgsmålet om, hvornår der skal gives faglige markeringer, er der ikke noget entydigt svar på, men det
anbefales, at man ved flerfaglige ordbøger bringer flest mulige angivelser om fagligt tilhørsforhold. I den
forbindelse, skal man være påpasselig ved udformningen af de forskellige forkortelser, der anvendes
som faglige markeringer. Disse skulle meget gerne være så sigende, at det er muligt at gætte sig til
meningen af dem og altså således, at de fordrer et minimum af opslag til forkortelseslisten i
brugervejledningen (Bergenholtz & Tarp, 1994, s. 158-159).
Til sidst er der spørgsmålet om beskrivelsessproget, som anbefales skrevet på brugerens modersmål,
men i det omfang det kan lade sig gøre, er det en god idé alligevel at anvende internationalismer – især
hvis brugergruppen kan have forskellige modersmål (Bergenholtz & Tarp, 1994, s. 160).
Placeringen af den faglige markering bør være efter eventuelle grammatiske oplysninger, men hvis
termen kan anvendes inden for flere forskellige fag med forskellige betydninger, anvendes
polysemiindeks, og i så fald kan den faglige markering stå enten før eller efter de grammatiske
oplysninger: Hvis de grammatiske oplysninger dækker både lemma samt alle delbetydningerne, placeres
disse umiddelbart efter lemmaet, og altså før den faglige markering, men hvis delbetydningerne har
forskellige grammatiske egenskaber, bør disse placeres efter den faglige markering (Bergenholtz & Tarp,
1994, s. 226-227).
Martin Christoffersen COWIterm
Side | 21
Placeringen af det vel nok mest betydningsfulde element i en bilingval produktions- og
oversættelsesordbog, ækvivalenten – samt rækkefølgen af eventuelt flere ækvivalenter – er ikke så ligetil,
som man ellers kunne foranlediges til at tro.
"Som udgangspunkt kan man sige, at i oversættelses- og produktionsordbøger bør ækvivalentfeltet
placeres forholdsvis tidligt i rækkefølgen af felter, da ækvivalenten her spiller en betydelig rolle"
(Bergenholtz & Tarp, 1994, s. 224). Således undgår man at skulle lede for længe efter ækvivalenten, når
man skal oversætte eller producere et stykke tekst og hurtigt skal have fat i oversættelsen af et bestemt
ord. Men der er også andre faktorer, der spiller ind ved placeringen af ækvivalentfeltet, såsom om der er
tale om kulturbundne eller ikke-kulturbundne fag.
Ved ikke-kulturbundne fag vil forklaringen til lemma og ækvivalent langt oftest være den samme, så her
bør ækvivalenten i en oversættelses- og/eller produktionsordbog stå før forklaringsfeltet, da
forklaringen i så fald vil dække begge termer. Ved kulturbundne fag "vil de faglige forklaringer til mange
lemmata være indholdsmæssigt forskellige fra forklaringerne til ækvivalenterne, for så vidt der
overhovedet findes ækvivalenter" (Bergenholtz & Tarp, 1994, s. 224). I dette tilfælde kan man gøre en af
to ting: Man kan enten give en samlet forklaring, der dækker både lemma og ækvivalent, eller man kan
give dem hver sin forklaring (Bergenholtz & Tarp, 1994, s. 224). Hvis man vælger at give dem hver sin
forklaring, er det vigtigt at placere lemmaets forklaring efter lemmaet og ækvivalentens forklaring efter
ækvivalenten, da der så ikke vil være tvivl om, hvilken forklaring der hører til hvad. Dog bør den faglige
forklaring komme efter eventuelle grammatiske oplysninger og udtaleangivelser (Bergenholtz & Tarp,
1994, s. 225). Det samme gør sig selvsagt gældende ved polyseme lemmata, hvor artiklen, ud over
polysemiindeks, bør struktureres på en sådan måde, at forklaringerne til de enkelte ækvivalenter
kommer umiddelbart efter disse.
I forbindelse med organiseringen af flere ækvivalenter til ét lemma, "er der flere faktorer, der skal tages
hensyn til, bl.a. antallet af ækvivalenter" (Bergenholtz & Tarp, 1994, s. 221). Både monoseme lemmata
og polyseme lemmata kan have flere ækvivalenter på det pågældende sprog. Ved monoseme lemmata
foreslår Bergenholtz & Tarp (1994), at man i de fleste tilfælde samler alle ækvivalenter i
ækvivalentfeltet, men i visse tilfælde kan man også placere blot én ækvivalent i ækvivalentfeltet og de
resterende i synonymfeltet. Der er forskellige omstændigheder, der spiller ind i forbindelse med denne
strukturering og også i forbindelse med hvilken ækvivalent, man i så fald skal placere i ækvivalentfeltet.
Ligeledes, hvis man vælger at placere flere ækvivalenter i ækvivalentfeltet henholdsvis synonymfeltet,
hvordan disse så skal organiseres. Overvejelser, som for eksempel om der i faget, der dækkes, er brug
for stilistisk variation, såsom inden for erhvervskorrespondance, eller om dette ikke kan tilrådes, såsom i
fag inden for teknik, er nogle, leksikografen bliver nødt til at gøre sig. Hvis det er et fag, hvor stilistisk
variation tilskyndes, bør alle ækvivalenter placeres i ækvivalentfeltet, mens man i fag inden for teknik
som regel skal holde samme term gennem hele teksten for at undgå forvirring, og derfor har man kun
behov for en enkelt ækvivalent. Hvad angår organiseringen af ækvivalenterne, kan man benytte en ren
alfabetisk tilgangsmåde og enten placere samtlige ækvivalenter i ækvivalentfeltet i alfabetisk
rækkefølge; eller man kan placere den første ækvivalent i den alfabetiske rækkefølge i ækvivalentfeltet
og de øvrige i synonymfeltet (også i alfabetisk rækkefølge). Denne fremgangsmåde er klart nemmest og
mindst tidskrævende for leksikografen men derimod ikke til så stor hjælp for den ufagkyndige.
Leksikografen kan også vælge at lave en frekvensanalyse på de forskellige ækvivalenter og følgende
Martin Christoffersen COWIterm
Side | 22
placere dem alle i ækvivalentfeltet herefter. Eller man kan placere den ækvivalent med den højeste
frekvens i ækvivalentfeltet og resten i synonymfeltet – enten alfabetisk eller efter frekvens. Til sidst er
der også den mulighed, at leksikografen selv tager stilling til brugen af de forskellige ækvivalenter og
efterfølgende placerer dem herefter (Bergenholtz & Tarp, 1994, s. 221-222).
Det er ikke anbefalelsesværdigt i en fagordbog at placere alle ækvivalenter til polyseme lemmata i
ækvivalentfeltet – i hvert fald ikke uden polysemiindeks samt "en eller anden form for
betydningsadskillende markering" (Bergenholtz & Tarp, 1994, s. 223). Hvis to eller flere ækvivalenter
forefindes inden for samme betydningsadskillende markering, må man gøre sig de samme tanker som
ovenfor (Bergenholtz & Tarp, 1994, s. 222-223). Dog skal man holde sig for øje, at "[u]anset hvilken
løsning man vælger, må rækkefølgen af ækvivalenter hhv. synonymfeltet klart fremgå af ordbogens
brugervejledning" (Bergenholtz & Tarp, 1994, s. 223), hvilket understreger nødvendigheden af en
udførlig brugervejledning til en hvilken som helst ordbog.
Det er blandt andet her, at der kommer til at herske lidt tvivl om rækkefølgen af felter i mikrostrukturen.
I beskrivelsen af både den faglige forklaring og af kollokationsfeltet foreslås, at de hver især placeres
umiddelbart efter det grammatiske felt til ækvivalenten. Jeg vil dog mene, at det mest naturlige vil være
først at få en forklaring på, hvad lemmaet omhandler, så man er sikker på at have fat i det rigtige lemma og
så derefter finde frem til eventuelle kollokationer.
Ved ikke-kulturbundne fag vil det være naturligt at placere den faglige forklaring efter ækvivalenten, da
forklaringen således dækker både lemma og ækvivalent, og det er hurtigere for brugeren at finde
ækvivalenten. Ved kulturbundne fag vil forklaringerne til henholdsvis lemma og ækvivalent ofte være
forskellige, hvorfor man her kan gøre en af to ting. Enten kan man lave én forklaring til lemmaet og én til
ækvivalenten, eller man kan lave en sammenfattende forklaring til både lemma og ækvivalent og indsætte
den efter ækvivalenten. Både ved kulturbundne og ikke-kulturbundne fag fungerer det bedst, hvis den
faglige forklaring står efter eventuelle grammatiske oplysninger og udtaleangivelser. Ved polysemi skal
forklaringerne selvsagt stå logisk, for eksempel med en forklaring af lemma og forklaringer ved hver af
delbetydningerne (Bergenholtz & Tarp, 1994, s. 224-225).
"Det kan […] være meget svært at give nøjagtige retningslinjer for, hvornår der er behov for faglige
forklaringer ved tekstproduktion og oversættelse, da det i høj grad vil afhænge af forudsætningerne hos
den konkrete bruger" (Bergenholtz & Tarp, 1994, s. 146). Det er derimod lettere at give retningslinjer for
mængden af faglige forklaringer, hvis ordbogen tillige intenderer funktionen reception og/eller faglig
indføring i faget. Hvis ordbogen tillige indeholder ord fælles med almensproget, må man gøre op med
sig selv, om det er relevant ligeledes at forklare disse (Bergenholtz & Tarp, 1994, s. 146-147).
Ved faglig indføring har brugeren selvsagt brug for mange flere informationer, end oversætteren og
tekstproducenten har, da man må gå ud fra, at en, der producerer fagtekster, har styr på fagområdet
men at vedkommende har brug for ordbogen som et hukommelsesstøttende værktøj. Oversætteren kan
i princippet oversætte de fleste ord udelukkende ved hjælp af en ækvivalentangivelse, men for at kunne
oversætte en samlet tekst har oversætteren ligeledes brug for i hvert fald et minimum af faglig viden
(Bergenholtz & Tarp, 1994, s. 146).
Martin Christoffersen COWIterm
Side | 23
Alle egentlige termer, som er kendetegnet ved at have deres plads i en fagsystematik (der på den ene
eller anden måde definerer fagområdets grænser), bør forklares. Dette kan enten ske i selve
ordbogsartiklen, hvor termen er lemma, eller – under brug af henvisninger fra og til de respektive
termer – i andre artikler eller såkaldte overbliksartikler. Overbliksartikler er kendetegnede ved at give en
samlet forklaring til relaterede termer. Dette kan være relevant for eksempel i forbindelse med
synonymi og antonymi, underbegreber og overbegreber samt ved ordklasseskift (Bergenholtz & Tarp,
1994, s. 147).
Der er tilfælde, hvor den faglige forklaring leder brugeren hen på det rigtige lemma eller den rigtige
ækvivalent. Dette er tilfældet ved homonymi og polysemi, hvor en faglig forklaring kan være af
altafgørende betydning med hensyn til at vælge den rigtige term (Bergenholtz & Tarp, 1994, s. 148).
Der stilles forskellige krav til den faglige forklaring, alt efter om ordbogen henvender sig til lægfolk eller
fagfolk. En fagmand vil stille krav til en præcis, videnskabelig definition og vil synes, at det meste i en
forklaring udarbejdet til lægfolk vil være overflødigt og banalt (Bergenholtz & Tarp, 1994, s. 148).
Ligeledes er der forskel på, om der er tale om kulturbundne eller ikke-kulturbundne fag, da det især ved
kulturbundne fag kan være relevant at give komparative oplysninger, da der sjældent findes
fuldækvivalens i disse fag (Bergenholtz & Tarp, 1994, s. 151).
Hvad angår stilen, skal man ikke være bange for at variere fra artikel til artikel. Der er artikler, der kan
klare sig med en kortfattet definition, nogle gange bestående af en ufuldstændig sætning uden subjekt
og finit verbum, og der er andre, der kræver længere forklaringer, hvor ufuldstændige sætninger bliver
for besværlige at arbejde med. En varieret stil højner både læseværdigheden samt det æstetiske indtryk
og er dermed at foretrække (Bergenholtz & Tarp, 1994, s. 153).
Det diskuteres kun kort og vagt hvilket sprog, man skal bruge til forklaringssproget; dog nævnes det, at
det som tommelfingerregel bør være brugerens modersmål (Bergenholtz & Tarp, 1994, s. 154).
Efter det grammatiske felt og den faglige forklaring til ækvivalenten er det praktisk at placere
ordforbindelserne, der i øvrigt bør struktureres på en sådan måde, at den ækvivalente ordforbindelse
følger umiddelbart efter ordforbindelsen på udgangssproget. Der skelnes mellem tre typer ordforbindelser:
normal ordforbindelse, som også kaldes kollokation; fast ordforbindelse, som også kaldes idiom; samt
stivnet ordforbindelse, som også kaldes ordsprog eller sentens. De enkelte ord i en stivnet ordforbindelse
kan ikke udskiftes og udgør herved en egen helhed med en bestemt betydning. De faste ordforbindelser
kan der varieres begrænset i og kun i det omfang, der er konvention omkring det. Faste ordforbindelser er
kendetegnet ved, at betydningen af ordforbindelsen ikke kan forklares ved hjælp af summen af de enkelte
ord. Normale ordforbindelser, derimod, kan netop forklares ved hjælp af summen af de enkelte ord
(Bergenholtz & Tarp, 1994, s. 118).
I fagsprog er der som regel mange flerordstermer, og man bliver da nødt til at overveje, hvorvidt disse
flerordstermer samt kollokationer skal lemmatiseres. Der findes fem metoder, hvad angår anførelse af
ordforbindelser i fagordbøger:
1) Lemmatisering af flerordstermer, mens ikke-terminoloigske ordforbindelser (kollokationer) angives
i ordbogsartiklerne.
Martin Christoffersen COWIterm
Side | 24
2) Lemmatisering af både flerordstermer og kollokationer, men ingen angivelse om ordforbindelser i
ordbogsartiklerne
3) Ingen lemmatisering af ordforbindelser, idet alle oplysninger om både flerordstermer og
kollokationer gives i ordbogsartiklerne
4) Flerordstermer og kollokationer både som lemmata og som angivelser i ordbogsartiklerne
5) Implicitte informationer om ordforbindelser i ordbogsartiklernes faglige forklaring eller i anførte
sætningseksempler
Model 1) er den mest fordelagtige for brugeren men ikke for leksikografen, da den kræver mere arbejde
end både 2) og 3) (Bergenholtz & Tarp, 1994, s. 119-121).
Der hersker stor uenighed om definitionen på en kollokation, men det kan siges, at situationen i
fagsprog er lidt anderledes end i det almene sprog. Både i almensprog og i fagsprog er det ikke bare
enhver række ord, der betragtes som kollokationer. I fagsprog kan man endvidere tage udgangspunkt i
et fagligt relevanskriterium, hvilket vil sige, at det nødvendigvis ikke er alle kollokationer i en fagtekst,
der er fagligt relevante. For det første er fællessproglige kollokationer ikke relevante i en fagordbog, og
for det andet kan der også være fagsproglige kollokationer i en fagtekst, som ikke er relevante inden for
lige netop det respektive fagområde (Bergenholtz & Tarp, 1994, s. 118+121-122).
Rent metodisk ved søgning efter kollokationer til en bilingval tovejsfagordbog, har man i praksis tre
muligheder ved anvendelse af korpora:
1) Man kan til L1-L2-ordbogen foretage en selektion af kollokationer i L1-tekster og oversætte disse til
L2, hvorefter man på lignende vis til L2-L1-ordbogen selekterer kollokationer i L2-tekster og
oversætter disse til L1.
2) Man kan nøjes med kun at selektere kollokationerne fra L1-tekster, oversætte disse til L2 og
indarbejde dem i L1-L2-ordbogen. Til L2-L1-ordbogen vendes kollokationerne, hvilket vil sige, at de
selekterede og oversatte L1-L2-kollokationer optages direkte i L2-L1-ordbogen.
3) Til sidst kan man gøre som i 2), blot starter man med at selektere kollokationer fra L2-tekster.
(Bergenholtz & Tarp, 1994, s. 122)
Model 2) og 3) har den fordel, at de er mindre arbejdskrævende end 1), da der kun skal selekteres
kollokationer én gang. Det kan synes ligegyldigt, om man selekterer på det ene eller på det andet sprog,
men nogle fags fagsprog er mere udviklet på nogle sprog end på andre, hvorfor det vil være en fordel at
selektere på disse – inden for faget – mere udviklede sprog. En anden fordel ved 2) og 3) er, at
kollokationsangivelserne bliver helt identiske i de to ordbøger, hvilket i praksis aldrig vil kunne lade sig
gøre ved brug af mulighed 1). Dog kan man risikere, at man ikke vil få hyppigt benyttede kollokationer
på L1 med, hvis man udelukkende søger i L2-tekster, selvom L1-kollokationerne sagtens kan oversættes til
L2 (Bergenholtz & Tarp, 1994, s. 122-123).
Martin Christoffersen COWIterm
Side | 25
Det står klart, at mængden af nødvendige kollokationer hænger sammen med brugerens faglighed og
fremmedsproglige indsigt samt ordbogens intenderede funktioner, jævnfør kapitel 5 Brugergrupper og 6
Ordbogsfunktioner. Den funktion, der fordrer flest kollokationer, er oversættelse og dernæst produktion
af tekster på fremmedsproget (Bergenholtz & Tarp, 1994, s. 123).
Der er oprettet fire brugertyper med forskellige fremmedsproglige og faglige kompetencer (Bergenholtz
& Tarp, 1994, s. 124):
Brugertype 1 har både lille faglig samt lille fremmedsproglig viden
Brugertype 2 har lille faglig men stor fremmedsproglig viden
Brugertype 3 har stor faglig, men lille fremmedsproglig viden
Brugertype 4 har både stor faglig og stor fremmedsproglig viden
Det er uhensigtsmæssigt at sætte især brugertype 1, men også brugertype 2 til oversættelse L1-L2, men i
så fald det hænder, har begge brugertyper brug for mange kollokationer. Brugertype 3 har ligeledes
brug for mange kollokationer. De har godt nok den faglige indsigt men mangler den fremmedsproglige
viden, hvilket til tider kan give et temmelig ubehjælpeligt sprog. Hvis brugertype 4 har kendskab til
fagsproget på fremmedsproget, har de selvsagt brug for mange færre kollokationer end de andre
brugere. Hvis ikke dette er tilfældet, har også denne gruppe brug for mange kollokationer. Ovenstående
gælder ligeledes for produktion på L2 (Bergenholtz & Tarp, 1994, s. 124-126).
Hvordan ordforbindelserne indbyrdes skal organiseres, er der mange bud på, og det nævnes, at man kan
lave en alfabetisk rækkefølge "enten efter kollokationernes første substantiv, adjektiv, verbum, ikke-
funktionsord (artikel), eller kollokationernes mest betydende ord" (Bergenholtz & Tarp, 1994, s. 218). Det
nævnes, at man kan lave en frekvensrelateret organisering af kollokationerne, men samtidig siges det,
at det i oversættelses- og produktionsordbøger (hvilket er funktionerne for COWIterm) er mest normalt
med en alfabetisk organisering (Bergenholtz & Tarp, 1994, s. 118+218). Dog vil det nok være mest
praktisk også at organisere ordforbindelserne således, at de tre typer ligeledes er delt op. Om man så vil
have de stivnede eller de normale ordforbindelser først, må man tage op til overvejelse – men det ville
nok være mest praktisk med de stivnede først, da der højst sandsynligt er færrest af dem (og flest
normale ordforbindelser), og de derfor er nemmere at overskue og skimme igennem for at komme
videre til den næste kategori.
Hvad angår eksempler, foreslår Bergenholtz & Tarp (1994), at de placeres efter kollokationerne. Hvis
eksemplerne er på begge sprog, bør oversættelsen komme lige efter eksemplet på udgangssproget, så det
følger den naturlige rækkefølge lemma-ækvivalent (Bergenholtz & Tarp, 1994, s. 221).
Ofte indeholder faglige forklaringer også eksempler, men disse giver typisk ikke "eksempler på brugen af
det søgte ord, eller … i en anden betydning end den, den faglige forklaring giver" (Bergenholtz & Tarp,
1994, s. 138).
Der skelnes mellem tre forskellige slags eksempler: Belæg, belægseksempler, og kompetenceeksempler.
Belæg er helt uændrede sætninger taget direkte fra en autentisk kilde. De kan være med eller uden
kildeangivelse alt efter ordbogens funktion. Der er den fordel ved belæg, at brugeren kan være helt
sikker på, at det er sådan, den fagsproglige virkelighed ser ud. Da det er autentisk tekst, kan der til
Martin Christoffersen COWIterm
Side | 26
gengæld være indsneget sig en fejl, eller belægget kan give udtryk for en anden sprogbrug end den
gængse (Bergenholtz & Tarp, 1994, s. 140).
Et belægseksempel er dannet ud fra belæg, dog har leksikografen udeladt fagligt og sprogligt irrelevante
dele. Fordelen ved et belægseksempel er, at brugeren ikke skal bruge tid på at gennemlæse de
unødvendige dele og derved udelukkende får relevante informationer. Ulempen er, at det kræver mere
arbejde af leksikografen (Bergenholtz & Tarp, 1994, s. 141).
Til sidst kan leksikografen selv danne eksemplerne. Fordelen ved disse kompetenceeksempler er, at de
er meget tidsbesparende for leksikografen, til gengæld hænder det også, at de let bliver stereotype og
"virker desuden sprogligt uægte, de er ikke ukorrekte, men mangler mange af de implicitte oplysninger,
som kun den autentiske sprogbrug kan give" (Bergenholtz & Tarp, 1994, s. 141). Dette gør sig særligt
gældende i forhold til ordforbindelser, grammatiske forhold samt faglige sammenhænge (Bergenholtz &
Tarp, 1994, s. 141).
I ordbøger tiltænkt som hjælp ved oversættelse bør der som minimum gives L2-eksempler ved L1-
lemmata og omvendt, og gerne både L1- og L2-eksempler, da dette vil hjælpe brugeren. (Bergenholtz &
Tarp, 1994, s. 142).
I bilingvale ordbøger med oversættelse til og tekstproduktion på ækvivalentsproget kan det ikke
anbefales at oversætte L1-eksempler direkte til L2-eksempler. Uanset om der er tale om kulturbundet
eller ikke-kulturbundet fagsprog, vil det være noget nær umuligt for selv den bedste leksikograf at
ramme den rigtige stil ved oversættelse af små deltekster, og en sådan oversættelse vil også tage
uforholdsmæssig lang tid. "I en tovejs-ordbog taler meget derfor for at anbringe Lb-eksempler i la-Lb-
delen og La-eksempler i Lb-La-delen og ikke at oversætte eksempler i nogen af delene" (Bergenholtz &
Tarp, 1994, s. 143).
Synonymer og antonymer bør angives som noget af det sidste i artiklen med synonymiangivelse før
antonymiangivelse. Samme overvejelser angående den feltinterne strukturering gør sig gældende her som
for ækvivalenter (Bergenholtz & Tarp, 1994, s. 219).
I almensproget findes der ikke to ord, der kan siges at være hinandens fulde synonym. "Der vil for to
eller flere synonymer dels være mindre stilistiske forskelle, dels grammatiske forskelle, dels forskellige
kollokative indskrænkninger" (Bergenholtz & Tarp, 1994, s. 128). Der skelnes ligeledes mellem forskellige
former for antonymi, som blandt andet kan deles op i konversion, som vi for eksempel finder i køb –
salg, komplementaritet, som i mandlig – kvindelig, samt relativ modsætning som i stor – lille. I fagsprog
vil det oftest være den relative modsætning, der forekommer, "idet forekomsten af et fænomen
udelukker et eller flere andre fænomener" (Bergenholtz & Tarp, 1994, s. 128). I fagsprog er der ikke
samme krav til variation, som der er i det almene sprog, faktisk tværtimod: Leksikalsk afveksling bør
undgås i rene fagtekster, "da tekstrecipienten ellers måtte tro, at det drejer sig om forskellige
fænomener" (Bergenholtz & Tarp, 1994, s. 128).
Synonymi- og antonymioplysninger i fagordbøger findes
1) eksplicit som en del af den faglige forklaring
2) implicit i den faglige forklaring
Martin Christoffersen COWIterm
Side | 27
3) gennem en henvisning til et andet lemma
4) gennem angivelse af et dobbeltlemma
5) som angivelse efter et synonymisymbol
6) gennem to eller flere ækvivalenter uden adskillende markeringer
Den bedste metode for angivelse af synonymer og antonymer får man ved en kombination af 3) og 5)
(Bergenholtz & Tarp, 1994, s. 129-130).
Synonymi- og – især – antonymiangivelser i en fagordbog bidrager til den generelle indsigt i faget. Dog
er det kun en hjælp ved tekstproduktion, såfremt producenten har et højt fagligt kendskab. Det er først
og fremmest relevant at anføre synonymer og antonymer til lemmaet, hvorimod det kun i få situationer
kan være fordelagtigt at anføre dem til ækvivalenten. Én situation, hvor dette kan være relevant, er, når
lemma og ækvivalent i kraft af fagsproget på de respektive sprog er næsten identiske
internationalismer, hvoraf man ikke kan læse nogen yderligere betydning, hvis ikke man er bekendt med
fagsproget.
Leksikografen kan få afløb for sine frustrationer over at sidde inde med en række forskellige
ækvivalenter ved at angive en enkelt ækvivalent og så resten, eller i hvert fald et par stykker, som
synonymer. Når der på denne måde ikke gives yderligere forklaringer af synonymerne, bør det fremgå af
brugervejledningen, at det er ækvivalenten, der skal anvendes, medmindre brugeren har så stor faglig
kundskab, at vedkommende kan identificere en mere præcis term i synonymrækken (Bergenholtz &
Tarp, 1994, s. 130-131).
Placeringen af feltet til henvisninger bør stå sidst i artiklen. "Henvisninger har til formål at føre brugeren
fra et sted i ordbogen til et andet eller henvise ham til en kilde uden for ordbogen (teknisk norm, citatkilde
osv.)" (Bergenholtz & Tarp, 1994, s. 227). I ordbøger findes der ofte krydshenvisningsartikler, hvor
henvisningen i så fald udgør størstedelen af artiklen. En sådan artikel består som oftest af et lemma, en
grammatisk angivelse og selve henvisningen. I andre artikler med henvisninger fungerer henvisningen som
et supplement til de øvrige oplysninger; hovedsageligt den faglige forklaring. Henvisningsfeltet bør altid
indeholde enten et sprogligt eller et grafisk symbol (se, se også, ->). Ved flere forskellige typer henvisninger
bør det altid være de ordlisteinterne henvisninger, der står først efterfulgt af de ordlisteeksterne
henvisninger.
Hvad angår rækkefølgen inden for den enkelte type henvisning, placeres de ordlisteinterne henvisninger i
alfabetisk rækkefølge, evt. den vigtigste først og så de andre efterfølgende i alfabetisk orden. Hvad angår
de ordlisteeksterne henvisninger, placeres de som regel i numerisk rækkefølge, eftersom de som oftest
refererer til paragraffer i for eksempel brugervejledningen, ordbogsgrammatikken eller en nummereret
kilde i bibliografien (Bergenholtz & Tarp, 1994, s. 227-228). Her kunne det så være relevant at lave en
yderligere opdeling, hvor man skelnede mellem oplysninger til stede direkte i ordbogen – men uden for
ordlisten (brugervejledning, ordbogsgrammatik) – og oplysninger, hvor man blev nødt til at skulle indhente
andet materiale (kilder i bibliografien).
Til sidst kan man til både lemma og ækvivalent, ordforbindelser samt synonymer og antonymer angive
sproglige markeringer, jævnfør Bergenholtz & Tarp (1994, s. 133). De mest relevante for fagordbøger er de
Martin Christoffersen COWIterm
Side | 28
diakrone, diatopiske samt de diafrekvente angivelser, medmindre der er tale om fagordbøger, der
intenderer også at inkludere talt fagsprog eller 'værkstedssprog', eller der er tale om fagordbøger, der
dækker et fag, der har mange overlapninger til almensproget (som eksempelvis handelskorrespondance). I
stedet for disse standardiserede markører anbefales det at indarbejde oplysninger om påfaldende
sprogbrug direkte i den faglige forklaring (Bergenholtz & Tarp, 1994, s. 135).
Tillige er det relevant at udnytte mulighederne inden for det online medium i forbindelse med
mikrostrukturen, hvilke vil blive diskuteret og belyst i underkapitel 7.3 Elektronisk virksomhedsleksikografi.
7.1.5 Makrostruktur
Traditionelt er der forskellige måder, hvorpå man kan systematisere selve ordlisterne. Dette kaldes for
makrostrukturen, og det kan foregå alfabetisk, som kan være glatalfabetisk eller i henhold til niche- eller
redeprincippet; eller systematisk, altså ved hjælp af en fagsystematik (Bergenholtz & Tarp, 1994, s. 11).
Nedenfor vil jeg kort diskutere denne traditionelle metode, hvorpå man opbygger makrostrukturen. En
diskussion af en moderne og onlinetilpasset makrostruktur følger i underkapitel 7.3.1 Elektronisk
makrostruktur.
7.1.5.1 Alfabetisk makrostruktur
Tilgangsalfabetet i en ordbog er det alfabet, der bliver brugt til at alfabetisere lemmata. Det er ofte, men
ikke altid, lig med et sprogs normale alfabet og kan derudover indeholde tal samt forskellige tegn, som det
er vigtigt at forholde sig til, hvad angår placering i forhold til hinanden og i forhold til bogstaverne i sprogets
normale alfabet (Bergenholtz & Tarp, 1994, s. 206). Igen understreges vigtigheden af en udførlig
brugervejledning: "[U]anset hvorledes rækkefølgen af bogstaver og tegn (grafemer) er i et konkret
tilgangsalfabet, bør dette altid være angivet i brugervejledningen, hvis tilgangsalfabetet ikke er identisk
med det almindelige alfabet for lemmatas sprog" (Bergenholtz & Tarp, 1994, s. 207).
Når først tilgangsalfabetet er blevet fastlagt, skal der tages stilling til, om man vil alfabetisere efter
bogstav for bogstav-metoden eller ord for ord-metoden; "[h]vis man alfabetiserer efter bogstav-for-
bogstav metoden [sic] er det kun bogstaverne henholdsvis grafemerne i grafemrækkefølgen, der har
betydning. Der tages således ingen hensyn til mellemrum i flerordslemmata" (Bergenholtz & Tarp, 1994, s.
208). Hvis man derimod vælger ord for ord-metoden, vil mellemrummet, også kaldet blanktegn, som regel
være det første tegn i tilgangsalfabetet (selvom dette måske ikke altid står i brugervejledningen – dog bør
der stå, om det er bogstav for bogstav- eller ord for ord-metoden, der anvendes) (Bergenholtz & Tarp,
1994, s. 208). Fordelen ved at anvende ord for ord-metoden frem for bogstav for bogstav-metoden er, at
"alle flerordslemmata, som begynder med samme ord, og som indgår i identiske betydningsforhold,
placeres efter hinanden, uden at denne rækkefølge brydes af et eller flere lemmata med helt andre
betydninger" (Bergenholtz & Tarp, 1994, s. 208).
Endelig kan en alfabetisk makrostruktur enten være glatalfabetisk, nichealfabetisk eller redealfabetisk,
og de vil alle her blive beskrevet kort. En glatalfabetisk ordliste er en ordliste, hvor hvert enkelt lemma har
fået tildelt sin egen artikel. Der er ikke nogen tilhørende sublemmata, det vil sige, at andre lemmata ikke er
'gemt væk' under samme artikel (Bergenholtz & Tarp, 1994, s. 209).
I en nichealfabetisk ordliste samles lemmata i nicher, hvor et enkelt lemma er nicheindgangslemma til
en række nichelemmata, som kan anføres som dellemmata, der består af et pladssymbol (som regel ~ eller
Martin Christoffersen COWIterm
Side | 29
-), som symboliserer den del af nichelemmaet, der udgøres af hele eller en del af nicheindgangslemmaet
efterfulgt af resten af grafemstrengen til nichelemmaet (Bergenholtz & Tarp, 1994, s. 209-210).
Hvis man vælger en redealfabetisk struktur er det for at "bevare sammenhængen mellem lemmata, som
indeholder samme ordstamme" (Bergenholtz & Tarp, 1994, s. 210), og med sådan en struktur er det altså
tilladt at bryde med tilgangsalfabetet. Det er dog kun tilladt for redelemmata at bryde tilgangsalfabetets
rækkefølge, ikke for redeindgangslemmata. Der gælder i øvrigt de samme betragtninger som ved
nichestrukturen ovenfor, hvad angår dellemmata (Bergenholtz & Tarp, 1994, s. 210).
Bergenholtz & Tarps (1994) argumentation for at vælge enten niche- eller redestrukturen er
pladsbesparelse. Dette er knapt så relevant, når informationerne kommer op på en skærm og ligger på en
harddisk. Desuden vil det være mere besværligt både at programmere samt at sætte pænt op blandt andet
med hensyn til søgefunktioner, hvis man skulle have fat i et niche- eller redelemma. Der vil af disse grunde i
det følgende ikke yderligere tages hensyn til hverken niche- eller redeprincippet.
7.1.5.2 Systematisk makrostruktur
Ved den alfabetiske ordning er det sproglige tegns udtryksside det centrale udgangspunkt,
hvorimod indholdssiden står i centrum ved den systematiske ordning. I sidstnævnte foreligger
en ordning efter begrebssystemer på grundlag af definitioner, der bl.a. tjener til at afgrænse
dem i forhold til i hinanden og fastslå de indbyrdes relationer. (Bergenholtz & Tarp, 1994, s.
212)
Det vil sige, at det er hierarkiske konstruktioner, der definerer over-, under- og sidebegreber, hvilket gør,
at man hurtigt kan få et overblik over de respektive termers indbyrdes forhold, og selve artiklerne uddyber
disse samt termernes definitioner. Sådanne konstruktioner kan sættes op grafisk med streger mellem over-
og underbegreber samt ved hjælp af såkaldte notationssystemer med tal og punktummer, hvor der for hver
underordning tilføjes en decimal. Der skal dog altid i en ordbog opbygget efter det systematiske princip
indeholdes et alfabetisk register, der sikrer, at man kan finde den relevante term uden at skulle bladre frem
og tilbage mellem de forskellige fagområder og hierarkiske konstruktioner (Bergenholtz & Tarp, 1994, s.
212-213); jævnfør også Madsen (1999).
Man kan kombinere alfabetisk og systematisk struktur på mange forskellige måder, blandt andet ved at
lade hovedstrukturen være systematisk, for eksempel inddelt efter temaer, men opdele lemmata inden for
de enkelte temaer alfabetisk (Bergenholtz & Tarp, 1994, s. 214). Et andet, konkret, eksempel, Bergenholtz
& Tarp (1994) nævner, er en makrostrukturelt alfabetisk ordnet fransk-dansk/engelsk-dansk/tysk-dansk
retsplejeordbog, hvor artiklerne indeholder henvisninger til over-, under- og sideordnede begreber: "Der er
således tale om en ordbog med alfabetisk makrostruktur, men hvis tilblivelse bygger på en strukturering af
begreberne i begrebssystemer" (Bergenholtz & Tarp, 1994, s. 214)
Bergenholtz & Tarp (1994) nævner, at ordbøger generelt oftest er ordnet alfabetisk – dels på grund af
det store og tidskrævende arbejde det er at lave udtømmende begrebssystemer – men at den systematiske
makrostruktur er mest udbredt inden for de naturvidenskabelige, det vil sige de ikke-kulturbundne, fag.
Martin Christoffersen COWIterm
Side | 30
7.2 Terminologi I introduktionen til teorien om terminologi kom jeg ind på, at indholdet af en term er et fagligt begreb,
som igen består af karakteristiske træk. Disse karakteristiske træk kan for eksempel være "formål, funktion,
konstruktion, bestanddele, placering og oprindelse" (Madsen, 1999, s. 17). Nogle karakteristiske træk er
adskillende, det vil sige, at de definerer indholdet i et begreb i modsætning til supplerende træk, der ikke er
afgørende for begrebet. Det er de adskillende træk, man tager med i en definition, hvorimod de
supplerende træk ikke er nødvendige for at definere begrebet, om end det i visse tilfælde kan lette
brugerens forståelse. Det er de karakteristiske træk, der anvendes ved udarbejdelse af begrebssystemer
såvel som ved definitioner (Madsen, 1999, s. 17+52). Se Madsen (1999, s. 53) for en inddeling af
hovedtyper af karakteristiske træk.
Forskellige begreber kan godt have ens udtryk. Dette eksemplificeres for eksempel ved udtrykket hane,
som har minimum tre betydninger: inden for områderne vvs, ornitologi og skydevåben. Men selvom
udtrykkene er ens, er der her stadig tale om tre forskellige termer, da der er tale om tre forskellige
begrebsindhold (Madsen, 1999, s. 17).
For at uddybe begreberne intension og ekstension kan man sige, at "intensionen udpeger en mængde af
referenter (begrebets ekstension), og ekstensionen er mængden af de entiteter, som en term refererer til"
(Madsen, 1999, s. 18).
7.2.1 Begrebssystemer
Når man skal udarbejde fagordbøger, der dækker ét eller få fag(områder), er det ideelt med en
systematisk arbejdsmetode til udarbejdelse af begrebssystemer, "hvorved relationerne mellem de
forskellige begreber bestemmes, og der skabes et grundlag for udarbejdelse af hensigtsmæssige
definitioner" (Madsen, 1999, s. 20). Der findes imidlertid forskellige relationsarter i forbindelse med
begrebssystemer. De mest almindelige er de hierarkiske relationer, som underopdeles i generiske og del-
helheds-relationer. Af de ikke-hierarkiske relationer er de temporale relationer de mest anvendte. Disse,
samt andre knapt så hyppigt forekommende relationer, vil kort blive beskrevet nedenfor.
"Der består en generisk relation mellem over- og underbegreber, hvor underbegreber er typer af et
overbegreb" (Madsen, 1999, s. 21). Det vil sige, at et underbegreb skal arve samtlige af overbegrebets træk
samt mindst ét ekstra træk, der udover at adskille det fra overbegrebet tillige adskiller det fra eventuelle
sideordnede begreber (Madsen, 1999, s. 21).
"Der består en del-helheds-relation mellem begreber, som refererer til en helhed og dens bestanddele"
(Madsen, 1999, s. 22). Underbegrebet er altså en del af overbegrebet, som dækker over helheden. Del-
helheds-relationer kan endvidere inddeles i bestanddelsrelationer, opdelingsrelationer, materialerelationer
samt mængde-element-relationer (Madsen, 1999, s. 23).
Bestanddelsrelationer er karakteriserede ved dels at der er fysisk kontakt mellem de entiteter,
begreberne refererer til, og ved dels at være "en helhed og dennes funktionelt forskellige bestanddele,
f.eks. et legeme og arme, ben, etc." (Madsen, 1999, s. 23).
En opdelingsrelation består mellem begreber, "der refererer til en helhed og de dele, der fremkommer
ved en deleoperation" (Madsen, 1999, s. 23), og som eksempel nævner Madsen (1999, s. 23) relationen
mellem skive og brød.
Martin Christoffersen COWIterm
Side | 31
Et eksempel på en materialerelation kan være den mellem bog og papir, da den repræsenterer "en
entitet og det materiale (eller de materialekomponenter), som indgår i entiteten" (Madsen, 1999, s. 23-
24). Herunder hører også relationer "mellem begreber, som refererer til en helhed og de ingredienser,
som indgår i helheden" (Madsen, 1999, s. 23).
En anden type del-helheds-relationer er mængde-element-relationerne, hvor underbegrebet, i stedet
for at referere til en egentlig bestanddel, refererer til en "entitet som indgår i eller hører til den entitet
som overbegrebet refererer til" (Madsen, 1999, s. 24). Som eksempel nævner Madsen (1999, s. 24)
blandt andre relationen mellem alfabetet og bogstaverne og mellem en forening og dens medlemmer.
Til sidst nævner Madsen (1999, s. 24) også en omslutningsrelation, der som sådan ikke er en del af del-
helheds-relationerne, men som i hvert fald er snævert forbundet hermed. Som eksempel nævner hun
en møllehat, der omgiver de forskellige elementer, men alt efter hvordan man betragter det, kan man
tale om to begreber, "nemlig møllehat i betydningen 'skal' samt i betydningen 'den enhed som består af
alle de øvrige elementer, inklusive skallen'" (Madsen, 1999, s. 24).
Temporale relationer "bruges til at karakterisere forholdet mellem begreber i en proces, et forløb e.l."
(Madsen, 1999, s. 25). Som eksempel nævnes en vaskeproces og de dertil hørende faser. Ved temporale
relationer taler man ikke om over- og underbegreber, da man ikke kan opbygge hierarkiske konstruktioner.
Man taler derfor om forudgående og efterfølgende begreber (Madsen, 1999, s. 25). For at understrege, at
det ofte er muligt at opfatte tingene på flere måder, anføres det, at de forskellige faser i en vaskeproces
også kan beskrives som en del-helheds-relation med vask som overbegreb (Madsen, 1999, s. 25).
Madsen (1999) beskriver tillige kort en del andre relationsarter, men dem vil jeg ikke komme nærmere
ind på her; de fleste relaterer sig til den temporale relation.
For yderligere omkring opbygning og inddelingskriterier af begrebssystemer, se Madsen (1999, s. 27-51).
7.2.2 Definitioner
"For terminologen er det nødvendigt at bestemme hvilke træk, der karakteriserer et begreb, således at
det kan placeres korrekt i forhold til andre begreber i et begrebssystem og dermed adskilles fra disse"
(Madsen, 1999, s. 74). Det er tillige nødvendigt at udarbejde definitioner, hvis terminologen skal kunne
vurdere, om der er tale om ækvivalens mellem begreber på forskellige sprog. Definitioner er for en bruger
af en termbase relevante i forbindelse med forståelsen af tekster, mens de for en oversætter kan være
afgørende for forståelsen og dermed korrekt oversættelse af tekster. Hvis der for eksempel kun er delvis
ækvivalens, kan oversætteren bruge definitionerne til at afgøre, om det er den rette term at benytte i den
pågældende situation (Madsen, 1999, s. 74).
Der kan være forskellige definitioner i forskellige kilder, og i den situation må terminologen i kontakt
med en eller flere fageksperter for at få afklaret tvetydigheden. Tillige er det mest hensigtsmæssigt, hvis
definitioner, der hentes fra forskellige kilder ensrettes og harmoniseres, for "[h]vis definitioner er udformet
på forskellig måde, medfører det uklarhed og dermed forvirring hos brugeren" (Madsen, 1999, s. 75).
I forbindelse med definitioner benyttes en bestemt terminologi. Det begreb, der defineres, kaldes
således definiendum, mens betydningsbeskrivelsen kaldes definiens. Definitor er betegnelsen for det tegn
Martin Christoffersen COWIterm
Side | 32
(for eksempel et kolon eller et lighedstegn) eller verbale udtryk (for eksempel "er" eller "består af"), der
står mellem definiendum og definiens (Madsen, 1999, s. 75).
7.2.2.1 Definitionsmetoder
Der findes en række forskellige definitionsmetoder, og der vil i det følgende fortrinsvist blive fokuseret
på analysemetoden, da den anføres som den mest hensigtsmæssige. Sekundært vil jeg komme ind på et
par af de andre metoder. Analysemetoden bygger på en analyse af begrebets karakteristiske træk, og til
denne metode regnes indholds-, omfangs- samt bestanddelsdefinitioner (Madsen, 1999, s. 76)
Indholdsdefinitioner kaldes også intensionelle definitioner og består ideelt set af en anførelse af det
nærmeste overbegreb og dernæst af de træk, der adskiller begrebet fra sideordnede begreber. Som det
kan udledes af dette, skal der udarbejdes et begrebssystem for at kunne danne en definition, da man ellers
ikke kan være sikker på at kende nærmeste overbegreb. I definitionen skal ikke indgå en definition af
overbegrebet. I fald man har brug for en sådan, må man finde overbegrebets ordbogsartikel for at se hvilke
træk, der er tale om. Ved begreber, der har to eller flere sideordnede overbegreber, skal de alle anføres i
starten af definitionen. (Madsen, 1999, s. 76-77+80).
Det diskuteres, hvor snævert man skal definere, idet der på denne måde kan komme flere forskellige
definitioner af samme begreb, hvis det indgår i forskellige sammenhænge. Dette kræver dog af
terminologen, at vedkommende skal sætte sig ind i eventuelle andre fagområder, som begrebet kan
relateres til, hvilket er både tidskrævende og uhensigtsmæssigt (Madsen, 1999, s. 81).
Definitioner, der udelukkende består af anførelse af overbegrebet regnes også som en
indholdsdefinition. Det er dog ikke tilstrækkeligt ved faglige begreber, da man således ikke kan skelne
det fra sideordnede begreber (Madsen, 1999, s. 81).
Indholdsdefinitioner, som anfører et overbegreb samt adskillende træk, betegnes som den eneste
rigtige definitionsmetode, da man "[k]un vha. denne metode får […] forståelse for en terms betydning,
hvilket bl.a. giver mulighed for at konstatere, om to begreber på forskellige sprog er ækvivalente"
(Madsen, 1999, s. 82)
Ved omfangsdefinitioner (som også kaldes ekstensionelle definitioner), anføres alle de underbegreber,
der refererer til begrebets ekstension. Det er altså ikke karakteristiske træk, der nævnes i denne
definitionsform men udelukkende typer af det pågældende begreb. Det gør det således svært for en
bruger, der ikke er fortrolig med faget at sætte sig ind i, hvad et bestemt begreb betyder især ved
kulturbundne fag. Ligeledes er det svært og tidskrævende for terminologen at udarbejde sådanne
definitioner, da samtlige underbegreber skal med. Hvis bare et enkelt underbegreb udelades, som brugeren
kender til, vil brugeren forvirres og undre sig over definitionen på dette (Madsen, 1999, s. 82-83). Desuden
må man formode, at ordbogens andre artikler i så tilfælde falder i troværdighed.
Ved bestanddelsdefinitioner "opregnes alle de begreber, som refererer til de bestanddele, som indgår i
den helhed, hvortil helhedsbegrebet refererer" (Madsen, 1999, s. 83). Denne definition er uhensigtsmæssig
på samme måde som omfangsdefinitionerne, da det bliver et problem for terminologen at udarbejde og for
brugeren at forstå sådanne definitioner af ukendte eller komplicerede begreber (Madsen, 1999, s. 83).
Martin Christoffersen COWIterm
Side | 33
Udover analysemetoden findes blandt andre også syntesemetoden, men der findes forskellige
definitioner på og eksempler til denne metode. Ifølge Frandsen (1982) (citeret i Madsen (1999)) er det mest
karakteristiske træk ved syntesemetoden, at der ikke anføres noget overbegreb. Derimod indledes det
"med et begreb, 'som har et vist mål af karakteristiske træk fælles med definiendum, men hvor forholdet
ikke er nærmere undersøgt'" (Madsen, 1999, s. 85) (Frandsen, 1982). Sådanne definitioner betragter
Madsen (1999) dog som efter analysemetoden, og det vil jeg også gøre. Det anbefales så vidt muligt at
indarbejde nærmeste overbegreb i starten af definitionen (Madsen, 1999, s. 85).
Den implikative metode (også kaldet kontektsmetoden) består af et stykke tekst, som kan være taget
direkte ud af den empiriske basis for den terminologiske behandling af fagområdet, og som indeholder
oplysninger af forklarende art om begrebet.
7.2.2.2 Regler for udarbejdelse af definitioner1
Først og fremmest skal definitioner være korte og enkle. Hermed forstås at de så vidt muligt ikke består
af mere end én sætning, og at de afsluttes uden punktum. Desuden anbefales det også at starte med lille
begyndelsesbogstav. Der skal tages hensyn til brugergruppen under udarbejdelse af definitionerne, hvilket i
dette tilfælde vil sige fageksperter og sprogmedarbejdere. Fageksperter har som oftest brug for færre
oplysninger end andre, og hvad angår sprogmedarbejderne, skal man passe på ikke at inkludere for
specifikke faglige oplysninger, da de så vil have svært ved at forstå definitionen. Både for fagfolk og
oversættere gælder det, at definitioner skal være klare, hvilket vil sige, at de så vidt muligt ikke bør
indeholde fagspecifikke termer, og at disse i så fald skal være defineret andetsteds i ordbogen. Alternativt
kan man give en forklaring på termen direkte i definitionen for eksempel ved hjælp af en indskudt eller
parentetisk sætning.
Inden for et overordnet emne kan visse begreber optræde i såkaldte begrænsede anvendelsesområder,
hvilket i så fald fremgå af selve definitionen.
Definitioner i samme ordbog bør være konsistente, hvilket vil sige ens i opbygning og begreberne bør
"afgrænses klart i forhold til hinanden, og de må ikke være indbyrdes modsigende" (Madsen, 1999, s. 92).
Det kan for eksempel være forvirrende, hvis to sideordnede begreber er defineret på forskellig vis såsom
ved to forskellige typer træk.
En definition må hverken være for snæver eller for bred, da den så ikke dækker den pågældende term
præcist. En for snæver definition vil på denne måde måske dække et underbegreb til den pågældende term
(selvom man ikke har intentioner om at indlemme et sådant underbegreb), og på samme måde kan en for
bred term dække flere vidt forskellige både over- og sideordnede begreber. Ligeledes skal man passe på
ikke at lave cirkeldefinitioner, hvilke kan forekomme både mellem to definitioner men også inden for
samme definition. Ifølge Madsen (1999) er der en cirkeldefinition, når der i en definition "defineres et
begreb direkte eller indirekte ved begrebet selv" (s. 93).
Det siger sig selv, at definitioner skal være præcise, hvilket vil sige, at de ikke bør indeholde vage eller
vurderende sammenlignende oplysninger, og man bør undgå at beskrive, hvad et begreb ikke er.
1 Dette punkt er udarbejdet på grundlag af Madsen (1999, s. 88-95).
Martin Christoffersen COWIterm
Side | 34
Alle disse anbefalinger overholdes nemmest ved at gå frem efter indholdsdefinitionsmetoden, der, som
tidligere nævnt, er den mest anvendelige for både bruger og terminolog.
7.2.3 Dannelse af og krav til fagudtryk
Madsen (1999) gennemgår, "hvorledes termer dannes, og hvilke krav man må stille ved termdannelse og
termudvælgelse" (s. 97), og dette vil jeg se nærmere på nedenfor.
Det hænder, om end sjældent, at terminologen skal være med til at danne helt nye fagudtryk. Som
oftest skal vedkommende i stedet overveje hvilket synonymt udtryk, der er relevant i den pågældende
forbindelse. Terminologiarbejde kan være enten deskriptivt eller normativt, hvilket vil sige, at terminologen
ved uoverensstemmelse mellem definitioner af et bestemt begreb kan vælge enten at beskrive forskellene,
eller vedkommende kan beslutte sig for en bestemt opfattelse, der følgende vil ligge til grund for det videre
arbejde med artiklerne. Den normative metode anvendes, når for eksempel Dansk Standard skal
standardisere terminologi, hvor der normalt kun vil være angivet ét udtryk, højst med ét synonym, samt en
opremsning af de frarådede udtryk. Fordelen ved standardiseret faglig terminologi er, at det letter
kommunikationen, og da der ikke er de samme krav til variation som til almensproget, skal man ikke tage
hensyn til dette (Madsen, 1999, s. 97-98).
7.2.3.1 Krav til fagudtryk
Et fagudtryk skal være selvforklarende, systemrigtigt (dvs. i overensstemmelse med det
begrebssystem, hvori det hører hjemme), endvidere kort, præcist, gængs,
afledningsproduktivt og i overensstemmelse med det pågældende sprogs grammatiske og
ortografiske regler. Fagudtrykket må ikke være pleonastisk (PIN-nummer, nyrenoveret), ikke
flertydigt (dvs. ikke være et homonym eller polysem), helst ikke have synonymer, og det skal
vælges således, at der tages hensyn til international ensartethed. (Madsen, 1999, s. 110)
At overholde disse retningslinjer på én gang er noget nær umuligt, og derfor er det ofte nødvendigt med
en prioritering af hvilke krav, der går forud for andre.
Et selvforklarende udtryk skal så vidt muligt ved hjælp af de enkelte elementer, som udtrykket består
af, afspejle begrebets kendetegnende, karakteristiske træk. Ligeledes bør der så vidt muligt være
overensstemmelse mellem definitionen og de træk, der fremgår af udtrykkets enkelte elementer. Det
anbefales ofte at anvende såkaldte iboende træk ved udarbejdelse af fagudtryk, men Madsen (1999, s. 111)
pointerer, at det ofte er bedre at anvende træk såsom formål og funktion i stedet.
Fagudtryk skal så vidt muligt afspejle begrebernes generiske begrebsrelationer og således være
systemrigtige, hvilket vil sige, at det semantisk overordnede element så vidt muligt skal svare til
overbegrebet. Dette har dog i praksis ofte kun relevans for generiske relationer (Madsen, 1999, s. 111).
Fagudtryk skal være så korte som muligt uden dog derved at skære noget af udtrykkets væsentligste
træk væk. Dette vil også sige, at et udtryk skal være så præcist, at det indeholder samtlige de træk, der
adskiller begrebet fra andre begreber (Madsen, 1999, s. 113).
"Kravet om at bevare gængse fagudtryk konkurrerer […] med kravet om gennemskuelighed" (Madsen,
1999, s. 114) (min fremhævning), da det hænder, at udviklingen gør visse udtryk forældede; som eksempel
nævnes blyant. Problemet er, at hvis udtrykket er så indprentet i sprogbrugen hos folk, som for eksempel
Martin Christoffersen COWIterm
Side | 35
blyant, kan det være overordentligt svært og uhensigtsmæssigt at prøve at ændre det (Madsen, 1999, s.
114).
Fagudtryk skal være i overensstemmelse med de til enhver tid gældende regler for ortografi og
grammatik på det pågældende sprog. Som eksempel nævnes en term, som oftest findes som enten aktivt
slam anlæg eller aktivt slamanlæg. Selvom den sidste skrivemåde er i overensstemmelse med
retningsskrivningsreglen om, at "[h]vis en ordforbindelse udtales med hovedtryk (stærkt tryk) på det første
led og bitryk (svagere tryk) på det andet, skrives forbindelsen i ét ord" (Sprognævn & Litteraturselskab,
2007), er begge skrivemåder stadig forkerte, da det ikke, som man ellers kunne foranlediges til at tro ud fra
den sidste skrivemåde, er anlægget, men slammet, der er aktivt. Derfor foreslås det at anvende aktivt slam-
anlæg (med bindestreg) i stedet, da bindestregen viser, at det er slammet og ikke anlægget, der er aktivt
(Madsen, 1999, s. 116).
Det anbefales så vidt muligt at anvende nationale fagudtryk frem for fremmedsproglige, selvom dette
kan stride mod, at fagudtryk skal være gængse. Det hører dog heller ikke til sjældenhederne, at dette krav
tilsidesættes, jævnfør fagområderne elektronik og computere (Madsen, 1999, s. 116).
Ligeledes skal et fagudtryk helst være afledningsproduktivt, da det således kan indsættes i flere
sammenhænge. Således er fx natursprog mere afledningsproduktivt end naturligt sprog. Fagudtryk følger
generelt almenudtryks bøjningsregler, men der er i fagsproget visse undtagelser, især hvad angår udtryk,
som også indgår i almensproget såsom svejst og skruetrækkerindsatse. Ligeledes adskiller homografer sig
ofte fra hinanden ved at skifte køn (Madsen, 1999, s. 116).
Ligesom Bergenholtz & Tarp (1994) anbefaler Madsen også brugen af internationalismer dog med den
problemstilling, at det strider imod kravet om at anvende nationale udtryk (1999, s. 117).
Ét begreb bør kun have ét udtryk med én betydning, hvilket kaldes enentydighed. Dette er vanskeligt at
efterleve, og eventuelle synonymer bør medtages i termbasen/ordbogen med anførelse af hvilket udtryk,
der anbefales samt anførelse af frarådede udtryk. Der gælder således også, at homonymi og polysemi bør
undgås (Madsen, 1999, s. 117).
Martin Christoffersen COWIterm
Side | 36
7.3 Elektronisk virksomhedsleksikografi Størstedelen af leksikografisk teori udformet til papirordbøger er stadig yderst relevant, selvom der er
tale om et medieskift fra papir til et elektronisk onlinemedium. Men som det vil blive tydeliggjort af det
følgende, tilbyder det nye medium betydelige forbedringer og nye muligheder, hvad angår
brugermedbestemmelse i forbindelse med organisering og opbygning af mikrostrukturen samt mulige
brugertilgange til makrostrukturen.
7.3.1 Elektronisk makrostruktur
[I]t is questionable whether we can talk about a macrostructure in the traditional sense, as
the TeleLex database [...] makes it almost irrelevant to talk about the physical location and
arrangement of data in a constantly changing and highly dynamic lemma list. (Simonsen,
2002, s. 226)
TeleLex, som Simonsen her refererer til, er en onlineordbog, der blev udviklet til TDC i forbindelse med
et erhvervsforskerprojekt, jævnfør Simonsen (2002).
Dette citat anskueliggør, hvordan der i moderne elektronisk og online leksikografi ikke er tale om
makrostruktur i betydningen, hvordan data er opstillet og sorteret, men at det, som Burke (1998)
diskuterer, snarere drejer sig om søgemuligheder.
Som både Simonsen (2002) og Burke (1998) diskuterer og viser, kan brugeren af en onlineordbog, alt
efter hvordan programmeringen er udført (hvilket er uden for dette speciales område), arrangere og
skræddersy søgemetoden nøjagtigt som vedkommende ønsker det. Til TeleLex er for eksempel udviklet en
søgemetode, hvor brugerne kan kombinere den alfabetiske søgemetode med søgning efter fag, jævnfør
Simonsen (2002).
Burke (1998) fortsætter med at udforske de forskellige muligheder og lister en lang række muligheder,
som han har fundet frem til, at leksikografer og forlag i forening har vurderet, at der var brugere til. Han
konkluderer i den forbindelse, at det i onlineordbøger burde gøres muligt at søge på blandt andet
ordformer og -klasser, en bestemt endelse, dialekter, sprogbrug (juridisk, teknisk, økonomisk, forskellige
former for jargon og slang med mere), antal stavelser samt om et ord indeholder et eller flere bestemt(e)
bogstav(er). Samtidig siger han dog, at det skal vurderes ved hver enkelt ordbog hvilke søgemuligheder, der
er relevante: "It has to be decided on a lexicon-by-lexicon basis what aspects of the content of entries is
worth encoding so as to be searchable" (Burke, 1998). De valg, man foretager, skal således understøtte
ordbogens funktioner i prioriteret rækkefølge.
Burke (1998) argumenterer tillige for en søgemetode, der dels henviser brugeren til lemmata, der ligner
det søgte, i tilfælde hvor søgningen giver nul resultater, samt på lignende vis henviser brugeren til det
ubøjede lemma, der er forklaret i ordbogen, i tilfælde hvor vedkommende har slået en bøjet form op. Dette
er specielt relevant i bilingvale ordbøger, da ikke-indfødte brugere af det pågældende sprog ofte har
ringere kendskab til sproglige og metasproglige regler på sproget end indfødte (Burke, 1998). Dette gælder
særligt fagsprog, da almensproglige ord ofte, som allerede nævnt under punkt 7.2.3.1 om krav til fagudtryk,
optages i fagsproglige sammenhæng med ændrede bøjningsformer eller kønsskifte.
Martin Christoffersen COWIterm
Side | 37
Se i øvrigt diskussionen omhandlende stemming i Burke (1998), hvor den betydning, der vedrører
elektroniske ordbøger, anvendes her, og ikke den, der vedrører computational morphology.
Simonsen (2007) diskuterer og anvender to modeller, som han kalder for leksikografisk
konvergensmodel (første gang anvendt i Simonsen (2002), men nu væsentligt videreudviklet og forbedret)
henholdsvis leksikografisk dokumentskabelon og anskueliggør således, hvordan det er muligt at
implementere dels data fra internettet såvel som fra intranettet og dels dokumentskabeloner og
trækstrukturer for forskellige tekstgenrer i forbindelse med søgning.
Den leksikografiske konvergensmodel gør det muligt direkte fra ordbogen at søge efter data 1) på
internettet, fra for eksempel Google; 2) på virksomhedens intranet; 3) i nationale korpora (fra begge
sprogområder, hvis det drejer sig om en bilingval ordbog); 4) i virksomhedens korpora. Den leksikografiske
dokumentskabelon gør det muligt for brugeren ved angivelse af tekstgenre i forbindelse med søgningen at
få information om den pågældende tekstgenres 1) kommunikative formål; 2) trækstrukturer; 3) retoriske
strategier (Simonsen, 2007).
7.3.2 Elektronisk mikrostruktur
Som Burke (1998) diskuterer, og Simonsen (2002) anskueliggør, er det i elektroniske onlineordbøger
muligt at tilføje mange flere data til ordbogsartiklerne – både hvad angår tekst, lyd og billeder.
Brugeren af TeleLex, jævnfør Simonsen (2002), bliver præsenteret for en mikrostruktur delt op i
moduler, alt efter om vedkommende skal producere, oversætte eller læse/forstå tekster (analogt med
ordbogsfunktionen reception af tekster, jævnfør Bergenholtz & Tarp (1994)).
Burke (1998) argumenterer for, at forkortelser skal skrives ud, og at der skal meget mere forklarende
metasprog ind i artiklerne. Dette vil jeg dog mene kun har relevans for folk, der er uøvede ud i at slå op i
ordbøger og som en konsekvens heraf, kunne man, som mediet muliggør, og som Burke (1998) også viser,
gøre dette valgfrit.
Ligeledes foreslås det, at der for utrænede sprogbrugere som minimum listes de mest brugte
bøjningsformer af de mest besværlige ord. Hvor meget, der skal vises til hvilken type ord, kan på linje med
ovenstående være op til den enkelte bruger, ligesom det kan være relevant at opstille flere eksempler samt
længere og mere beskrivende definitioner til rådighed for de brugere, der måtte ønske dette. Dette er især
anvendeligt i bilingvale ordbøger, da personer med anden kulturbaggrund herved lettere vil kunne forstå
den anden kultur, og der vil for eksempel kunne gives små anbefalinger til hvad der er og ikke er gode
samtaleemner i den pågældende kultur (Burke, 1998). Ovenstående kan sammenfattes i følgende citat:
"However, in online lexicons, brevity is no longer as crucial, leaving completeness the prime virtue in
definitions" (Burke, 1998).
Multimedia af enhver art er en oplagt mulighed i elektroniske onlineordbøger. Således diskuterer Burke
(1998) anvendeligheden af, at anvende lydklip, ikke bare i forbindelse med udtalen af ordet, men også til
for eksempel at tydeliggøre over for brugeren, hvordan et dyr siger, foruden de oplagte muligheder som at
anvende billeder til at vise hvordan en bestemt ting ser ud (Burke (1998) udleder af Svensén (1993), at
"color illustrations and color photos are indispensible for conveying the meaning of color words, and in
differentiating some kinds of plants and animals"). I specialiserede biltekniske ordbøger kunne man
Martin Christoffersen COWIterm
Side | 38
forestille sig, at det ville være relevant med endog op til flere lydklip af en bestemt type motor, hvilket ville
give en ekstra dimension i forhold til interesserede og studerende inden for faget.
Ved polysemi og homonymi argumenterer Burke (1998) for en søgefunktion, der gør det muligt at liste
betydningerne i forskelligt prioriterede rækkefølger. Det være sig for eksempel det 'vigtigste' begreb først
(eller sidst) eller det ældste udtryk først (eller sidst). Ligeledes kunne man forestille sig, at det kunne være
muligt at prioritere efter ordklasse, abstraktionsniveau (for eksempel tog i betydningen et transportmiddel
der kører på skinner, over for tog som værende præteritum af tage – dette konkrete eksempel indebærer,
at bøjede former også medtages i ordbogen); om det tilhører plante-, dyre- eller mineralriget; om det
forekommer naturligt eller om det er menneskeskabt og så videre.
Ved at programmere ordbogens søgefunktion til at kunne skræddersys på mange forskellige måder, kan
ordbogen tjene forskellige funktioner og hermed forskellige brugerbehov, jævnfør kapitel 5 Brugergrupper
og 6 Ordbogsfunktioner; (Burke, 1998).
Som det her er blevet tydeliggjort, er der utallige muligheder for at skræddersy indstillingerne for
datapræsentation og datasøgningsmuligheder, men man skal også passe på, at man ikke stiller brugeren
over for for mange valg, så det bliver rodet og uoverskueligt.
Martin Christoffersen COWIterm
Side | 39
8 Diskussion I dette kapitel vil jeg sammenholde ovenstående teori med de datapræsentationsmetoder og –
søgemuligheder, der er relevante for COWIterms intenderede brugere og funktioner som diskuteret i
kapitel 5 Brugergrupper og 6 Ordbogsfunktioner ovenfor.
8.1 Lemma- og ækvivalentselektion Som diskuteret under punkt 7.1.2 Lemmaselektion kan ordbøger inden for ikke-kulturbundne fag
sagtens vendes, og jeg vil argumentere for, at dette også er muligt med ordbøger bestående af delvist
kulturbundne fag, hvis blot man er opmærksom på at læse den vendte ordbog igennem med henblik på at
tilrette den til denne brug.
Under punkt 7.1.2 ovenfor er tillige defineret i grove træk, hvordan lemmata normalt er selekteret, og
det må i COWIterm betegnes at være model 2), der er gået ud fra. Der er således selekteret både rene
termer men også andre udtryk, som ikke er fællessproglige. I tillæg til dette er der også, som angivet i
underkapitel 4.2 om metoden for COWIterm, selekteret fællesord, som kan antages at være besværlige at
oversætte. Dette anskueliggøres af Figur 4, som repræsenterer et lille udsnit af det færdige arbejde. Her er
det tydeligt, at der er selekteret termer ikke kun fra tekniske fag, men også termer omhandlende
virksomhedstyper (a.m.b.a), aktiehandel (A-aktie, A-aktionær), økonomiske termer (acontofakturering),
samt figurative og fællessproglige udtryk (adelsmærke, abonnement).
I COWIterm er der ikke skelnet stort mellem de forskellige ordtyper beskrevet under punkt 7.1.1
ovenfor, og det vil jeg heller ikke gøre i mit forsøg på at forbedre den. Jeg vil gå frem efter ord for ord-
metoden som anbefalet af Bergenholtz & Tarp (1994). Dette vil gøre det nemmere for ordbogsbrugeren at
finde det relevante lemma, dels fordi øjet – når det støder på lemmata med blanktegn – ikke hele tiden skal
springe frem og tilbage for at sammenholde bogstavet efter blanktegnet med rækkefølgen af grafemer i det
efterfølgende lemma; og dels fordi man kan komme ud i situationer, hvor det relevante lemma ikke findes i
ordbogen. Her kan en oversættelse muligvis stykkes sammen af relaterede lemmata samt ækvivalenter,
som er placeret omkring den placering, hvor det relevante lemma skulle have været placeret efter ord for
ord-metoden.
Jeg vil gå frem efter model 1) hvad angår selektering af flerordstermer og ordforbindelser, som
beskrevet under punkt 7.1.4 Mikrostruktur (under ordforbindelser). Dette vil sige, at flerordstermer bliver
lemmatiseret på lige fod med enkeltordstermer, men ikke med kollokationer og andre ordforbindelser;
disse vil blive angivet under de relevante ordbogsartikler. Bergenholtz & Tarp (1994, s. 121) angiver dette
som den model, der har flest fordele for brugeren, men som også udgør et mere besværligt arbejde end
model 2) og 3). Dette er jeg dog ikke ubetinget enig i; godt nok skal man ved model 2) kun tænke på
kollokationer og ikke andre ordforbindelser, men i model 3) skal alle flerordstermer og kollokationer samt
andre ordforbindelser inkorporeres under de respektive artikler, og der er hermed et stort arbejde i at
identificere hvilke flerordstermer og ordforbindelser, der skal ind under hvilke indgangslemmata. Dette
betyder i forhold til Figur 4, at adgang til et nyt marked ikke skal have sin egen artikel, da det må betegnes
som en kollokation og ikke en flerordsterm, og derfor bør indlemmes under et andet indgangslemma; i
dette tilfælde enten adgang eller marked, eller alternativt under begge med en henvisning til den ene af
dem, hvor den fulde beskrivelse anføres.
Martin Christoffersen COWIterm
Side | 40
Som beskrevet i underkapitel 4.2 om metoden for COWIterm bliver alle termer selekteret fra to korpora
på henholdsvis dansk og engelsk, som består af repræsentative artikler og tekster, som brugergrupperne
forventes at skulle beskæftige sig med. Disse korpora udgør den optimale basis for selektering af termer,
jævnfør underkapitel 7.1 Fagleksikografi. Dog er halvdelen af teksterne oversatte, jævnfør underkapitel 4.2,
primært fra dansk til engelsk, hvilket har den svaghed, at det ikke er fuldstændig autentisk sprog.
Da COWIterm er en elektronisk baseret intranetordbog, kan søgefunktionen, som vist af både Burke
(1998) og Simonsen (2002), programmeres således, at der ved søgning på en term (grafemstreng)
fremkommer samtlige lemmata, der indeholder denne grafemstreng og altså ikke kun eksakte resultater,
men også flerordslemmata og sammensætninger, der indeholder denne grafemstreng. En udvidelse til
dette ville være, at alle ord i en artikel gøres søgbare, og søgeresultaterne kunne således opstilles efter
relevans.
Dette har dog den svaghed, at der ved en grafemstreng med høj frekvens i ordbogsartiklerne vil
fremkomme uoverskueligt mange søgeresultater, som det vil være besværligt og tidskrævende for
brugeren at gennemgå. Dette kunne på lige fod med det ovenfor i praksis viste samt det nedenfor
diskuterede også gøres valgfrit for brugeren – eventuelt ved hver søgning eller som en generel indstilling,
der bliver gemt sammen med resten af brugerens søgeprofil, jævnfør underkapitel 7.3 Elektronisk
virksomhedsleksikografi, 8.2 Diskussion af makrostruktur og 8.3 Diskussion af mikrostruktur.
Figur 4 COWIterm som det endelige arbejde så ud. Det er her tydeligt at se, at der er selekteret såvel fagsproglige som almensproglige ord.
Martin Christoffersen COWIterm
Side | 41
Det vil være relevant at berøre emnet omkring kulturbundne kontra ikke-kulturbundne fag, da det er
nævnt flere steder ovenfor. Det er i COWIterm nødvendigt at medtage termer fra begge fagtyper (jævnfør
Figur 4), da COWI spænder over mange vidt forskellige fag, og da det vil være nødvendigt at producere for
eksempel årsregnskaber på engelsk. Ifølge Bergenholtz & Tarp (1994) bevirker dette, at det ved nogle
termer vil være nødvendigt at lave længere kontrasterende faglige forklaringer, da der i kulturbundne fag
ikke altid kan forventes fuld ækvivalens, og dermed må forskellen forklares, jævnfør punkt 7.1.4
Mikrostruktur (under faglige forklaringer).
8.2 Diskussion af makrostruktur Den traditionelle diskussion, der omhandler alfabetisk kontra systematisk makrostruktur, jævnfør punkt
7.1.5 ovenfor, er ikke så relevant, når det drejer sig om elektronisk baserede intranetordbøger som
COWIterm. Ved enkeltfagsordbøger eller ordbøger med få fag kan det dog være meget relevant med en
systematisk arbejdsproces. Derved får man gjort sig klart, hvordan de enkelte begreber relaterer sig til
hinanden, hvilket igen letter arbejdet med udformningen af definitioner, jævnfør punkt 7.1.5.2 Systematisk
makrostruktur, 7.2.1 Begrebssystemer samt 7.2.2 Definitioner ovenfor. COWIterm indeholder dog så
mange forskellige fag, at det vil være et uoverkommeligt arbejde at udforme begrebssystemer til samtlige
af disse.
Dette ligger også til grund for, at udarbejdelsen af definitioner ikke kan blive efter Madsens (1999)
principper. Madsen (1999) og Bergenholtz & Tarp (1994) er uenige om, hvorledes definitioner (Bergenholtz
& Tarp (1994) kalder dem for faglige forklaringer) skal udformes. Førstnævnte mener, at der skal være
stringente retningslinjer for indholdet og opbygningen af definitioner, da de definerede begreber på denne
måde lettere kan skelnes fra side-, over- og underordnede begreber, hvorimod sidstnævnte mener, at en
sådan fremgangsmåde leverer et kedeligt resultat, og at der godt må være variation i de forskellige
definitioner, da dette letter blandt andet læsbarheden, jævnfør punkt 7.2.2 Definitioner og 7.1.4
Mikrostruktur.
Samme problemstilling stod også Simonsen (2002) over for ved udarbejdelsen af TeleLex, og her blev i
stedet udarbejdet en intern fagklassifikation, der definerede inden for hvilke af TDC's fagområder, der
skulle medtages termer. COWI angiver selv inde på deres hjemmeside, jævnfør COWI A/S, at de rådgiver
inden for områderne natur, samfund, transport, bygninger, industri samt forsyning. Det er selvfølgelig nogle
meget brede hovedområder, og det ville derfor være nødvendigt at lave interne fagklassifikationer inden
for hvert enkelt område samt inden for økonomi og regnskab og til dels inden for jura, da den sekundære
brugergruppe, som består af oversættere og andre sprogmedarbejdere, jævnfør kapitel 5 Brugergrupper
ovenfor, må forventes at skulle producere og oversætte blandt andet årsregnskaber, kontrakter og andre
økonomiske samt juridisk bindende dokumenter på og til engelsk.
I COWIterm kunne man forestille sig, at brugerne ville have glæde af en søgemetode som den, der er
udviklet i Simonsen (2002), så der kunne søges både alfabetisk og/eller inden for fagområde, eventuelt
inden for flere tilgrænsende fagområder på én gang, jævnfør punkt 7.3.1 Elektronisk makrostruktur.
Ligeledes kunne det være relevant at implementere den leksikografiske dokumentskabelon, jævnfør
punkt 7.3.1 Elektronisk makrostruktur, da brugerne således vil kunne udforme tekster, der overholder
retningslinjerne for de respektive tekstgenrer.
Martin Christoffersen COWIterm
Side | 42
En model af startsiden med de ovenfor diskuterede emner er vist i Figur 5. Her er der også reserveret
plads ude i siden til en brugervejledning til startsiden og de muligheder, som brugeren har. Brugeren kan
vælge fag og tekstgenre ved hjælp af drop down-bokse eller alternativt ved at vælge flere forskellige fag og
genrer i en liste.
I elektronisk baserede intranetordbøger som COWIterm kunne det være relevant at implementere en
søgemetode, der dels lister de forskellige lemmata i henhold til relevans i forhold til den søgte
grafemstreng, hvilket også indebærer en angivelse af de mest relevante lemmata, hvis der ingen resultater
er for den søgte grafemstreng, for eksempel på grund af uoverensstemmelser mellem brugerens søgning
og indhold i COWIterm; dels lister den ubøjede form, hvis der søges på en bøjet eller uregelmæssig form.
Figur 5 Model af COWIterms foreslåede startside
8.3 Diskussion af mikrostruktur Som vist ovenfor i punkt 7.1.4 omhandlende den traditionelle mikrostruktur anbefaler Bergenholtz &
Tarp (1994) en bestemt rækkefølge i forbindelse med opbyggelsen af mikrostruktur til oversættelses- og
produktionsformål. Som Burke (1998) diskuterer og Simonsen (2002) anskueliggør (jævnfør punkt 7.3.2),
kan mikrostrukturen i elektronisk baserede intranetordbøger som COWIterm skræddersys af brugeren, så
vedkommende selv kan bestemme hvilke informationer, der bliver vist og i hvilken rækkefølge, de bliver
vist.
Ligeledes diskuteret ovenfor, jævnfør punkt 7.3.2 Elektronisk mikrostruktur, kan billeder bidrage enormt
til forståelse af definitionen af en fysisk genstand, men det er ikke alt, der umiddelbart kan anskueliggøres
Martin Christoffersen COWIterm
Side | 43
ved billeder. Tilføjelsen af videoklip (eller alternativt GIF-animationer) er endnu en mulighed for at forbedre
forståelsen for brugeren. Dette element er især relevant ved beskrivelsen af processer, handlinger,
arbejdsfunktioner og lignende.
Selvom brugeren i TeleLex, jævnfør punkt 7.3.2 Elektronisk mikrostruktur, har mulighed for at vælge
moduler af mikrostrukturen, bliver dataene internt i modulerne stadig præsenteret efter en nøje fastlagt
mikrostruktur. Man kan forestille sig muligheden for at lade brugeren selv organisere, i hvilken rækkefølge
data bliver præsenteret, da mediet muliggør dette. Jeg vil dog argumentere for, at det er de færreste
tilfælde, hvor dette vil være nødvendigt og relevant; derfor er en nøje fastlagt mikrostruktur stadig yderst
relevant, selvom brugeren har mulighed for at udtage dele af den.
Figur 6 viser, hvordan COWIterm ser ud ved søgning på afdække. Som det kan ses, er der fire danske
lemmata med blandet synonymi- og homonymiindeks samt tilsvarende fire engelske ækvivalenter. Det var
et ønske fra COWI, at der kun skulle være én dansk term og én engelsk term i hver artikel, og at kun de
danske termer skulle være nummererede ved flere forekomster, da det er den dansk-engelske ordliste, der
er den principale og den engelsk-danske, der er den subsidiære ordliste, jævnfør Bergenholtz & Tarp (1994,
s. 190-193). Hertil er et enkelt kommentarfelt, der i dette tilfælde er blevet brugt til at angive synonymer til
den danske term til hjælp ved produktion på og oversættelse til engelsk, da brugeren ikke ud fra de danske
lemmata kan læse, om det for eksempel betyder tildække, undersøge eller afsløre samt hvilken ækvivalent,
der i så fald skal anvendes ved de respektive betydninger.
Figur 6 COWIterm som den ser ud, når der søges på afdække.
Martin Christoffersen COWIterm
Side | 44
At der er tale om synonymer til den danske term anskueliggøres af forkortelsen "dk.", der angiver, at det
følgende refererer til den danske term, samt "=", der angiver synonymi, jævnfør punkt 7.1.4 Mikrostruktur
(under synonymer og antonymer), hvor det er metode nummer 5), der er anvendt, og ifølge Bergenholtz &
Tarp (1994) er den optimale opstilling af synonymer og antonymer en kombination af 3), hvilket er en
henvisning til et andet lemma, og 5), hvilket i dette tilfælde er let at implementere, idet man sørger for at
lemmatisere de relevante og ikke allerede lemmatiserede termer.
Ligeledes kan man i Figur 6 se den leksikografiske konvergensmodel, jævnfør punkt 7.3.1 Elektronisk
makrostruktur, i anvendelse. Som det tydeligt ses, er COWIterm dog ikke fuldt optimeret til brug med
denne, da brugeren næppe vil have nytte af at kunne søge på afdække 4 direkte på Google eller nogle af de
andre steder, og brugeren bliver hermed nødt til selv at korrigere for dette, når det nye vindue med for
eksempel Googles søgeside åbnes. Det er således upraktisk, at der udelukkende kan søges på den sidste
forekomst af lemma henholdsvis ækvivalent de respektive steder, og det er et yderligere problem, at
nummereringen indgår i selve lemmaet.
Dette problem kunne løses ved at inkorporere en resultatside, hvorved brugeren efter at have udfyldt
søgeruden og klikket "Søg" får en resultatside frem på skærmen, som det også er tilfældet i TeleLex,
jævnfør Simonsen (2002). Men i stedet for blot at få en resultatside frem med klikbare lemmata (som
følgende åbner ordbogsartiklen på hele siden, således at man bliver nødt til at klikke "Tilbage" for at
komme tilbage til resultatlisten, hvis det alligevel ikke var det lemma, man søgte), kunne man have
resultatlisten på for eksempel den øverste tredjedel af siden, med mulighed for at scrolle ned i listen, hvis
der er for mange resultater til, at de alle kan vises. Man kan så markere et lemma, hvis fulde artikel
efterfølgende bliver vist på den nederste del af siden – ligeledes med mulighed for at scrolle, hvis der er for
Figur 7 Model af muligheden for både at vise resultatliste samt ordbogsartikel for det i resultatlisten markerede lemma.
Martin Christoffersen COWIterm
Side | 45
mange informationer til, at de alle umiddelbart kan vises. Der er reserveret plads til eventuelle multimedia
ude i siden af skærmbilledet. En model heraf er vist i Figur 7, hvor den leksikografiske konvergensmodel
samt den leksikografiske dokumentskabelon er inkorporerede i selve ordbogsartiklen. Når der klikkes på
enten den danske eller den engelske tekstgenre, vises et nyt vindue med kommunikative formål,
trækstrukturer samt typisk anvendte retoriske strategier for tekstgenren, jævnfør Simonsen (2007).
Om den engelske version af den leksikografiske dokumentskabelon udelukkende skal være en oversat
kopi af den danske, altså med de kommunikative formål, trækstrukturer og retoriske strategier, der er
relevante i danske sammenhænge og til danske målgrupper, eller om den skal afspejle konventionen inden
for et engelsktalende sprogområde kan diskuteres; alternativt kan der udvikles flere forskellige
dokumentskabeloner alt efter geografisk anvendelsesområde og målgruppe. Man kunne også forestille sig,
at man udviklede engelsksprogede dokumentskabeloner til ikke-engelsktalende sprogområder som en
måde at lette kommunikationen mellem parterne. Dette kunne specielt være relevant i COWIs tilfælde i
kraft af virksomhedens globale virkeområde. Hvad angår multimedia ude i siden skal der selvfølgelig kun
være angivelse af de forskellige typer, i det omfang den enkelte multimedietype er repræsenteret ved det
pågældende lemma.
Ved anvendelse af modellen i Figur 7 kan synonymer og antonymer, der er lemmatiserede, gøres synligt
klikbare ved farveskift, understregning eller andet. Det samme gør sig gældende for henvisninger.
Figur 7 er en maksimerende model, dels hvad angår forbedringen af COWIterm; og dels hvad angår data
præsenteret i ordbogsartiklen, hvilket vil sige, at det her er den maksimale grad af information, brugerne af
COWIterm kan få om lemmaet præsenteret på begge sprog.
Ved polyseme og homonyme lemmata kunne man angive nummerering før lemmaet i resultatlisten
tillige med en kort forklaring eller et synonym efter lemma, grammatiske oplysninger og faglig markering.
Således kan brugeren hurtigt og nemt identificere den rette term og dermed hurtigere finde frem til den
rette ækvivalent, definition, kollokation, det rette eksempel med videre.
Det er kun i de færreste artikler, det er nødvendigt at angive fag ved både lemma og ækvivalent – oftest
er det kun nødvendigt ved lemmaet. Hvis man dog har tænkt sig at vende ordbogen fra L1 til L2, vil det lette
arbejdet, hvis der er de samme data ud for termerne på begge sprog, eller man kan programmere
søgerutinen til at undertrykke fagangivelser ud for ækvivalenterne. Ligeledes er det i langt de fleste tilfælde
kun nødvendigt at få præsenteret ordklasse ud for lemmaet.
Modellen i Figur 7 præsenterer de nævnte data, der er nødvendige for oversættelse og produktion af
tekster til og på engelsk, jævnfør kapitel 6 Ordbogsfunktioner. Det er dog nødvendigt at maksimere
grammatikfeltet i selve artiklen til at inkludere samtlige de informationer nævnt i punkt 7.1.4 Mikrostruktur
(under grammatiske oplysninger), samt at angive de relevante sproglige markeringer, jævnfør punkt 7.1.4
(under sproglige markeringer). Dog er jeg uenig med Bergenholtz & Tarp (1994) i, at sproglige markeringer
bør inkorporeres i de faglige forklaringer, da dette tvinger brugeren til at læse hele den faglige forklaring i
ordbogsartiklen igennem, jævnfør punkt 7.1.4, og det er for eksempel ret afgørende, om en bestemt term
kun bruges i britisk engelsk eller amerikansk engelsk.
Martin Christoffersen COWIterm
Side | 46
Grammatikfeltet ud for lemmaet i resultatlisten bør minimeres til for eksempel kun at indeholde
ordklasse samt fleksioner. Fleksionsmønstret er her relevant, da termer, der er homografisk med fællesord,
ofte skifter køn, jævnfør punkt 7.2.3.1 Krav til fagudtryk.
Jeg er enig med Bergenholtz & Tarp (1994) i, at det i flerfaglige ordbøger er vigtigt med mange
angivelser om fagligt tilhørsforhold, jævnfør punkt 7.1.4 Mikrostruktur (under faglige markeringer), men da
de som oftest angives som forkortelser, skal man passe på ved udformningen af dem, da forkortelserne
gerne skulle være så gennemskuelige som muligt.
Figur 8 anskueliggør mængden af forkortelser i anvendelse i COWIterm på tidspunktet for
ibrugtagningen. Langt de fleste af forkortelserne er faglige angivelser, og det kræver ikke langs tid arbejde
med COWIterm for at se, at det er nødvendigt med mange flere fagangivelser end de her præsenterede,
hvis det skal fungere optimalt. Det kan dog blive ret problematisk med så mange forkortelser, da brugere,
der ikke benytter COWIterm ofte nok til at huske forkortelserne fra gang til gang, bliver nødt til at
konsultere listen, hvis de ikke kan gætte sig frem til betydningen, eller hvis de vil være helt sikre på
fagangivelsen. Især brugere med lav grad af ordbogskundskaber (jævnfør Figur 3 samt kapitel 5
Figur 8 Forkortelser anvendt i COWIterm.
Martin Christoffersen COWIterm
Side | 47
Brugergrupper) vil have problemer med forkortelserne, da de måske ikke forventer dem samt heller ikke er
helt klar over, om og hvor de kan finde betydningen af dem, hvorimod brugere med en høj grad af
ordbogskundskaber af erfaring ved, at der skal være en liste med forkortelser og deres betydninger
placeret lettilgængeligt.
Jeg har forsøgt at lave forkortelserne så gennemsigtige som muligt, så de fleste af dem skulle være til at
gætte uden at konsultere listen, jævnfør punkt 7.1.4 Mikrostruktur (under faglige markeringer). Det er
alligevel et irritationsmoment, hvis man bliver nødt til at skulle søge flere steder for at være sikker på, at
den information, man har fundet frem til i artiklen, er den helt korrekte og i situationen relevante. Især hvis
mængden af forkortelser fordobles, tredobles eller firdobles, kan det være besværligt at huske dem alle
sammen samt at være sikker på, at det er den rigtige forkortelse, da mange herved nemt kan komme til at
ligne hinanden. En mulighed i COWIterm, da det er en elektronisk baseret intranetordbog, ville være at
gøre det valgfrit for brugeren, om forkortelser skal skrives ud, og hvis brugeren vælger ikke at få dem
skrevet ud, kan en pop-up-beskrivelse af forkortelsen vises som standard, når brugeren holder musen
henover den, jævnfør punkt 7.3.2 Elektronisk mikrostruktur.
Både Figur 6 og Figur 9 illustrerer COWIterms opbygning, som består af lemma, ækvivalent og
kommentarfelt samt implementering af den leksikografiske konvergensmodel, som diskuteret ovenfor,
jævnfør punkt 7.3.1 Elektronisk makrostruktur. Eksemplet i Figur 9 viser en kollokation, som i henhold til
diskussionen i punkt 8.1 Lemma- og ækvivalentselektion, vil skulle inkluderes under en anden artikel.
Eksemplet i Figur 9 kan dog bruges til at anskueliggøre det upraktiske i kun at have et kommentarfelt til
samtlige oplysninger udover lemma og ækvivalent. Kommentarfeltet bliver her anvendt til to oplysninger,
som begge skal være på både dansk engelsk, hvilket giver fire elementer, samt en adskiller mellem
kommentarer relaterende til den danske henholdsvis den engelske term.
De to oplysninger, der gives på begge sprog, er en forklaring af termen, og et eksempel af typen belæg
(jævnfør punkt 7.1.4 Mikrostruktur (under eksempler)), der er taget direkte fra en af de tekster, jeg har
arbejdet med under udarbejdelsen af COWIterm. Som det tydeligt ses, indeholder kommentarfeltet mange
oplysninger, og det er svært og tidskrævende at finde den rette information, især hvis man skal have fat i
informationer relaterende til den engelske term. Tillige er det utænkeligt at inkludere flere oplysninger i
dette kommentarfelt, uden at det bliver mere rodet og uoverskueligt, så for eksempel de grammatiske
oplysninger må her vige for forklaring og teksteksempel.
Det er i øvrigt minimalt med kommentarer i COWIterm, jævnfør Figur 10, der illustrerer mængden af
kommentarer i COWIterm ved søgning på bro, og specielt grammatiske oplysninger er blevet nedprioriteret
som et ønske fra COWI, da det blev antaget, at den primære brugergruppe ikke ville have meget nytte – og
måske blot ville forvirres af – grammatiske angivelser.
Figur 9 Her illustreres det upraktiske ved kun at have et kommentarfelt til alle øvrige oplysninger end lemma og ækvivalent.
Martin Christoffersen COWIterm
Side | 48
8.4 Brugermedbestemmelse På linje med brugermedbestemmelse som beskrevet ovenfor i forbindelse med datapræsentation og -
søgning kunne man tilføje endnu et element af brugermedbestemmelse i form af kommentarer til
ordbogen i overordnet forstand samt specifikt til en ordbogsartikel; og desuden forslag til nye termer, som
en bruger gerne vil have lemmatiseret. Brugerinvolvering er også diskuteret af Burke (1998), godt nok i
forbindelse med udarbejdelse af ordbøger til indfødte sprog, hvor han foreslår, at en lille gruppe brugere
kan agere som reference, hvis leksikografen har brug for autoritativ hjælp, og brugermedbestemmelse er
ligeledes inkorporeret i TeleLex på interessant vis, jævnfør Simonsen (2002).
Som det er tilfældet i TeleLex, jævnfør Simonsen (2002), kunne man i COWIterm gemme brugernes
indstillinger fra gang til gang, så når brugeren loggede sig på (det være sig via virksomhedens intranet eller
udefra), var vedkommendes indstillinger gemt fra sidste besøg, så vedkommende ikke skulle indstille de
foretrukne indstillinger hver gang. Samtidigt skulle man hurtigt og nemt kunne ændre disse
Figur 10 Anskueliggørelse af mængden af kommentarer implementeret i COWIterm ved søgning på bro.
Martin Christoffersen COWIterm
Side | 49
standardindstillinger, eller lave indstillinger, der kun gælder for den aktuelle søgning eller den aktuelle
session (det tidsrum, der går, fra en bruger logger sig på til vedkommende logger af igen).
Hermed er det kun fantasien, der sætter grænser for programmører henholdsvis leksikografer, og der
er, som Burke udtrykker det, " as many macrostructures in a given lexicon as there are search methods that
the programmers and lexicographers have provided" (1998).
Martin Christoffersen COWIterm
Side | 50
9 Konklusion Den elektronisk baserede intranetordbog, COWIterm, tilgængelig for virksomheden COWIs
medarbejdere, var fuldt ud anvendelig, som den var på ibrugtagningstidspunktet. Ikke desto mindre var det
et stort projekt for mig, da den optog meget af min tid, og netop fordi jeg arbejdede så meget med den,
fandt jeg det interessant at finde ud af, hvordan den kunne optimeres, så brugergrupperne kunne få mere
nytte af den.
I det ovenstående har jeg forsøgt at sammenstille den relevante valgte teori med eksisterende
elektronisk baserede intranetordbøger for på bedst mulig vis at besvare dette speciales problem.
Som det er tydeligt ved en gennemlæsning af underkapitel 7.3 Elektronisk virksomhedsleksikografi er
der næsten uanede muligheder, hvad angår søgemuligheder og datapræsentationsmetoder, og jeg har i
kapitel 8 Diskussion prøvet at spore mig ind på, hvilke datasøgnings- og datapræsentationsmetoder, der er
relevante at inkorporere i COWIterm.
Hvad angår datasøgningsmetoder, har jeg set på, om det er relevant for brugerne af COWIterm at kunne
filtrere efter fagområde samt tekstgenre (den leksikografiske dokumentskabelon). Jeg mener bestemt, at
begge dele kan være nyttige for brugerne, med de i diskussionen ovenfor anførte overvejelser taget i
betragtning. Brugerne vil ved filtrering efter fag kunne undgå for mange og irrelevante søgeresultater, både
i takt med at COWIterm vokser, og især hvis det besluttes at gøre hele teksten i ordbogsartiklerne søgbar.
Filtrering efter fag vil kræve en intern fagklassifikation for hvert af COWIs seks hovedforretningsområder 1)
for at kunne identificere relevante tekster til inkludering i korpora på både dansk og engelsk, og 2) for at
kunne identificere de relevante termer, ordforbindelser, synonymer og antonymer, eksempler med videre i
disse tekster. Som også allerede diskuteret ovenfor vil det være nødvendigt i korporaerne at inkludere
tekster omhandlende økonomi og regnskab samt visse typer juridiske tekster for at kunne matche de
teksttyper, som brugerne selv skal dels producere og dels oversætte.
Ligeledes vil det være relevant at kunne søge efter tekstgenre med efterfølgende angivelse af en
skabelon af den valgte tekstgenre, der indeholder kommunikative formål, trækstrukturer samt retoriske
træk, da dette vil være til stor hjælp for de af COWIs medarbejdere, der skal producere tekster til internt
såvel som til eksternt brug. Dette er med til at sikre en ensartet kommunikation virksomheden igennem,
hvilket, som tidligere nævnt, kan være af stor værdi for virksomheden, jævnfør kapitel 1 Indledning.
Hvad angår datapræsentationsmetoder kan det som vist være helt op til brugeren hvilke data, der skal
præsenteres – og hvordan. Optimalt set kunne man opstille en todelt løsning, hvad angår præsentation af
mikrostrukturen; for det første ved at inddele den i moduler og lade brugeren angive, om vedkommende
skal benytte ordbogen til at oversætte, producere og/eller læse og forstå tekster, som det er tilfældet i
TeleLex, jævnfør punkt 7.3.2 Elektronisk mikrostruktur. Denne metode skulle i så fald inkludere de
beskrevne elementer relevante for oversættelse og produktion, jævnfør kapitel 6 Ordbogsfunktioner. I
tillæg til dette kunne brugeren blive bedt om at angive, om vedkommende var teknisk eller sprogligt
uddannet, hvilket ville have effekt på den måde, de tekstuelle og sproglige signaler (såsom forkortelser)
blev opstillet (udskrevet/forkortet), da dette siger noget om, vedkommendes ordbogskundskaber og
dermed kender og forstår disse signaler.
Martin Christoffersen COWIterm
Side | 51
For det andet kan man gøre et vindue med 'avancerede indstillinger' tilgængeligt, så den øvede bruger
selv kan definere fuldt ud, hvilke data vedkommende vil have præsenteret i hvilken rækkefølge. Tillige med
dette kan man gøre det valgfrit i hvilket omfang, brugeren vil have data præsenteret, hvis man, som
diskuteret ovenfor, jævnfør underkapitel 8.3 Diskussion af mikrostruktur, for eksempel vil have forkortelser
skrevet ud, have mere information i definitionen eller vil udelade eventuel etymologi i definitionen.
Desuden vil der helt sikkert være forskellige præferencer inden for layout, farver, teksttyper med videre,
hvilket dog må anses for andenprioritet, da det er dataene i ordbogen, der er det primære element,
eftersom disse skal anvendes som et værktøj af COWIs medarbejdere.
I COWIterm, som den var på ibrugtagningstidspunktet, var der som diskuteret ovenfor i underkapitel 8.3
Diskussion af mikrostruktur udelukkende ét felt til samtlige andre oplysninger end lemma og ækvivalent.
Hvis man skulle inkludere både alle grammatiske angivelser, faglige og sproglige markeringer, definitioner,
ordforbindelser, eksempler med videre på både dansk og engelsk ville det være helt uoverskueligt og noget
nær umuligt at finde frem til den relevante information ved brug af kun et enkelt felt.
Jeg vil lægge ovenstående til grund for at henvise til Figur 5 og Figur 7 som den ideelle måde at opstille
COWIterm på, da denne model giver hurtigt overblik, samtidig med at man nemt og hurtigt kan gå videre til
næste term på resultatlisten tillige med, at det er hurtigt at lave en ny søgning. Denne model giver samtlige
informationer relevant for elektronisk baserede intranetordbøger som COWIterm, inkluderende alt fra
grammatiske angivelser og definitioner til lyd (både hvad angår udtale men også muligheden for at
inkludere lyde karakteristiske for definiendum, det være sig dyr såvel som maskiner med videre), billeder
og videoklip.
Martin Christoffersen COWIterm
Side | 52
10 Litteraturliste Almsten, L. K., & Kristensen, K. (2008). Terminologi er kommunikation. Magasinet for Kommunikation og
sprog , 26-29.
Bergenholtz, H., & Tarp, S. (1994). Manual i fagleksikografi. Herning: forlaget systime a/s.
Burke, S. M. (1998). The Design of Online Lexicons. Evanston: Northwestern University, Evanston, Illinois.
COWI A/S. (u.d.). COWI A/S, forside. Hentede 28. April 2009 fra COWI A/S: http://www.cowi.dk
Frandsen, L. (1982). Definition. Objekter, metoder og regler. København: Handelshøjskolen i København.
Geeb, F. (1998). Koncernrelateret miljø- og energiordbog. Hermes, Journal of Linguistics, nr. 20 , 203-210.
Kirchmeier-Andersen, S. (2003). Virksomhedens sproglige identitet. I Ind med sproget! En artikelsamling om
sproget i og for erhvervslivet (s. 11-21). København: Lingtech A/S.
Madsen, B. N. (1999). Terminologi 1 - Principper og metoder. København: Gads Forlag.
Simonsen, H. K. (2002). TeleLex - Theoretical Considerations on Corporate LSP Intranet Lexicography: Design
and Development of TeleLex - an Intranet-based Lexicographic Knowledge and Communications
Management System. Århus: Handelshøjskolen i Århus.
Simonsen, H. K. (2007). Virksomhedsleksikografien viser tænder: leksikografiske løsninger i København Zoo
og Fagerberg A/S. I Nordiske studier i leksikografi 10. Rapport fra Konference om leksikografi i Norden.
Island 22.-26. maj 2007. Akureyri: Nordisk Forening for Leksikografi.
Sprognævn, D., & Litteraturselskab, D. D.-o. (19. Oktober 2007). Forside » Råd og regler »
Retskrivningsregler mv. » Retskrivningsregler » § 18-19. Ét eller flere ord? » § 18. Skrivemåden afhængig af
udtalen. Hentede 22. Marts 2009 fra Sproget.dk: http://www.sproget.dk
Svensén, B. (1993). Practical Lexicography: Principles and Methods of Dictionary-Making. Oxford, USA:
Oxford University Press.
Trask, L. (u.d.). What Is A Word? Hentede 9.. Marts 2009 fra Department of Linguistics and English
Language, University of Sussex: http://www.sussex.ac.uk/linguistics/documents/essay_-
_what_is_a_word.pdf