Kolokacije in kolokacije na daljavo v japonskem jeziku

18
Irena Srdanović Kolokacije in kolokacije na daljavo v japonskem jeziku: korpusni pristop

description

Pričujoča monografija obravnava kolokacije v japonskem jeziku z jezikoslovnega in pedagoškega vidika. Raziskava temelji na empiričnem korpusnem pristopu analize jezika s pomočjo številčnih korpusov in orodja za analizo in prikaz jezikovnih podatkov, ki ga avtorica ustvarja in prilagaja za potrebe raziskave. Delo izpostavlja pomembnost pojava kolokacij na daljavo in ga podrobno obravnava na primeru modalnih prislovov in modalnih izrazov na koncu stavka. Rezultati raziskave kažejo na tendence zaznamovanih sopojavitev in njihovo odvisnost od zvrsti korpusa. Obravnavane so tudi kolokacije, raziskane v učnem gradivu za japonski jezik, izsledki pa kažejo, da njihova obravnava v obstoječih učbenikih in slovarjih ni zadostna. Iz tega razloga so ponujeni predlogi za izboljšavo tega gradiva.

Transcript of Kolokacije in kolokacije na daljavo v japonskem jeziku

  • 9 789612 377649

    ISBN 978-961-237-764-9

    ISBN 978-961-237-764-9

    Irena Srdanovi je bila rojena leta 1974 v Beo-gradu, kjer je konala diplomski tudij Japon-ski jezik in knjievnost na Filozofski fakulteti Univerze v Beogradu. Magistrirala je na po-droju jezikoslovja na Oddelku za splono in primerjalno jezikoslovje Filozofske fakultete Univerze v Ljubljani. Doktorski tudij je za-kljuila najprej na Tokijski tehnoloki univerzi na Japonskem, potem pa tudi na Filozofski fakulteti Univerze v Ljubljani. Poleg te mo-nogra je je objavila e tiri prispevke v mo-nogra jah, 14 znanstvenih lankov v revijah z mednarodno recenzijo in 19 znanstvenih lankov na mednarodnih simpozijih. Veliko let je bila pedagoko in raziskovalno aktivna na Filozofski fakulteti Univerze v Ljubljani. Bila je vodja raziskovalnega projekta in sode-lovala e v sedmih ter eno leto gostovala na Nacionalnem intitutu za japonski jezik in je-zikoslovje v Tokiu. Leta 2015 je osnovala novi diplomski tudij japonologije na Univerzi Ju-raja Dobrile v Puli, kjer je trenutno zaposlena.

    Priujoa monogra ja obravnava kolokacije v japonskem jeziku z jezikoslovnega in pedago-kega vidika. Raziskava temelji na empirinem korpusnem pristopu analize jezika s pomojo tevilnih korpusov in orodja za analizo in pri-kaz jezikovnih podatkov, ki ga avtorica ustvar-ja in prilagaja za potrebe raziskave. Delo iz-postavlja pomembnost pojava kolokacij na daljavo in ga podrobno obravnava na prime-ru modalnih prislovov in modalnih izrazov na koncu stavka. Rezultati raziskave kaejo na tendence zaznamovanih sopojavitev in njiho-vo odvisnost od zvrsti korpusa. Obravnavane so tudi kolokacije, raziskane v u nem gradivu za japonski jezik, izsledki pa kaejo, da njihova obravnava v obstoje ih u benikih in slovarjih ni zadostna. Iz tega razloga so ponujeni pre-dlogi za izbolj avo tega gradiva.

    Irena Srdanovi

    Kolokacije in kolokacije na daljavo v japonskem jeziku: korpusni pristop

    Kolo

    kaci

    je in

    kol

    okac

    ije n

    a da

    ljavo

    v ja

    pons

    kem

    jezi

    ku: k

    orpu

    sni p

    rist

    opIr

    ena

    Srda

    novi

    Kolokacije_in_kolokacije_na_daljavo_naslovka_FINAL.indd 1 4.5.2016 10:46:07

  • Kolokacije in kolokacije na daljavo v japonskem jeziku: korpusni pristop

    Irena Srdanovi

    Kolokacije in kolokacije na daljavo_FINAL.indd 1 4.5.2016 10:50:07

  • Kolokacije in kolokacije na daljavo v japonskem jeziku: korpusni pristop

    Zbirka: Razprave FF (ISSN 2335-3333)

    Avtorica: Irena SrdanoviRecenzenta: Andrej Beke, Bor HodoekLektor slovenskega dela: Damjan PopiLektor japonskega dela: Iztok IlcTehnino urejanje in prelom: Ale CimpriSlika na naslovnici: Stock photo akiyoko

    Univerza v Ljubljani, Filozofska fakulteta, 2016.Vse pravice pridrane.

    Zaloila: Znanstvena zaloba Filozofske fakultete Univerze v LjubljaniIzdal: Znanstvenoraziskovalni intitut Filozofske fakulteteZa zalobo: Branka Kaleni Ramak, dekanja Filozofske fakultete

    Tisk: Birografika Bori, d. o. o.Ljubljana, 2016Prva izdajaNaklada: 150Cena: 14,90 EUR

    CIP - Kataloni zapis o publikaciji Narodna in univerzitetna knjinica, Ljubljana

    811.521.09

    SRDANOVI, Irena, 1974- Kolokacije in kolokacije na daljavo v japonskem jeziku : korpusni pristop / Irena Srdanovi. - 1. izd. - Ljubljana : Znanstvena zaloba Filozofske fakultete, 2015. - (Zbirka Razprave FF, ISSN 2335-3333)

    ISBN 978-961-237-764-9

    280939008

    Kolokacije in kolokacije na daljavo_FINAL.indd 2 4.5.2016 10:50:07

  • 3Kazalo vsebine

    Uvodni del . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    1 Empirini in aplikativni pristop v analizi kolokacij. . . . . . . . . . . . .11

    1.1 Razvoj korpusnega jezikoslovja . . . . . . . . . . . . . . . . . . . . . .11

    1.2 Uporaba korpusov pri uenju tujega jezika. . . . . . . . . . . . . . .13

    1.3 Zaetki raziskovanja kolokacij in pomembnost uenja kolokacij za tuje uence . . . . . . . . . . . . . . . . . . . . . .15

    1.4 Luenje kolokacij japonskega jezika iz korpusov . . . . . . . . . .17

    1.5 Razvoj pripomokov za uenje kolokacij . . . . . . . . . . . . . . . .19

    1.6 Kolokacije na daljavo in ujemanje med prislovi in modalnimi oblikami na koncu stavka. . . . . . . . . . . . . . . . .21

    1.7 Povezave s priujoo raziskavo . . . . . . . . . . . . . . . . . . . . . .24

    2 Razvoj japonske razliice orodja za luenje kolokacij . . . . . . . . . .27

    2.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27

    2.2 Povzetek delovanja sistema . . . . . . . . . . . . . . . . . . . . . . . .27

    2.3 Priprava in lastnosti spletnega korpusa . . . . . . . . . . . . . . . . .28

    2.3.1 Struktura in znailnosti spletnega korpusa . . . . . . . . . .29

    2.3.2 Statistika spletnega korpusa . . . . . . . . . . . . . . . . . . .30

    2.3.3 Vnaanje spletnega korpusa v sistem in funkcija konkordanc . . . . . . . . . . . . . . . . . . . . . . .33

    2.3.4 Primerjava spletnega in korpusa asopisov . . . . . . . . . .34

    2.3.5 Spletni podatki kot vrsta korpusa . . . . . . . . . . . . . . . .38

    2.4 Izdelava slovnine datoteke v japonini . . . . . . . . . . . . . . . .40

    2.4.1 Vzorci v slovnini datoteki . . . . . . . . . . . . . . . . . . . . .40

    2.4.2 Luenje kolokacijskih podatkov iz korpusa s pomojo sistema . . . . . . . . . . . . . . . . . . . .42

    2.4.3 Slovnina datoteka in razmerje do orodja ChaSen . . . . .48

    2.5 Glavne funkcije sistema . . . . . . . . . . . . . . . . . . . . . . . . . . .48

    2.5.1 Besedne skice: funkcija pridobivanja kolokacijskih povezav . . . . . . . . . . . . . . . . . . . . . . .48

    2.5.2 Tezaver: funkcija slovarja sopomenk . . . . . . . . . . . . . .52

    2.5.3 Primerjalne skice: funkcija prikaza podobnosti in razlik . .53

    2.6 Povzetek in nadaljnja vpraanja . . . . . . . . . . . . . . . . . . . . . .55

    Kolokacije in kolokacije na daljavo_FINAL.indd 3 4.5.2016 10:50:07

  • 43 Aplikacija in vrednotenje japonske razliice sistema za luenje kolokacij . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57

    3.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57

    3.2 Leksikalno-semantina analiza: primer besede chousen izziv () . . . . . . . . . . . . . . . . . . . . . . . . . . . .58

    3.3 Metodologija iskanja stavnih vzorcev . . . . . . . . . . . . . . . . .61

    3.3.1 Morfoloka produkcija in izpeljava . . . . . . . . . . . . . . .61

    3.3.2 Iskanje vzorcev . . . . . . . . . . . . . . . . . . . . . . . . . . . .62

    3.4 Podroje pouevanja japonine in mona raba sistema . . . . . .66

    3.4.1 Z vidika uporabnika . . . . . . . . . . . . . . . . . . . . . . . . .66

    3.4.2 Z vidika tirih jezikovnih spretnosti . . . . . . . . . . . . . . .67

    3.4.3 Z vidika unih ciljev . . . . . . . . . . . . . . . . . . . . . . . . .67

    3.5 Drugi naini uporabe . . . . . . . . . . . . . . . . . . . . . . . . . . . .68

    3.6 Vrednotenje 1: primerjava s slovarjem kolokacij . . . . . . . . . . .68

    3.6.1 Uporaba za tevilne slovnine povezave. . . . . . . . . . . .69

    3.6.2 Metoda za izbiranje kolokacij . . . . . . . . . . . . . . . . . . .70

    3.6.3 Uporaba za izbiranje stavnih primerov . . . . . . . . . . . .70

    3.6.4 Uporaba za leksikalno-semantine podatke . . . . . . . . .71

    3.7 Vrednotenje 2: vrednotenje izdelave kolokacijskega slovarja . . .73

    3.8 Povzetek in nadaljnja vpraanja . . . . . . . . . . . . . . . . . . . . . .77

    4 Kolokacijski odnos na daljavo med prislovi in modalno obliko na koncu stavka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .79

    4.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .79

    4.2 Razprenost prislovov in znailnosti korpusov. . . . . . . . . . . . .80

    4.2.1 Porazdelitev korpusov . . . . . . . . . . . . . . . . . . . . . . .81

    4.2.2 Razvranje korpusov v skupine . . . . . . . . . . . . . . . . .83

    4.2.3 Odstopanja v razprenosti prislovov v korpusu glede na vrednost entropije. . . . . . . . . . . . . . . . . . . . . . . . . .84

    4.3 Tendenca kolokacijskih odnosov prislovov in modalne oblike na koncu stavka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .85

    4.3.1 Vrste kolokacij med prislovi in modalnostjo ter predmet raziskave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .85

    4.3.2 Primerjava med Kudjevimi podatki in spletnim korpusom . . . . . . . . . . . . . . . . . . . . . . .86

    Kolokacije in kolokacije na daljavo_FINAL.indd 4 4.5.2016 10:50:07

  • 54.3.2.1 Kolokacijski odnos med prislovi in modalno obliko na koncu stavka pri Kudju . . . . . . . . . .86

    4.3.2.2 Kolokacije povednih prislovov in modalnih oblik na koncu stavka v spletnem korpusu. . . . .88

    4.3.2.3 Primerjava Kudjevih in spletnih podatkov . . . .90

    4.3.3 Primerjava korpusov formalnega in neformalnega govorjenega jezika . . . . . . . . . . . . . . . . . . . . . . . . .92

    4.3.4 Primerjava med razlinimi korpusi ubenikov . . . . . . . .92

    4.3.4.1 Razprenost povednih prislovov pri korpusih ubenikov . . . . . . . . . . . . . . . . . . . . . . . . .93

    4.3.4.2 Povedni prislovi in modalne oblike v korpusih ubenikov . . . . . . . . . . . . . . . . . . . . . . . . .93

    4.3.5 Znailnosti posameznih korpusov z vidika znanstvenih besedil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .95

    4.3.6 Tendenca z vidika korpusa belih knjig . . . . . . . . . . . . .96

    4.3.6.1 Razprenost povednih prislovov v korpusu belih knjig. . . . . . . . . . . . . . . . . . . .96

    4.3.6.2 Kolokacije prislovov in modalnih oblik v korpusu belih knjig. . . . . . . . . . . . . . . . . . . .97

    4.4 Povzetek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .99

    5 Luenje kolokacij na daljavo med prislovi in modalnimi oblikami na koncu stavka ter predlog za uporabo v unem gradivu za japonino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    5.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    5.2 Luenje prislovov in njihovih kolokacij na daljavo. . . . . . . . . 102

    5.3 Luenje modalnih oblik . . . . . . . . . . . . . . . . . . . . . . . . . 103

    5.3.1 Metoda pridobivanja modalnih oblik . . . . . . . . . . . . . 103

    5.3.2 Rezultat luenja modalnih oblik . . . . . . . . . . . . . . . 106

    5.3.3 Vrednotenje izluenih kolokacij prislovov in modalnih oblik . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

    5.3.4 Primerjava s Kudjevimi podatki. . . . . . . . . . . . . . . . 112

    5.3.5 Primerjava z uravnoteenimi publikacijami . . . . . . . . . 113

    5.4 Razvoj unega gradiva za tudente japonine . . . . . . . . . . . 115

    5.4.1 Korpusno zasnovan predlog za izdelavo unega narta besedia. . . . . . . . . . . . . . . . . . . . . 115

    Kolokacije in kolokacije na daljavo_FINAL.indd 5 4.5.2016 10:50:07

  • 65.4.1.1 Obravnavanje prislovov in modalnih oblik v ubenikih japonine . . . . . . . . . . . . . . . . . 115

    5.4.1.2 Vrste korpusov in cilji uencev . . . . . . . . . . . 118

    5.4.1.3 Frekvenca v korpusu in zaporedje obravnave une snovi . . . . . . . . . . . . . . . . . . . . . . . . 118

    5.4.1.4 Predlogi za izdelavo unega narta za besedie prislovov . . . . . . . . . . . . . . . . . . 119

    5.4.1.5 Predlogi za izdelavo unega narta za besedie prislovov glede na kolokabilnost med prislovi in modalno obliko na koncu stavka. . . . . . . . . . . . . . . . . . . . . . . 121

    5.4.2 Predlogi za urejanje slovarja . . . . . . . . . . . . . . . . . . 123

    5.5 Povzetek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

    6 Zakljuek in nadaljnja vpraanja . . . . . . . . . . . . . . . . . . . . . . . 127

    6.1 Povzetek rezultatov in splone opazke . . . . . . . . . . . . . . . . 127

    6.2 Nadaljnja vpraanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

    Viri in literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

    Stvarno kazalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

    Kolokacije in kolokacije na daljavo_FINAL.indd 6 4.5.2016 10:50:07

  • 7Uvodni del

    V priujoi monografiji je jezik obravnavan kot dinamien fenomen, z empirinim pristopom pa so analizirane obsene podatkovne baze. Tovrstni pristop se v jezi-kovni teoriji v irem pogledu sklada s funkcionalizmom, poudarja pa uporabne in operativne vidike jezika. V tem smislu se precej razlikuje od formalizma, ki v osno-vi temelji na intuiciji raziskovalca. V priujoo raziskavo je bila vkljuena empiri-na metodologija, in sicer objektivno opazovanje predmeta preuevanja kolokacij, na podlagi obsenega gradiva japonskega jezika. Rezultati analize so aplicirani na podroje izobraevanja japonine kot tujega jezika.Za uence tujega jezika so kolokacije, istoasno pojavljanje dveh ali ve besed ali pa besede in doloenih stavnih vzorcev, eden najpomembnejih delov uenja. Ko-lokacije so v vsakem jeziku edinstvene in pogosto teko predvidljive le na podlagi maternega jezika ali jezika, ki ga e obvladamo, kar predstavlja veliko breme pri uenju. Vendar pa kolokacije do sedaj e niso bile zadostno vkljuene v une narte pri pouevanju japonine, primanjkuje tudi unih materialov, kot je npr. slovar kolokacij, zasnovan na uravnoteenem korpusu japonskega jezika, ki bi bili lahko uencem v pomo. Po drugi strani pa je izdelava obsenega korpusa japonskega jezika BCCWJ v zadnjem desetletju (20062011) omogoila izvajanje podrobnih raziskav o kolokacijah ter korpusno zasnovano pripravo unih gradiv, slovarjev in drugih pripomokov, tako da se na tem podroju kot tudi pri pomoi uencem japonine kot tujega jezika priakuje napredek.Osnovni namen raziskave je analizirati in ovrednotiti kolokacijske povezave s po-mojo ve razlinih obsenih korpusov japonskega jezika in posebej na primeru prislovov in modalnih oblik pokazati pomembnost uporabe korpusa pri izdelavi unih nartov in unega gradiva. Kot je v nadaljevanju natanneje povedano, je cilj raziskave dvojen.Prvi cilj je razviti in ovrednotiti japonsko razliico besednih skic orodja Sketch Engine (SkE), ki omogoa pridobitev kolokacij japonskega jezika, in lahko slu-i kot osnova za izdelavo kolokacijskega slovarja za uence japonine. Za to je bilo treba uporabiti obseni spletni korpus JpWaC in izdelati slovnino datoteko v japonini, ki zajema razline kolokacijske odnose japonskega jezika s pomojo korpusne poizvedbene sintakse (ang. corpus query syntax), in sicer z uporabo regu-larnih izrazov (ang. regular expressions), anglekih prevodov besednih vrst morfolo-kega analizatorja ChaSen, osmiljenih kolokacijskih vzorcev japonskega jezika in korpusnega orodja SkE. Vrednotenje rezultatov opravimo z metodo primerjanja z obstojeimi slovarski viri ter izvajanjem anket.

    Kolokacije in kolokacije na daljavo_FINAL.indd 7 4.5.2016 10:50:07

  • 8Drugi cilj je omogoiti, da se prislovi in modalne oblike na koncu stavka zaja-mejo kot kolokacije na daljavo ter pridobijo iz korpusov in uporabijo za uenje japonine kot tujega jezika. Zato je treba v korpusih raziskati naravo kolokacijskih povezav in na podlagi rezultatov kombiniranja izrazov izdelati seznam pogostih modalnih oblik in njihovih variant. Na podlagi ugotovitev elimo podati predlog unega narta za besedie in dodatne podatke za slovar, ki bi vkljuevali izlue-ne informacije o prislovih in modalnih oblikah. V tem delu raziskave empirino opazujemo pojav v trinajstih razlinih korpusih in podkorpusih japonskega jezika ter primerjamo in kategoriziramo korpuse in kolokacije s statistinimi metodami. Vrednotenje rezultatov opravimo z izvajanjem ankete ter jih primerjamo z obsto-jeimi unimi pripomoki in tako potrdimo pomembnost empirinega pristopa.V priujoi monografiji uporabimo trinajst (pod)korpusov, ki so opisani v Tabeli 1. Naslednje podatke korpusa JpWaC uporabimo glede na namen raziskav: a) na-kljuni primeri stavkov, b) vzorni korpus z 20 milijoni besed, sestavljen nakljuno iz celotnega korpusa, c) celotni korpus JpWaC (400 milijonov besed).Tabela 1: Seznam uporabljenih korpusov.

    Vrsta korpusa Kratica Razlaga Dostopnost

    Gov

    orni

    NUJCC Neformalni pogovori (3584 KB)

    Univerza v Nagoyihttp://tell.cla.purdue.edu/chakoshi/public.html

    Oikawa Formalni intervjuji (817 KB) Podiplomska univerza za napredne tudije (Sokendai)

    Spl

    etni

    KokkenOC Yahoo! Chiebukuro, forum z vpraanji in odgovori (primeri iz korpusa BCCWJ iz leta 2007) (16,3 MB)

    Nacionalni intitut za japonski jezik in jezikoslovje

    JpWaC Obseni spletni korpus (7,3 GB)

    Japonska razliica orodja SkEhttp://www.sketchengine.com

    Pis

    ani

    Ubeniki KokugoK Ubeniki za japonino za osnovno olo (3723 KB)

    Tokijski intitut za tehnologijo

    KokkenK Ubeniki za srednjo olo (BCCWJ) (437 MB)

    Nacionalni intitut za japonski jezik in jezikoslovje

    KKK Ubeniki za japonino, ki so zajeti v KokkenK (788 KB)

    Nacionalni intitut za japonski jezik in jezikoslovje

    Kolokacije in kolokacije na daljavo_FINAL.indd 8 4.5.2016 10:50:07

  • 9Vrsta korpusa Kratica Razlaga DostopnostP

    isan

    i

    Ubeniki s podroja naravoslovja

    16K 16 ubenikov s podroja naravoslovja za tudente (2,45 MB)

    Tokijski intitut za tehnologijo

    lanki s podroja naravoslovja

    NLP lanki iz japonske revije NLP (719 KB)

    Japonsko zdruenje za NLP (Natural Language Processing obdelava naravnega jezika)

    Bela knjiga KokkenOW Vladna bela knjiga (primeri iz korpusa BCCWJ) (16,4 MB)

    Nacionalni intitut za japonski jezik in jezikoslovje

    Uravnoteeni korpus

    KokkenBK Knjige, revije in asopisi iz publikacij in knjinice (primeri iz korpusa BCCWJ) (68,6 MB; 140 MB)

    Nacionalni intitut za japonski jezik in jezikoslovje

    asopis Mai2002 asopis Mainichi shimbun, podatki za leto 2002 (100MB)

    asopisna hia Mainichi shimbun (CDROM)

    Drugo Kud asopisi, moderna literatura

    Kud (2000)

    Na koncu uvodnega dela se elim e posebej zahvaliti prof. Kikuko Nishina, astni profesorici na Tokijski tehnoloki univerzi, in prof. Andreju Bekeu, rednemu pro-fesorju na Filozofski fakulteti Univerze v Ljubljani, ki sta me med raziskavo skrb-no in potrpeljivo usmerjala, mi pomagala z nasveti ter mi tudi sicer stala ob strani. Zahvala gre tudi prof. Chikako Shigemori Buar, prof. Masanoriju Nakagawi, prof. Shin-ichiju Mayekawi, prof. Hiroyukiju Akami, prof. Masau Muroti za dragocene nasvete. Za podporo se zahvaljujem tudi tevilnim kolegom: dr. Boru Hodoku, ki je izdelal program za oznaevanje modalnih oblik, prof. Asuki Terai s Tokijskega intituta za tehnologijo za obilico nasvetov o uporabi statistinih metodologij, prof. Terryju Joyceu, mag. Kenjiju Yoshihashiju, prof. Takafumiju Utashiru, prof. Hong--Quan Cao, dr. Naomi Idi, lanom raziskovalne skupine orodja SkE, vkljuno s al prezgodaj pokojnim prof. Adamom Kilgarriffom, dr. Vojtchom Kovom in dr. Vidom Suchomelom. Hvalena sem tudi skupini za izdelavo korpusov in skupini za didaktiko japonine kot tujega jezika na Nacionalnem intitutu za japonski jezik in jezikoslovje, ki so mi vseskozi omogoali uporabo potrebnega gradiva. Za-hvaljujem se tudi tudentkama Filozofske fakultete Mateji abjek in Poloni Vehar za prevajanje raziskovalnega dela, ki je vkljuen v priujoo monografijo, ter velike-mu tevilu ljudi, ki so v okviru raziskave sodelovali pri vrednotenju. In nazadnje, od

    Kolokacije in kolokacije na daljavo_FINAL.indd 9 4.5.2016 10:50:07

  • 10

    srca se zahvaljujem svojoj porodici, mami Zorici, tati Jovanu, suprugu eljku i erkama Alji i Iris za ogromnu podrku i sve dragocene rei pune podsticaja i ljubavi.Dodatna opombaJaponske besede so zapisane po sistemu Hepburn, kjer se ch priblino izgovarja kot slovenski , j kot slovenski d, ts kot c, sh kot in y kot j. Dolgi sa-moglasniki se zapiejo aa, ii, uu, ee ali ei, oo ali ou, razen v primeru e v slovenini ustaljenih imen, kot je npr. Tokio, in e ustaljenih transkripcij osebnih imen, kot je npr. Kud.

    Kolokacije in kolokacije na daljavo_FINAL.indd 10 4.5.2016 10:50:07

  • 11

    1 Empirini in aplikativni pristop v analizi kolokacij

    V tem poglavju najprej na kratko predstavimo zaetke razvoja korpusnega jeziko-slovja v svetu in na Japonskem, opredelimo metodoloki okvir tega podroja ter razloimo vidike uporabe korpusa pri uenju tujega jezika. Zatem povzamemo iz-sledke dosedanjih raziskav o kolokacijah in kolokacijah na daljavo ter predstavimo raziskovalne cilje, metode in uporabljeno gradivo v analizi.

    1.1 Razvoj korpusnega jezikoslovja

    Za raziskovanje pojavov v jeziku obstajajo razline metode in ena izmed njih je analiza zbranih jezikovnih podatkov, imenovanih korpusi. Razvoj raunalnikov in drugih naprednih tehnologij je omogoil digitalizacijo tovrstnih podatkov in di-gitalno pregledovanje, tako da se dandanes korpusi gradijo preteno kot obsene zbirke nartno zbranega gradiva v elektronski obliki. Gradnja in uporaba korpusov sta napredovali z razvojem korpusnega jezikoslovja in prinesli velike spremembe na razlinih podrojih, kot sta na primer jezikovno izobraevanje in leksikografija. Korpusi namesto intuicije in introspekcije posebno poudarjajo jezik v dejanski rabi in tako poskuajo orisati dejansko stanje v jezikovni komunikaciji. Poleg tega so korpusi pripomogli k oivitvi deskriptivnega pristopa k jeziku, saj poudarjajo opis slovnice, ki je taka, kot je in se izogibajo tradicionalno preskriptivnemu pristopu, tj. slovnici, kakrna bi morala biti (Ishikawa, 2008).Korpusno jezikoslovje se je zaelo razvijati v 50. in 60. letih 20. stoletja. Leta 1964 je bil objavljen Brownov korpus, ki se je proglasil za prvi korpus na svetu. Izdelan je bil na univerzi Brown v ZDA, obsegal pa je milijon besed iz knjig in leposlovja. V istem asu je Noam Chomsky izoblikoval teorijo o generativni slovnici, ki je bolj poudarjala zmonost ustrezne tvorbe jezikovnih oblik (slovnina kompetentnost) kot pa dejansko tvorbo jezikovnih oblik (jezikovna dejavnost). Zaradi monega vpliva teorije Chomskega raziskave, zasnovane na korpusih, niso bistveno napre-dovale. V Evropi se v 60. in 70. letih pojavljata korpus Lancaster-Oslo/Bergen (LOB) in korpus London-Lund (The Survey of English Usage), slednji le v obliki zapisov posnetih pogovorov. Moan vpliv sta imela angleki jezikoslovec Halliday (1966, 1978, 1991) in njegova funkcionalistina teorija, zato se je korpusno jeziko-slovje zaelo razvijati tudi na tem podroju. V 90. letih sta bila v Angliji razvita dva obsena korpusa, in sicer British National Corpus (BNC) in The Bank of English, oba pa sta bila korpusa britanske angleine. BNC je upoteval naeli reprezenta-tivnosti in uravnoteenosti, obsegal pa je 100 milijonov besed. The Bank of English je bil usmerjen v opazovanje lingvistinih sprememb v realnem asu, sasoma pa se je raziril do obsega 650 milijonov besed, ki so del zdaj e zelo obsenega korpusa

    Kolokacije in kolokacije na daljavo_FINAL.indd 11 4.5.2016 10:50:07

  • 12

    Collins.1 Izdelava obeh korpusov je vplivala na zalonike slovarjev, ki so ugotovili, da sta gradnja korpusov in leksikografija tesno povezani (Ishikawa, 2008).Zgodovina sestavljanja slovarjev angleine je e posebej dolga in pestra, njihova ciljna publika pa so predvsem uenci, ki se uijo tega jezika kot tuji oz. drugi tuji jezik. Prvi slovar na svetu, ki je temeljil na korpusu v elektronski obliki, je bil slo-var anglekega jezika Collins COBUILD English Language Dictionary, ki ga je Collins izdal leta 1987 v Angliji. Pozneje so bili izdelani ubeniki in leksikoni, ki temeljijo na korpusih in se jih e ve desetletij uporablja za pouevanje anglekega jezika (Ldeling in Kyt, 2008). Reemo lahko, da raziskave, ki temeljijo na korpu-sih anglekega jezika, s tevilnimi ugotovitvami sluijo kot referenca za korpusno jezikoslovje v japonskem in drugih jezikih.Za japonino so v 50. in 60. letih z uporabo raunalnika opravili prve raziskave besedia (npr. National Language Research Institute, 1970, 196264; Ito, 2003; Mi-nami, 1974). Kljub izredno zgodnji uporabi raunalnikov za procesiranje jezika se japonsko korpusno jezikoslovje ni razvijalo tako hitro kot angleko. V 60. letih so bili korpusi sestavljeni iz asopisov ali internih dokumentov intitucij in javnosti niso bili dostopni. V 80. letih se je zael projekt Japonski elektronski slovar ( Japan Electronic Dictionary, EDR), leta 1995 pa je korpus skupaj s slovarjem EDR postal splono do-stopen. Korpus EDR v glavnem vsebuje asopisne lanke, priblino 200.000 stavkov iz revij v japonskem jeziku in tudi okoli 100.000 stavkov v anglekem jeziku.Pozneje so bili na Japonskem zgrajeni korpusi asopisnih lankov, npr. Nikkei shimbun in Mainichi shimbun, korpus Univerze v Kjotu, ki je vkljueval podatke o besednih vrstah in strukturni odvisnosti,2 ter prvi govorni korpus japonskega jezika (Corpus of Spontaneous Japanese, CSJ). eprav so zaeli korpuse pogosto uporabljati kot enotne podatkovne baze za statistino obdelavo jezika (Matsumo-to, 2003), je bila uporaba korpusov na podroju jezikoslovja in japonskega jezika precej omejena, uni narti za besedie, ubeniki in una gradiva pa so bili zasno-vani na podlagi izkuenj in intuicije uiteljev in avtorjev.3 V tem asu se je v Evropi v veliki meri uporabljala metoda gradnje korpusov na podlagi vnaprej doloene strukture, ki temelji na ideji Brownovega korpusa in upotevanja ravnovesja v jezi-ku, izdelava uravnoteenega korpusa japonine pa je nekoliko zamujala.V zadnjem desetletju pa se je poloaj za japonski jezik na podroju korpusnega jezikoslovja mono spremenil. Za ta preobrat je v veliki meri zasluen Nacionalni

    1 http://www.mycobuild.com/about-collins-corpus.aspx (dostop 19. 9. 2014)2 V japonini kakariuke jouhou ().3 Razlog je lahko v tem, da so imeli lingvisti formalne struje, kot so Chomsky in drugi, ki so v zaetnem obdobju

    kritizirali korpusno jezikoslovje, v Ameriki in na Japonskem moan vpliv.

    Kolokacije in kolokacije na daljavo_FINAL.indd 12 4.5.2016 10:50:07

  • 13

    intitut za japonski jezik in jezikoslovje, ki se je usmeril v gradnjo obsenih korpu-sov japonskega jezika, njihovo vrednotenje in splono uporabo v jezikoslovnih in drugih raziskavah. Najveji korak je bil napravljen s petletnim projektom4 izdelave obsenega Uravnoteenega korpusa sodobne pisane japonine (Balanced Corpus of Contemporary Written Japanese, BCCWJ), od leta 2006 do 2011.Korpus BCCWJ se uporablja in vrednoti ne samo v okviru jezikoslovja v ojem pomenu, temve tudi ire, na primer za jezikovno izobraevanje in pouevanje japonine, leksikografijo in obdelavo naravnega jezika (Maekawa, 2006a,b; Mae-kawa et al., 2013). V zadnjem desetletju se tudi pri pouevanju japonine v veliki meri iri ideja o uporabi korpusa in o potrebi, da se jezikovna gradiva za uence oblikujejo na osnovi objektivnih jezikovnih podatkov. Z uporabo korpusa BCCWJ je bilo opravljenih ve raziskav o praktini uporabi korpusov pri pouevanju ja-ponine (npr. Hashimoto, 2008; Sunakawa, 2008; Nishina, 2008; Hodoek in Nishina, 2012; Srdanovi et al. 2009a,b, 2014; Srdanovi in Sakoda, 2013).

    1.2 Uporaba korpusov pri uenju tujega jezika

    Korpusi imajo moan vpliv na razvoj jezikoslovja, uporabljajo se pa tudi pri po-uevanju tujega jezika. Tudi na tem podroju so v ospredju raziskave, opravljene za angleino. Od 19. stoletja sta imeli historina lingvistika in fonetika moan vpliv na pouevanje jezikoslovja, lahko pa reemo, da je korpusno jezikoslovje svoje mesto dobilo ele po letu 1990 (Howatt, 1984; Ishikawa, 2008). Hunston (2002) meni, da je uporaba korpusov povzroila dve veliki spremembi na podroju pou-evanja jezikov. Prva je ta, da so s tem omogoeni novi naini opisovanja jezika in so izluene jezikovne informacije bogateje, npr. frekvenca gesel, kombinacija besed, kombinacija besed in slovninih vzorcev ter besede, znailne za doloeno zvrst. Druga sprememba je monost priprave in vrednotenja unega gradiva, ki ni odvisno od subjektivnih presoj in ocen, na primer pri pripravi slovarjev, ubenikov, unih nartov in pri neposrednem uenju jezika.Pri pouevanju jezikov rabo korpusov delimo na dva tipa direktno in indi-rektno. Pri direktni rabi poznamo podatkovno usmerjeno uenje (data-driven learnig ali DDL). Podatkovno usmerjeno uenje je pouevalna metoda, pri kateri uenci uporabljajo korpus, da odkrijejo rabo jezika ( Johns, 1991). Na primer, uenec primerja ubenik slovnice z rezultati korpusne analize ter z vrednotenjem pride do novih znanj. V ta namen se uporabljajo razlina orodja kot so siste-mi za pomo pri uenju, konkordance in bolj napredni korpusni iskalni sistemi 4 Projekt MEXT Grant-in-Aid for Scientific Research Priority Area Program: Japanese Corpus, v nadaljevanju

    projekt Korpus japonine.

    Kolokacije in kolokacije na daljavo_FINAL.indd 13 4.5.2016 10:50:07

  • 14

    (Smr, 2004; Smith et al, 2007, 2008). Hirotani (2007) podaja primer raziskave o izdelavi in uporabi konkordanc pri pouevanju japonine, pri katerem uenci uporabljajo konkordance in s tem sami odkrijejo svoje napake v rabi jezika. Poleg tega je bilo razvitih ve sistemov za podporo uenju, ki so namenjeni za uence japonine. To sta na primer podporna sistema za bralno razumevanje ASUNA-RO (Nishina in Yoshihashi, 2007) in Reading Tutor (Kawamura, 1993) ter sis-tem za pomo pri pisanju Natsume (Nishina, 2008; Hodoek in Nishina, 2012).Indirektna raba korpusa pomeni razvijanje unih pripomokov, ki temeljijo na kor-pusih. Pri tem raziskovalci in avtorji unega gradiva uporabijo prednosti korpusa, da dopolnijo slovarje in ubenike. Ta pristop tei k izboljavi unega narta in oblikovanju unega gradiva, ki je v skladu z dejanskim stanjem v jeziku. Korpus ravno tako zagotovi merila za uno gradivo in omogoa celostno analizo gradiva na mikro- in makroravni.Pri izdelavi slovarjev in slovninega gradiva za angleino so korpusi prinesli velike spremembe (Sinclair, 1987). Korpusi so postali temeljno orodje za leksikografijo, velika zalonika podjetja pa spodbujajo izdelavo slovarjev, osnovanih na korpusih (Hunston, 2002). V slednjih so za razliko od tradicionalnih mone dopolnitve z informacijami o frekvenci, s pomeni besed, primeri in opisi registra ter kolokacija-mi. Uporabniku je na primer mogoe podati objektivne informacije o frekvenci in spremeniti barvo besede glede na frekvenco ali dodati oznako frekvence. Longma-nov slovar sodobne angleine (Longman Dictionary of Contemporary English) ima denimo oznaene tri stopnje frekvence za govorni in pisni jezik. Angleki slo-var za vijo stopnjo Collins Cobuilt Advanced Learners English Dictionary ima besede prikazane glede na vrstni red frekvenc. Z uporabo korpusa za uence lahko poleg tega uenci sami najdejo morebitne napake ter vnaajo in dopisujejo opombe (Gillard in Gadsby, 1998; Ishikawa, 2008).Korpusi imajo pomembno vlogo tudi pri pripravi unih nartov, e posebno pri pripravi besedia (Sinclair in Renouf, 1988; Willis, 1990). Besedie je osnova za znanje tujega jezika in je poleg slovarja eden izmed osnovnih unih pripo-mokov. Pri pripravi pride do teav pri izbiri, katere besede so bolj relevantne. S tradicionalnega vidika jih po subjektivni presoji glede na frekvenco in dru-ge faktorje izbere uitelj oz. sestavljalec besedia (Palmer, 1930; West, 1953; JACET4000, 1993). Obstaja pa tudi stalie, ki daje prednost objektivnim po-datkom. Sem spadata npr. seznam, ki temelji na Brownovem korpusu (Kuera in Franci, 1967), in seznam, ki temelji na korpusu BNC (Leech et al., 2001). Omenjena seznama vsebujeta podatke o stopnji frekvence besedne vrste, stopnji frekvence enot v govornem in pisnem jeziku ter posebnosti enot glede na register,

    Kolokacije in kolokacije na daljavo_FINAL.indd 14 4.5.2016 10:50:07

  • 15

    ki jih sicer drugae redko vidimo.5 Obstajajo tudi primeri seznamov, oblikova-nih z uporabo razlinih virov. Seznam besedia JACET8000 (2003), namenjen japonskim uencem anglekega jezika, je denimo sestavljen na podlagi razmerja frekvenc v korpusu BNC in za te namene izdelanega podkorpusa anglekih be-sedil, s katerimi se uenci pogosto sreujejo.Nekateri raziskovalci izraajo negativno stalie do uporabe korpusov pri poue-vanju jezika. Widdowson (2000) kritizira uporabo korpusov, saj ti okrnijo kon-tekst, zato to ne more biti avtentien jezik. Cook (1998) meni, da s prevelikim zaupanjem v frekvence tvegamo, da uenje usmerimo preozko in tako zanema-rimo besede z nizkimi frekvencami, ki pa imajo lahko specifien pomen. A kljub kritikam to e ne pomeni, da je obstojea metoda subjektivne analize in razvoja unega gradiva zadovoljiva. Leech (1997) priznava, da je naelo najpogosteje je tudi najpomembneje preve poenostavljena, vendar pa je teko rei, da frekven-ni podatki, pridobljeni iz korpusa, niso pomemben empirini prispevek k unim gradivom (Ishikawa, 2008).Uporaba korpusov je pritegnila nekaj pozornosti tudi na podroju pouevanja ja-ponine, v precejnji meri pa je bila uresniena pri delu na projektu Korpus japon-ine (BCCWJ). Leksikografska sekcija, vkljuena v projekt, je opravila raziskavo v povezavi s pripravo japonskega slovarja, ki bi temeljil na korpusu (Ogino, 2008), sekcija za pouevanje japonine pa je imela nalogo, da za uence japonine pri-pravi raznovrstno uno gradivo (Sunakawa, 2008). Tudi za pripravo besedia je obseni korpus BCCWJ postal pomemben jezikovni vir (Yamauchi, 2006, 2008).

    1.3 Zaetki raziskovanja kolokacij in pomembnost uenja kolokacij za tuje uence

    Tradicionalno je bila enobesedna enota ena od glavnih predmetov preuevanja v je-zikoslovju, skupaj s slovninimi pravili o tvorbi pravilnih stavkov. Rezultati, prido-bljeni s korpusnojezikoslovnimi metodami, pa kaejo, da beseda ne deluje neodvi-sno, ampak se so-pojavlja z drugimi besedami in drugimi jezikovnimi elementi, da dosee svoj namen (Ishikawa, 2008; Srdanovi 2014). Te ugotovitve so prispevale k vse aktivnejemu raziskovanju kolokacij oz. kolokacijskih povezav. Zaetki tovr-stnih raziskav segajo e v predkorpusno obdobje, in sicer na podroju pouevanja angleine na Japonskem (npr. Saitou, 1905; Palmer, 1938; Hornby, 1954). Te raz-iskave so vplivale na J.R. Firtha (1951) iz londonske ole in so prispevale k razvoju

    5 Na primer, pri frekvenci en milijon se beseda exercise vaditi, vadba kot samostalnik pojavi 79-krat, kot glagol pa 49-krat. Beseda what kaj se v govornem jeziku pojavi 7313-krat, v pisnem jeziku pa 1936-krat. Tovrstni podatki postanejo razvidni iz korpusne analize.

    Kolokacije in kolokacije na daljavo_FINAL.indd 15 4.5.2016 10:50:07

  • 9 789612 377649

    ISBN 978-961-237-764-9

    ISBN 978-961-237-764-9

    Irena Srdanovi je bila rojena leta 1974 v Beo-gradu, kjer je konala diplomski tudij Japon-ski jezik in knjievnost na Filozofski fakulteti Univerze v Beogradu. Magistrirala je na po-droju jezikoslovja na Oddelku za splono in primerjalno jezikoslovje Filozofske fakultete Univerze v Ljubljani. Doktorski tudij je za-kljuila najprej na Tokijski tehnoloki univerzi na Japonskem, potem pa tudi na Filozofski fakulteti Univerze v Ljubljani. Poleg te mo-nogra je je objavila e tiri prispevke v mo-nogra jah, 14 znanstvenih lankov v revijah z mednarodno recenzijo in 19 znanstvenih lankov na mednarodnih simpozijih. Veliko let je bila pedagoko in raziskovalno aktivna na Filozofski fakulteti Univerze v Ljubljani. Bila je vodja raziskovalnega projekta in sode-lovala e v sedmih ter eno leto gostovala na Nacionalnem intitutu za japonski jezik in je-zikoslovje v Tokiu. Leta 2015 je osnovala novi diplomski tudij japonologije na Univerzi Ju-raja Dobrile v Puli, kjer je trenutno zaposlena.

    Priujoa monogra ja obravnava kolokacije v japonskem jeziku z jezikoslovnega in pedago-kega vidika. Raziskava temelji na empirinem korpusnem pristopu analize jezika s pomojo tevilnih korpusov in orodja za analizo in pri-kaz jezikovnih podatkov, ki ga avtorica ustvar-ja in prilagaja za potrebe raziskave. Delo iz-postavlja pomembnost pojava kolokacij na daljavo in ga podrobno obravnava na prime-ru modalnih prislovov in modalnih izrazov na koncu stavka. Rezultati raziskave kaejo na tendence zaznamovanih sopojavitev in njiho-vo odvisnost od zvrsti korpusa. Obravnavane so tudi kolokacije, raziskane v u nem gradivu za japonski jezik, izsledki pa kaejo, da njihova obravnava v obstoje ih u benikih in slovarjih ni zadostna. Iz tega razloga so ponujeni pre-dlogi za izbolj avo tega gradiva.

    Irena Srdanovi

    Kolokacije in kolokacije na daljavo v japonskem jeziku: korpusni pristop

    Kolo

    kaci

    je in

    kol

    okac

    ije n

    a da

    ljavo

    v ja

    pons

    kem

    jezi

    ku: k

    orpu

    sni p

    rist

    opIr

    ena

    Srda

    novi

    Kolokacije_in_kolokacije_na_daljavo_naslovka_FINAL.indd 1 4.5.2016 10:46:07