A HuComTech adatbázis mint kutatási infrastruktúra · központi gondolat: megosztás metaadatok...

Post on 20-Aug-2020

0 views 0 download

Transcript of A HuComTech adatbázis mint kutatási infrastruktúra · központi gondolat: megosztás metaadatok...

A HuComTech adatbázis mint kutatási infrastruktúraVáradi Tamás

varadi.tamas@nytud.mta.hu

MTA Nyelvtudományi Intézet

Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály

Háttér

Nyers adat→ nyelvi eroforrás

• annotáció

• metaadatok

• szabványok

Eroforrások→ infrastruktúra• CLARIN (2008 - )

• CESAR@META-SHARE (2011 - 2013)

• HUNCLARIN - NEKIFUT (2009 - 2014)

2/13

A nyelvi eroforrások fogalma

Nem pusztán nyers adatok halmaza

• reprezentatív minta• annotáció = hozzáadott érték

• XML technológia• szabványos kódolási útmutató TEI (Text Encoding Initiative)

• metaadatok

3/13

A nyelvi infrastruktúra fogalma

Nem pusztán eroforrások halmaza

• központi gondolat: megosztás

• metaadatok és szabványos annotáció• az eroforrásokmetaadat megfelelo gondozása

• lehetoleg szabványos és egységes annotáció• egyértelmu és átlátható jogi helyzet

• interoperabilitás

• fenntarthatóság

4/13

CLARIN

5/13

Virtual Language Observatory

6/13

META-NET

7/13

CESAR

8/13

META-SHARE

9/13

HUCOMTECH in META-SHARE

10/13

Interoperabilitás

11/13

Fenntarthatóság

12/13

Köszönöm a figyelmet!

13/13