A HuComTech adatbázis mint kutatási infrastruktúra · központi gondolat: megosztás metaadatok...
Transcript of A HuComTech adatbázis mint kutatási infrastruktúra · központi gondolat: megosztás metaadatok...
A HuComTech adatbázis mint kutatási infrastruktúraVáradi Tamás
MTA Nyelvtudományi Intézet
Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály
Háttér
Nyers adat→ nyelvi eroforrás
• annotáció
• metaadatok
• szabványok
Eroforrások→ infrastruktúra• CLARIN (2008 - )
• CESAR@META-SHARE (2011 - 2013)
• HUNCLARIN - NEKIFUT (2009 - 2014)
2/13
A nyelvi eroforrások fogalma
Nem pusztán nyers adatok halmaza
• reprezentatív minta• annotáció = hozzáadott érték
• XML technológia• szabványos kódolási útmutató TEI (Text Encoding Initiative)
• metaadatok
3/13
A nyelvi infrastruktúra fogalma
Nem pusztán eroforrások halmaza
• központi gondolat: megosztás
• metaadatok és szabványos annotáció• az eroforrásokmetaadat megfelelo gondozása
• lehetoleg szabványos és egységes annotáció• egyértelmu és átlátható jogi helyzet
• interoperabilitás
• fenntarthatóság
4/13
CLARIN
5/13
Virtual Language Observatory
6/13
META-NET
7/13
CESAR
8/13
META-SHARE
9/13
HUCOMTECH in META-SHARE
10/13
Interoperabilitás
11/13
Fenntarthatóság
12/13
Köszönöm a figyelmet!
13/13