Eureka Eurostars project E! 4365
description
Transcript of Eureka Eurostars project E! 4365
SOLIM„Erdvinės ontologijos kalbos naudojimas modeliuojant multimedijos informaciją“
(Spatial Ontology Language for Multimedia Information Modeling)
Eureka Eurostars project E! 4365
Apie EUROSTARSApie EUROSTARS
• EUROSTARS yra pirmoji Europos inovacijų programa, specialiai skirta finansuoti mažas ir vidutines įmones (MVĮ), vykdančias mokslinius tyrimus, investuojančias į inovacijų ir naujų technologijų kūrimą. Tai Europos Komisijos (EK) ir programos „Eureka“ valstybių narių iniciatyva
• EUROSTARS programos tikslas – skatinti Europos MVĮ, vykdančias mokslinius tyrimus ir inovacijas, kurti konkurencingus produktus pasaulinėje rinkoje ir tapti lyderėmis savo srityse, skiriant finansavimą tarptautiniams mokslo ir inovacijų projektams.
KodėlKodėl EUROSTARSEUROSTARS?
Dalyvavimo programoje privalumai:•Europos parama skirta mažų ir vidutinių įmonių moksliniams tyrimams ir plėtrai•Paprastos dalyvavimo projekte procedūros ir ataskaitos•Nacionalinio projekto koordinatoriaus pagalba•Stipri programos orientacija į praktinį rezultatą•Galimybė sukurti inovatyvias, konkurencingas technologijas, produktus•Galimybė užmegzti ilgalaikius ryšius su užsienio partneriais•Įgyti dalyvavimo tarptautiniuose projektuose patirties•Turint technologijas ir produktus, suteikiama galimybė plėstis ne tik Lietuvos, bet ir pasaulinėje rinkoje
Kaip gimė projektas?Kaip gimė projektas?
Buvo vykdytas EUREKA programos finansuojamas projektas MATT (WEB-BASED MULTILINGUAL AUTOMATED TERMINOLOGY TRANSLATION SYSTEM).
Projekto koordinatoriai – Olandai mūsų įmonę atrado http://cordis.europa.eu/ svetainėje, kaip partnerius Europiniams projektams.
SOLIM apžvalgaSOLIM apžvalga• Tikslas: SOLIM papildys informacijos analizę išplečiant
ontologines kalbas, koncentruojantis į Ontologinę Interneto kalbą (Ontology Web Language (OWL)) ir šių technologijų panaudojimą sprendimo priėmimui esant erdvės dimensijoms
• Rezultatas: išplėsti SOLIM projektu erdvinę ontologinę kalbą prie Ontologinės Interneto kalbos (Ontology Web Language (OWL) priedu OWL-DL (Descriptive Logics – aprašomoji logika).
• Tikrinimas: projekto rezultatas tikrinamas 2 kryptimis – mašininio vertimo sistema (Tilde) ir nuotraukų paieška (PicSearch).
• Partneriai: SemLab (Koordinatoriai, Olandija); Tilde IT (Lietuva); Picsearch (Švedija); AGMLab (Turkija).
• svetainė: www.solim.eu
Apie mašininį vertimą (MV)• Šiuo metu naudojamos 3 pagrindinės technologijos mašininio vertimo
kūrimui:– Taisyklėmis paremtas MV (Rule based MT (RBMT))– Pavyzdžiais paremtas MV (Example based MT (EBMT/SMT))– Statistinis MV (Statistical MT (SMT))
• Norint sukurti RBMT, reikia turėti/sukurti labai daug taisyklių ir žodynų• Norint sukurti EBMT/SMT, reikia turėti/sukurti labai daug vertimo
pavyzdžių• SMT gali būti apmokytas naudojant paralelius tekstynus (korpusus)• SMT šiuo metu plačiausiai naudojama technologija MV kūrimui
Statistinis mašininis vertimas
Apie ontologijasApie ontologijas
Ontologija - žinių apie tai, kokios sąvokos egzistuoja pasaulyje ir kaip jos susiję šaltinis, pateikiantis hierarchinį sąvokų tinklą su apibrėžtais ryšiais tarp jų pavidalu.
Ontologijos naudojamosOntologijos naudojamos
• Dirbtinio intelekto, • Semantinio žiniatinklio, • Programinės įrangos inžinerijos,
biomedicinos informatikos, bibliotekininkystės ir informacijos architektūros srityse
• Kaip žinių apie pasaulį ar tam tikras jo dalis pateikimo forma.
Mašininis vertimas + ontologijos
Ontologija pagerina MV, nes išsprendžia žodžių daugiaprasmiškumo problemą.
SOLIM
... other
OWL-Full
spatial - OWL
TOWL
OWL-DL
OWL-Lite
... other
OWL
OWL
TOWL – ontologies TOWL Reasoner
Semantic image search (proof of
concept)
instantiated spatial ontology Spatial
reasoner
Spatial (temporal) ontology
Ontology languages
Ontologies Reasoners Applications
ReasonersSpatial (temporal) semantic apps.
Semantic applications
Temporal semantic applications
UsesUses
OWL-DL based ontologies
TOWL based temporal ontology
Solim privalumaiSuteikia galimybę priimti tikslesnį sprendimą ir terminus susijusius su erdvinėmis savybėmis pvz.:
– dimensija– orientacija– vieta– atstumas– skiltis– morfologija– judesys?
OWL ontology
SOWL ontology
Pavyzdžiai
• P(Georgia | Gruzija) ≅ P(Georgia | Džordžija)• Pavyzdžiui:
1. The president of Georgia visited Lithuania yesterday.2. There are Lithuanians living in Georgia and other states.3. A recent court ruling gives Georgia, Alabama and Florida three years to resolve
their conflict over use of the water from Lake Lanier.4. Experts have failed to travel to Georgia at the Tbilisi international airport.5. Azerbaijan has bad relations with Armenia, so it cannot afford to have such
relations with Georgia.6. US president visited Georgia last month.
• Teoriškai, pavyzdžius 3,4 ir 5 MV gali išversti tiksliau naudojant erdvines ontologijas
Semantinė paieška:
moteris; eifelio_bokštas;
atitinka erdvinei užklausai:
“moteris Paryžiuje (Prancūzija)”
(trivialu ) pavyzdžiai :
http://img234.imageshack.us/img234/7573/jeanbrauddevantlatoureigx0.jpg
Angliški sakiniai kuriems teisingai išversti reikalinga ontologija:
panaudojant vietą:“Paris Hilton visits Hilton Paris.“
panaudojant dimensiją:“I once shot an elephant in my pajamas.”How he got in my pajams I'll never know… Groucho Marx
etc…
(trivialu ) pavyzdžiai
Ką projektas davė mūsų įmonei?
• Turėjome galimybę ištirti vieną iš būdų kaip patobulinti mašininį vertimą
• Užmezgėme ilgalaikius kontaktus su kitų šalių specialistais
• Mūsų specialistai įgijo dar daugiau žinių susijusių su mašininio vertimo technologijomis ir jų panaudojimu
• Įgijome tarptautinių projektų valdymo patirties
Išvados
• Ontologijų integravimas atveria galimybes ateityje tikslinti MV
• Semantikos naudojimas leidžia integruoti ne tik ontologijas, bet ir morfologiją, sintaksę į statistinį MV.
• Ateities eksperimentai ir įvertinimai reikalingi norint dar daugiau gerinti MV.