Timo Honkela: Tietokone lukemassa yli 100 miljoonaa eri kirjaa: Kielitieteen ja filosofian...
-
Upload
timo-honkela -
Category
Science
-
view
60 -
download
2
Transcript of Timo Honkela: Tietokone lukemassa yli 100 miljoonaa eri kirjaa: Kielitieteen ja filosofian...
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Timo Honkela
Helsingin yliopisto
24.1.2017
Tietokone lukemassa yli 100 miljoonaa eri kirjaa:
Kielitieteen ja filosofian näkökulmia
Luonnonfilosofian seura — The Finnish Society for Natural Philosophy
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Yli sata miljoonaa kirjaa
http://www.pcworld.com/article/202803/google_129_million_different_books_have_been_published.html
● Googlen kirjaprojektissa kerrottiin vuonna 2010, että maailmassa on julkaistu129 864 880 kirjaa
● Tarkan luvun antaminen ei ole kovin mielekästä, mutta suuruusluokka antaakäsityksen käsillä olevasta ilmiöstä
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Esimerkki tunnetuistasuomalaisista kirjoissa(Google Books 1890-2006)
Jean SibeliusGeorge Henrik von WrightUrho Kekkonen
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Esimerkki suomalaisistatieteentekijöistä kirjoissa
(Google Books 1970-2006)
Ilkka NiiniluotoBengt HolmströmTeuvo KohonenIlkka HanskiMika PantzarMarkku KulmalaLeena Peltola-PalotieTimo HonkelaRiitta Hari
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Ihminen kirjoissa:Kirjoittaja, toimittaja, viittaussuhteessa
etc.
https://www.google.com/search?tbm=bks&q=Timo+Honkela
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Aineistojen digitointi:esimerkkinä Kansalliskirjaston
sanomalehtiaineisto
http://digi.kansalliskirjasto.fi/
Digitointi > OCR > Hakutoiminnot ja jatkojalostus
https://www.kansalliskirjasto.fi/fi/palvelut#digitointi--ja-sailytyspalvelut
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Filosofiaa eivät voi paetatietojenkäsittelijätkään
● Uusi valituksen aika?● Empirismin ja rationalismin vuoropuhelu● Vuosisataiset filosofiset näkökulmat ja teemat
ovat edelleen tärkeitä ja aina vain tärkeämpiä koneiden käyttöön liittyen eli kun tekoälyä ja koneoppimista sovelletaan ihmistieteiden piirissä
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Tietokoneilla on helppolaskea lukumääriä ja
korrelaatioita
Voiko tietokoneen avullatarkastella merkityksiä?
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Loogisen päättelyn muotoja
● Deduktio● Induktio● Abduktio
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Koneoppimisen muotoja
● Ohjattu oppiminen● Ohjaamaton oppiminen● Vahvistusoppiminen
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Tiedon esittämisen muotoja
● Symbolit, propositiot● Vektoriavaruudet (tensorit)● Tila-avaruusmallit, dynaamisen järjestelmät
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Sanat-käsitteet-havainnot
Kaari
Vrt. tuoli, kuppi, ...
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Klassikkoesimerkki:Grimmin satujen analyysi (1995)
Honkela, Pulkki & Kohonen 1995
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Tilastollisesti etsittyjä assosiaatioitasanoille 1) onnellisuus ja 2) lätäkkö
● mielenrauha● tyytyväisyys● onnellisuuden● elämänilo● yksilöllisyys● rakkaus● välittäminen● onni● hyvinvointi● positiivisuus
● lammikko● lampi● oja● läntti● kuoppa● kolo● hiekka● allas● pläntti● läikkä
http://bionlp-www.utu.fi/wv_demo/Kiitokset: Turku BioNLP group, Filip Ginter ja Citizen Mindscapes -projekti (Helsinki, Turku) http://blogs.helsinki.fi/citizenmindscapes/
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Taustaa: tulkinnan yksilöllisyydenmallintaminen (GICA-menetelmä)
● GICA-menetelmät (Grounded Intersubjective Concept Analysis) (Honkela ym. 2012) mahdollistaa mallit, joissa kunkin sanan merkitystä tarkastellaan yksilöllisesti
● Esimerkkinä USAn presidenttien puheet(State of the Union Address) ja sanan HEALTH merkityksen analyysi kontekstitietoatilastollisesti analysoide
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Humanistinen meta-analyysi (Honkela 2016)
Aineistosanoineen
Analyysiolettaensanojenjaettu
merkitys Honkelanehdotus
Aineistosanoineen
Analyysi hyödyntäenmerkityksienvaihtelumallia
Merkityksien analyysirikkaissa konteksteissa
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Humanistinen meta-analyysi (Honkela 2016)
Aineistosanoineen
Analyysiolettaensanojenjaettu
merkitys Honkelanehdotus
Aineistosanoineen
Analyysi hyödyntäenmerkityksienvaihtelumallia
Merkityksien analyysirikkaissa konteksteissa
Sanoja ei voi ottaaanalyysin perusdataksi
olettaen, että sana tarkoittaatäsmälleen samaa, kun
puhuja/ kirjoittaja on eri jaeri kontekstissa
Sanan merkitys ontilastollinen, subjektiivinenja kontekstiriippuva ilmiö
Timo Honkela, Luonnonfilosofian seura, 24.1.2017
Humanistinen meta-analyysi (Honkela 2016)
...AUTENTTINEN...HAUVAKATTIKISSAKOIRA…REILU...TEHOKAS...
DATA (1)RIKAS
MERKITYS-MALLI
SISÄLTÖ-ANALYYSI
(HUMANISTINENMETA-ANALYYSI)
DATA (2)