NMI13 Josef Šlerka - Science is tango between data and theory.
-
Upload
new-media-inspiration -
Category
Technology
-
view
194 -
download
5
description
Transcript of NMI13 Josef Šlerka - Science is tango between data and theory.
Science is tango between data and theory. James Kobielus, IBM's big data evangelist
Shall we danceJosef Šlerka, New Media Inspiration 2013Studia nových médií, Ataxo Interactive a.s.
Všechno co potřebuji vědět o datech...... mne naučili filosofie
Myšlenky bez obsahu jsou prázdné, názory bez pojmů jsou slepé.Immanuel Kant, německý osvícenecký filosof
Obrazotvornost!
Žádný algoritmus z nebe nespadl...staré programátorské přísloví
Sémiotická průpravaTypologie znaků a otázka sémiosisS čím si obrazotvornost hraje
A sign, or representamen, is something which stands to somebody for something in some respect or capacity.Charles Sanders Peirce, semiotik
Typologie znaků
znak (sign), jeho Objekt a jeho interpretant
sémiosis je činnost, která spojuje Z-O-I
sémiosis je potencionálně nekonečná
komplexní systém znaků
nejznámější ikon, index, symbol
Ikon a index
Ikon je znak, který se vztahuje k Objektu a denotuje ho jen díky svým vlastním rysům, které má bez ohledu na to, zda nějaký Objekt skutečně existuje anebo ne.
Index je znak, který se vztahuje na Objekt a denotuje ho tím, že je jím skutečně ovlivněný. Příkladem indexu je klepání na dveře.
Ikony ani indexy však nic netvrdí, nýbrž ukazují.
Symbol
Symbol je znak, který se vztahuje k Objektu a denotuje ho díky zákonu, většinou asociaci všeobecné ideje a tento zákon způsobuje interpretaci. Jinými slovy znak tu nemá vztah ani podobnosti a ani faktické souvislosti, ale jaké si značky pravidla, které nám umožňuje spojení mezi jinak nespojitými věcmi.
Data jsou symbolická (konvenční) vyjádření indexů reality, už obsahují určitý pohled. Ale nic neříkají.
Nejsou data jako data.
Poslední filosofická lekce....
There are only two hard things in Computer Science: cache invalidation and naming thingsPhil Karlton, computer programmer
... programátoři jsou vlastně filosofové
Facebook normalized distance ...... příběh jedné hypotézy a problémy, které jí provázejí a provazely
Google distancepočítá se sémantická vzdálenost
autory jsou Rudi Cilibrasi a Paul M. B. Vitanyi
podobné věci sdílí stejné vlastnosti
tudíž se o nich mluví častěji dohromady
dvě reprezentace jsou si tím podobnější, čím méně složitých změn je třeba k převodu jedné v druhou
NGD je vyjádřená vzorcem:m = log10(počet všech indexovaných stránek);fx = log10(počet výsledků pro slovo X);fy = log10(počet výsledků pro slovo Y);fxy = log10(počet výsledků pro slovo X a Y);GND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
http://www.mechanicalcinderella.com/
FND
Facebook normalized distance vychází z Google normalized distance
Lidé komentují na stránkách kandidátů, vůči kterým se především pozitivně, ale i negativně vymezují.
Pohybují se v určitých myšlenkovinách rovinách či diskursech
FND je vyjádřená vzorcem:m = log10(počet všech českých účtů);fx = log10(počet komentujících na stránce X);fy = log10(počet komentujících na stránce Y);fxy = log10(počet společných komentujících);FND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
Aplikace
buď objevování příbuzných stránek a témat
či k mapování vztahů mezi stránkami
VyhledáváníNajdi mi stránky, které mají blízko k mojí
VztahováníKde se nachází moje stránka mezi ostatními
Mediální mapa FBJaké typy stránek máme mezi FB stránkami serveru
Velká mapa stránekNeziskovky, strany, média....
Případová studiePrezidentské volby 2013
Mapa prezidentských kandidátů 14. 1. 2013
Mapa prezidentských kandidátů 14. 1. 2013
Validace?
zatím nepřímé
analýza chování fanoušků při přesunu mezi voliči stran a kandidátů (bude o ní mluvit Kamil Gregor)
analýza zájmů fanoušků (bude mluvit o ní Jan Schmid)
validace smysluplností
Hlavní úskalí
velikosti korpus a průniku (vzorec funguje “vždy”)
validace
úplnost korpusu při objevování
relativní drahost
A ještě jedna ...Jak je to s fanoušky prezidentů teď...
Mapa prezidentských kandidátů 18. 1. 2013
Věda je tango mezi teorií a daty. To tango, které hraje je ale lidská představivost. Bez ní je věda nemožná.
Děkuji za pozornost!Otázky? Odpovědi?