Varjú Zoltán - Túlélőkészlet adatáradat esetére

24
Túlélőkészlet adatáradat esetére

Transcript of Varjú Zoltán - Túlélőkészlet adatáradat esetére

Page 1: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Túlélőkészlet adatáradat

esetére

Page 2: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Makkie KlauwePlan the city

Amszterdam

„Könnyű lopás”

Page 3: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Rend a lelke mindennek

Page 4: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Adatok

Linked data

Open data

Structured data

Unstructured data

Stb

Page 5: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Linked data

Strukturált

Triplet = SVO (subject-verb-

object)

SPARQL endpoint

szemantikus

Page 6: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Linked data

Kalóztámadások (UvA)

RPG használat

Nem hajózzunk az Ádeni-

öbölbe

Page 7: Varjú Zoltán - Túlélőkészlet adatáradat esetére

GDELT

GDELT

Global Database of

Events, Language, and

Tone

Strukturált adatbázis

Page 8: Varjú Zoltán - Túlélőkészlet adatáradat esetére

GDELT

Geo-kódolás

CAMEO kódok

Page 9: Varjú Zoltán - Túlélőkészlet adatáradat esetére

GDELT

CAMEO

Conflict and Mediation

Event Observations

Codebook

Verbs (Assult, Fight,

Demand, Coerce stb.)

Actors

Page 10: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Korpuszok

Google Ngram

Culturomics

Szöveges információ

Szógyakoriság

Page 11: Varjú Zoltán - Túlélőkészlet adatáradat esetére

R-index• The Economist Intelligence

Unit R-word Index

• Itt Google Ngram 1-gram

korpuszon vizsgáltuk

• Recesszió és kapcsolódó

szavak gyakorisága

Page 12: Varjú Zoltán - Túlélőkészlet adatáradat esetére

R-index

•A nyomtatott könyvek

jelentős részét vizsgálja (1-

10% között)

•Nem elfogult (ponyvától

a szépirodalomig)

Page 13: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Webkettő

Felhasználói tartalmak

Blogok, hozzászólások

Közösségi média

Mind szöveges, strukturálatlan adatot generál

Page 14: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Közösségi média

•Szentimentelemzés

•Polaritás mérés

•Három, vagy öt elemű

skála

•Pozitív, negatív, semleges

•Monitorozásra

Page 15: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Közösségi média

•Emócióelemzés

•Ekman skála

•Viselkedési vizsgálatokra is

alkalmas

Page 16: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Közösségi média

• Tartalomelemzés

Page 17: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Közösségi média

•Tartalomelemzé

•„Retorikai

összefüggések”

Page 18: Varjú Zoltán - Túlélőkészlet adatáradat esetére

A méret a lényeg?

Small data vs. Big data

Page 19: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Small Data

• Hagyományos

csv és excel fájlok

• Nyilvános adatok

• Kutatási

beszámolók

Page 20: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Small Data

“Small data is the

amount of data you

can conveniently

store and process on

a single machine, and

in particular, a high-

end laptop or server” -

Forrás:

http://blog.okfn.org/2013/04/26/what-do-we-mean-by-small-data/#sthash.Njg5ElNd.dpuf

Page 21: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Big Data

Big data is the term for a

collection of data sets so

large and complex that it

becomes difficult to process using on-hand

database management

tools or traditional data

processing applications. –

Forrás:

http://en.wikipedia.org/wiki/Big_data

Page 22: Varjú Zoltán - Túlélőkészlet adatáradat esetére

Big Data vs Small Data

• Nincs határ,

ami ma nagy,

holnapra kicsi

lehet

Page 23: Varjú Zoltán - Túlélőkészlet adatáradat esetére

A nyitottság számít

opendata.hu

Page 24: Varjú Zoltán - Túlélőkészlet adatáradat esetére

@zoltanvarju

zoltan.varju@precog

nox.com

Kereső Világ

http://kereses.blog.hu/