Facebook & Twitter dataindsamling

42
VERSITET ANJA BECHMANN HEAD OF DIGITAL FOOTPRINTS RESEARCH GROUP AARHUS UNIVERSITET 1. OKTOBER 2014 UNI Facebook & Twitter dataindsamling

description

Workshop on data collection through Digital Footprints (instagram, twitter, facebook). MA course at Aarhus University, Central Region, Denmark.

Transcript of Facebook & Twitter dataindsamling

Page 1: Facebook & Twitter dataindsamling

VERSITET

ANJA BECHMANN HEAD OF DIGITAL FOOTPRINTS RESEARCH GROUP

AARHUS UNIVERSITET 1. OKTOBER 2014

UNI

Facebook & Twitter dataindsamling

Page 2: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

AGENDA › Gruppeøvelse 1: facebook & twitter socialisering › Gruppeøvelse 2: Big data? › Gruppeøvelse 3: Software supported methods and APIs

›  Pause 15 min

› Digital footprints introduction › Workshop digital footprints

›  Pause 30 min (send Twitter username til Anja i google drive doc)

›  Twitter dataindsamling ›  Spørgsmål ›  Til næste gang: Hent selvvalgt twitter-hashtag selv i grupper!

2

Page 3: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

NÆSTE GANG – KRP ÉN TEKST ›  1. ›  Bruns, A. (2011).  "

How Long Is a Tweet? Mapping Dynamic Conversation Networks on Twitter Using Gawk and Gephi." Information, Communication & Society, 17. http://www.tandfonline.com/doi/pdf/10.1080/1369118X.2011.635214

›  2. ›  Bruns, A. & Liang Yuxian, E. (2012). "

Tools and Methods for Capturing Twitter Data during Natural Disasters." First Monday, 17(4). http://firstmonday.org/ojs/index.php/fm/article/viewArticle/3937/3193

›  3. ›  Bruns, A. & Burgess, J. “Notes towards the Scientific Study of Public Communication on

Twitter”. http://nfgwin.uni-duesseldorf.de/sites/default/files/Bruns.pdf

›  Alle: Læs om yourtwapperkeeper:  http://mappingonlinepublics.net/tag/yourtwapperkeeper/

›  PLUS selvvalgt hashtag-download I gruppe

3

Page 4: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

TEKSTER ›    ›  Caers, R., Couck, M, Stough, T., Vigna, C. & Bois, C.U (2013). Facebook: A literature review, New Media &

Society, 15 (9): 982-10002: http://nms.sagepub.com/content/15/6/982.abstract ›  Marwick, A. & boyd, d. (2010). I tweet honestly, I tweet passionately: Twitter users, context collapse, and the

imagined audience. New Media & Society, 13(1), 114-133. http://nms.sagepub.com/content/13/1/114 ›    ›  Lomborg, S. & Bechmann, A. (2014) Using APIs for data collection on social media, The Information Society,

30(4), 256-265: http://www.tandfonline.com/doi/abs/10.1080/01972243.2014.915276#.U_8l_UhgvoU ›  boyd, d. and K. Crawford (2012). Critical questions for big data: Provocations for a cultural, technological,

and scholarly phenomenon. Information, Communication & Society, 15(5), 662-679. http://www.tandfonline.com/doi/abs/10.1080/1369118X.2012.678878#.UhIVImSOBIQ

›  Karpf, D. (2012). Social Science Research Methods in Internet Time. Information Communication & Society, 15 (5), 639-661 http://www.tandfonline.com/doi/abs/10.1080/1369118X.2012.665468#.UhIUiWSOBIQ

›  Neuhaus, F. and T. Webmoor (2012). Agile ethics for massified research and visualization. Information, Communication & Society, 15(1), 43-65. http://www.tandfonline.com/doi/abs/10.1080/1369118X.2011.616519#.UhTBcWSOBIQ

›  Zimmer, M. (2010). “But the data is already public”: on the ethics of research in Facebook. Ethics & Information Technology, 12(4), 313-325. http://link.springer.com/article/10.1007%2Fs10676-010-9227-5#page-1

›    ›   

4

Page 5: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GRUPPEØVELSE 1 ›  3 personer på tværs af tekster 15 min 15 min opsamling ›    ›  Marwick, A. & boyd, d. (2010). I tweet honestly, I tweet passionately: Twitter users,

context collapse, and the imagined audience. New Media & Society, 13(1), 114-133.

›    ›  Caers, R., Couck, M, Stough, T., Vigna, C. & Bois, C.U (2013). Facebook: A literature

review, New Media & Society, 15 (9): 982-10002: ›   

›  1. Hvordan beskriver teksterne socialisering på henholdsvis Twitter og Facebook? 2. Hvilke perspektiver tages der ikke højde for – kan I liste andre socialiseringsformer, der kunne være interessante at analysere?

5

Page 6: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GRUPPEØVELSE 2: BIG DATA? ›  5 min diskussion 10 min. opsamling 2 personer

›  boyd, d. and K. Crawford (2012). Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication & Society, 15(5), 662-679. http://www.tandfonline.com/doi/abs/10.1080/1369118X.2012.678878#.UhIVImSOBIQ

›  Karpf, D. (2012). Social Science Research Methods in Internet Time. Information Communication & Society, 15 (5), 639-661 http://www.tandfonline.com/doi/abs/10.1080/1369118X.2012.665468#.UhIUiWSOBIQ

›   

›  Spg:

6

Page 7: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

BIG DATA › Boyd & Crawford (kritiske) definition af big data:

› “as a cultural, technological, and scholarly phenomenon that rests on the interplay of:

›  Technology (comp. power and algoritmic accuracy) › Analysis (large data sets to identify patterns) › Mythology (large data sets can generate truth, objectivity, and accuracy)”

p. 653

Page 8: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

BIG DATA & LOBSTER TRAPS

› Karpf: “Lobster traps sit passively in the ocean, placed in areas of strategic interest” p. 648

Page 9: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

BIG DATA (API) SOM “KLUDGINESS” › Karpf: Transparens & Kludginess: › Hvad har vi gjort og hvad kan vi ikke se/konkluderer › “a kludge (or kluge) is a workaround, a quick-and-dirty

solution, a clumsy or inelegant, yet effective, solution to a problem, typically using parts that are cobbled together” p. 654

Page 10: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GRUPPEØVELSE 3: APIS ›  10 min diskussion 15 min. opsamling grupper af 3

›  Lomborg, S. & Bechmann, A. (2014) Using APIs for data collection on social media, The Information Society, 30(4), 256-265: http://www.tandfonline.com/doi/abs/10.1080/01972243.2014.915276#.U_8l_UhgvoU

›  Neuhaus, F. and T. Webmoor (2012). Agile ethics for massified research and visualization. Information, Communication & Society, 15(1), 43-65. http://www.tandfonline.com/doi/abs/10.1080/1369118X.2011.616519#.UhTBcWSOBIQ

›  Zimmer, M. (2010). “But the data is already public”: on the ethics of research in Facebook. Ethics & Information Technology, 12(4), 313-325. http://link.springer.com/article/10.1007%2Fs10676-010-9227-5#page-1

›   

›  Spg: 1. hvad er APIs? 2. hvad er de metodiske udfordringer ved APIs 3. Hvad er de etiske og juridiske udfordringer I brugen af APIs som dataindsamlingsmetode?

10

Page 11: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

HVAD ER API? › API står for APPLICATION PROGRAMMING INTERFACE

› Api bruges til at få adgang til semi-offentlige data › (næsten) Alle sociale netværk har et api - det er ikke lavet for at trække data MEN for at udvikle plugin (fx. Spil, knap, delefunktion etc.)

Page 12: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

Page 13: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

API (FORTSAT) › Vi anvender API til at trække data og analysere datamønstre

› Vi får potentielt store datamængder ›  Vertikalt (I dybden på individer) › Horisontalt (I bredden på mange individer)

Page 14: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

API STRUKTUR FACEBOOK › Hvad kan vi få adgang til: › https://

developers.facebook.com/docs/reference/api/

Page 15: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

NÅR VI BRUGER APIS › Overholde ‘terms of use’ for servicen fx. Facebook Platform Policies: https://developers.facebook.com/policy/

› Overholde privacy lovgivningen: http://www.datatilsynet.dk/

› Dvs. sikre identiteten på individer ikke afsløres OG at data ikke videregives – sikre såvel proces (behandling og opbevaring) som produkt (publicering).

Page 16: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

› Agile Ethics for massified research and visualization: › Privacy, confidentiality, anonymity and informed consent p. 44

› Agile ethics: “in situ creative and collaborative ethical practice that works from bottom-up” p. 45

› “we ought to allow our own data to be collected”

› Data points: instances of personal information used in a digital context p. 46

› Ethics: 1. harvesting, 2. processing, 3. production of outputs p. 59

AGILE ETHICS

Page 17: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

MENNESKERETTIGHEDSKONVENTIONEN Artikel 8: Ret til respekt for privatliv og familieliv 1. Enhver har ret til respekt for sit privatliv og familieliv, sit hjem og sin korrespondance. 2. Ingen offentlig myndighed kan gøre indgreb i udøvelsen af denne ret, undtagen for så vidt det sker i overensstemmelse med loven og er nødvendigt i et demokratisk samfund af hensyn til den nationale sikkerhed, den offentlige tryghed eller landets økonomiske velfærd, for at forebygge uro eller forbrydelse, for at beskytte sundheden eller sædeligheden eller for at beskytte andres ret og frihed.

Page 18: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

PERSONDATALOVEN (EU DIREKTIV 1995) ›  Vigtige definitioner (se artikel 2): ›  Personoplysninger: enhver form for information om en identificeret eller identificerbar fysisk

person(den registrede); ved identificerbar person forstås en person, der direkte eller indirekte kan identificeres, bla.a. ved et identifikationsnummer eller et eller flere elementer, der er særlige for denne persons fysiske, fysiologiske, psykiske, økonomiske, kulturelle eller sociale identitet

18

Page 19: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GRUNDPRINCIPPER ›  a) skal behandles rimeligt og lovligt ›  b) skal indsamles til udtrykkeligt angivne og legitime

formål, samt at senere behandling heraf ikke må være uforenelig med disse formål…

›  c) skal være relevante og tilstrækkelige og ikke omfatte mere end, hvad der kræves til opfyldelse af de formål, hvortil de indsamles, og til de formål, hvortil de senere behandles

›  d) skal være korrekte og om nødvendigt ajourførte; der skal tages ethvert rimeligt skridt til at slette eller berigtige oplysninger, der er urigtige eller ufuldstændige i forhold til det formål, hvortil de indsamles,….

›  e) ikke må opbevares på en måde, der giver mulighed for at identificere de registrerede i et længere tidsrum end det, der er nødvendigt af hensyn til de formål…

Artikel 6: › 1. God databehandlingsskik

› 2. Formål › 3. Proportionalitet › 4. Ajourført › 5. Tidsbegrænset

19

Page 20: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

BEHANDLING AF DATA

›  Artikel 7: ›  Medlemsstaterne fastsætter bestemmelser

om, at behandling af personoplysninger kun må finde sted hvis:

›  a) der ikke hersker tvivl om, at den registrerede har givet sit samtykke

› Artikel 8: ›  Behandlinger, der vedrører særlige kategorier af

oplysninger ›  1. Medlemsstaterne forbyder behandling af

personoplysninger om racemæssig eller etnisk baggrund, politisk, religiøs eller filosofisk overbevisning, fagforeningsmæssigt tilhørsforhold og oplysninger om helbredsforhold og seksuelle forhold.

›  2. Stk. 1 finder ikke anvendelse, hvis ›  a) den registrerede udtrykkeligt har givet sit

samtykke til en sådan behandling, medmindre det i medlemsstatens lovgivning fastsættes, at det i stk. 1 omhandlede forbud ikke kan hæves ved den registreredes samtykke, eller

20

Page 21: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

WORKSHOP DIGITAL FOOTPRINTS

21

Page 22: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014 22

Page 23: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

RESEARCH INTEREST › More fenced-off and ubiquitous internet (cross-platform/

cross-services through login)

› How do we get access to closed data about users on private social networks as tool in data analysis (e.g. Facebook)

›  In order to analyze user behaviors with FB across websites › User data structures › Analyze navigation outside FB but related to FB (checkins) › Analyze use patterns during the day (timely) › Analyze digital cross-platform use of FB (laptop, smartphones, pdas) › Analyze exposures to content from other website/media

Page 24: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

EXISTING METHODS › Virtual ethnography (howard, wittel, marcus, markham,

kendall, baym, boyd)

› Friending: › You are not sure to get all activity because of sorting algorithms of

Facebook › You must manually export them to see patterns over time › Following them physically › Time consuming › Too much intervention in everyday rhytms › But you will get a lot of detail on the context of activity on Facebook

that is not possible to get otherwise

Page 25: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

DIGITAL FOOTPRINTS AS METHOD › Act as an external ‘company’/third party when extracting data from Facebook

› Designed a webbased system called DIGITAL FOOTPRINTS

› Using Facebook’s graph API › User consent that DIGITAL FOOTPRINTS draw info on users like any other

application/website using facebook connect › Users can withdraw anytime they like ›  Researchers can mine data from the users and answer research questions

in qualitative studies

Page 26: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

Page 27: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

Digital Footprints

Page 28: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

DATA EXTRACTIONS E.G. › Demographics › Newsfeeds › Network and friends › Likes › Check-ins › Pictures, status updates and uploaded material › Friends material through consent of the participant etc. etc. etc….

Page 29: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

METHODOLOGICAL TRIANGULATION (QUALITATIVE STUDIES) 1. Harvesting private data with consent, mining these data (DIGITAL

FOOTPRINTS)

2. Friending on Facebook to contextualize the patterns from 1

3. Focus group interviews with participants to understand their attitudes and strategies

Page 30: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

STRENGTHS & LIMITATIONS ›  Strenghts

›  Researchers can easily send link via email to participants, asking them to sign up for the research project

›  Researchers can access closed data without profiles being public ›  Data is saved in database which makes it possible to extract and sort different patterns ›  Digital Footprints also allow researchers to study the newsfeed of the participants

›  Limitations ›  Methodologically users must be chosen beforehand and asked to participate ›  Not representative sampling/data ›  Digital Footprints relies on the graph API settings which is controlled by Facebook ›  Therefore “only” qualitative virtual ethnographic tool ›  Cannot register user traffic patterns (click-through analysis)

Page 31: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

WORSHOP SPØRGSMÅL

31

Page 32: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 1 › Find all wallposts (profile feeds) mentioning Koldau.

(Remember “” in the search field)

Page 33: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 2 › Find all news in Newsfeeds mentioning: fodbold

Page 34: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 3 › Find all news in newsfeeds sent from Facebook for iPhone

Page 35: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

EXERCISE 4 › How many messages have Lone Koefoed sent from her iPhone

Page 36: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 5 › Whose wallpost has the most likes?

Page 37: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 6 Find all newsfeeds from 2012/06/01 to 2012/06/07.

Page 38: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 7 In newsfeed sort on “Place” descending and click on the coordinates in the first post to view the location in google maps

Page 39: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 8 Where did Stine Liv Johansen go to High School?

Page 40: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

GET STARTED EXERCISE 9 › Make a view and add all results on “Koldau” to the view

›  Click plus (green) and name the view Koldau + (and the group initials) ›  Search all posts with Koldau ›  Check all posts with Koldau from your search ›  Go to your view (Koldau + (and the group initials))

Page 41: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

FINAL EXERCISE › Browse and test the software according to your own research interests

Page 42: Facebook & Twitter dataindsamling

AARHUS UNIVERSITET

Facebook & twitter dataindsamling ANJA BECHMANN

1. OKTOBER 2014

› Vi ses!

42