데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

71
WEBOMETRICS INSTITUTE 19 대 대대대대대 대대대대대대 대대 - 대대대대’대대 ‘대대대’ 대대대대대대 박박박 박박 박박박 박박박박박박 박박박박박박박박박박박 박박박박박박박박박박박 WCU 박박박박박박박박박 TEDxPalgong 박박박박 박박박박박 박박 [email protected] www.hanpark.net

Transcript of 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Page 1: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

WEBOMETRICSINSTITUTE

19 대 총선보도와 웹보메트릭스 활용- 받아쓰기’에서 ‘데이터’ 저널리즘으로

박한우 교수

영남대 언론정보학과영남대사이버감성연구소아시아트리플헬릭스학회

WCU 웹보메트릭스사업단

TEDxPalgong대구경북 소셜미디어 포럼

[email protected]

Page 2: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

총선보도의 원칙 , 언론사의 현실은 ? 선거 취재의 중요한 2 개 원칙- 공정성 (Fairness): 기계적 공정성- 객관성 (Objectiveness): 사실에 기반한 보도

독자는 ‘신속’하고 ‘흥미로운’ 기사를 요구함- 인터넷 포털 , 소셜미디어 , 모바일로 넘어간 고객들

• 공정성 / 객관성 과 신속성 / 흥미성의 공통분모는 ??- 과학적 방법에 기반한 주관성의 극복 !

Page 3: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

How American people learn about their local politics, campaigns and elections?

Adults age 40 and older are more likely to prefer word of mouth as a source for lo-cal politics, local government activity, hous-ing and real estate, zoning, and social ser-vices.

Source: PewInternet.org (2011)

Page 4: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

사회과학 / 언론정보학 연구방법에 대한 제고 인터넷 기술의 발전과 보급으로 인한 사회 현상의 변화

양상은 사회과학자들에게 새로운 연구 방법에 대한 도입의 필요성을 인식시킴 .

웹공간 (Webosphere) 에 있는 무한한 정보들을 어떻게 정제( 수집 및 가공 ) 할 것인가 ?

엄청난 규모의 자료를 어떻게 분석 처리할 것인가 ?

자료중심적 (data-intensive) 방법론에 대한 관심 증대 자료의 수집 , 저장 , 가공 , 분석 등에 대한 인식 전환 수단 목적

Page 5: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

웹보메트릭스 (Webometrics) 란 ? 웹보메트릭스는 월드와이드웹 (World Wide Web) 의 ‘웹

(Web)’ 과 계량적 분석을 뜻하는 ‘메트릭스 (Metrics) 가 합성된 용어로 , 인터넷 정보와 디지털 기술의 사용방식을 정량적으로 분석하는 연구방법임 .

웹보메트릭스라는 이름은 Almin 와 Ingwersen(1997) 의 논문에서 비롯되었다 . 그렇지만 , 웹보메트릭스 분야는 하이퍼링크 네트워크 , 웹 가시성 추적 , 블로그 관계망 , 검색엔진 비교 분석을 포함하면서 사회정보학을 벗어나 급속히 확대되고 있음 .

특히 , 웹보메트릭스 연구방법은 웹사이트의 콘텐츠와 하이퍼링크 등을 통한 사회네트워크분석 (social network analysis) 에 자주 활용되고 있음 .

WEBOMETRICSINSTITUTE

Page 6: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

주요 e- 리서치 도구 ( 사업단 자체 개발 )WeboNaver/WeboDaum:

한국의 대표적인 포털사이트인 “네이버”와 “다음”을 이용한 Open API(Application Pro-gramming Interface) 기반 자동 검색 프로그램 .

블로그 , 온라인 커뮤니티 , 지식인 , 웹게시판 , 이미지 , 동영상 등 다양한 인터넷 플랫폼들에 따른 검색 결과를 자동으로 수집하며 , 방대한 양의 웹사이트 주소 (URL) 및 문서 내용 등을 자동으로 저장

Page 7: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)
Page 8: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)
Page 9: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

데이터의 홍수 , 저널리즘의 위기인가 ?? • 데이터의 홍수는 분석도구의 개발을 가져옴• visualization 분야의 연구자들이 비전문가를 도와줌• Journalists 도 데이터 갖고 스토리 만드는 방법에 적응• 차트 만들기에서 infographics designers 의

도움으로 데이터를 ‘탐사저널리즘’의 개념간 설명에 사용함

• 데이터 저널리즘을 잘 구현한 기사는 소셜 미디어 공간에서 일반 개인들이 인용하는 인기콘텐츠로 바뀜

해답 : 웹보메트릭스를 활용한 데이터저널리즘 (DJ) !!!http://datajournalism.stanford.edu 바탕으로 재구성

Page 10: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

But there is an important distinction to be made between homogeneity of content across outlets and homogeneity across platforms. Few would dispute that homo-geneity of content across outlets is a threat to pluralist understandings of media and politics.

But in an increasingly fragmented media en-vironment, in which growing segments of the audience are turning away from tradi-tional platforms, particularly the printed Britain’s First Live Televised Party Leaders’ Debate, should we be so quick to denigrate content duplication across platforms?

From the News Cycle to the Political Information Cycle

Page 11: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Political information cycles are partly dependent upon cross platform iteration and recursion. These processes increase the likelihood that multiple, fragmented audiences will be exposed to political content and they arguably loosen the grip of jour-nalistic and political elites by creating opportunity structures with greater scope for timely interven-tion by citizen activists.

Homogeneity across platforms can thus fashion a form of unifying ‘publicness’ that has long been presented as withered due to media fragmenta-tion. It should also be borne in mind that the cre-ative practices of online mark-up culture, includ-ing editing, remixing and satirical commentary, by both elites and non-elites, are important features of the political information cycle.

From the News Cycle to the Political Information Cycle

Page 12: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Data journalism 개념 Precision journalism VS Investigative journal-

ism Computer Aided Journalism/Reporting (CAR) Journalism 2.0 Open journalism Infographics journalism Interactive journalism Multimedia journalism Location-based journalism Social media journalism

Page 14: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

‘Agenda Weaving’ 으로 더욱 주목받는 DJ !! 기존매체이든 새로 부상하는 소셜 미디어든 ‘의제 설정자

(agenda setter)’ 로서의 기능을 갖고 있지만 , 오히려 두 미디어의 역할은 의제의 발원지에 상관없이 의제의 중요성에 관해 토론하고 서로의 컨텐트를 게이트키핑하는 “의제 뜨개질바늘 (agenda weaver)” 로 전환되고 있다고 볼 수 있다 .

- 김장현 , 미국 하와이대 교수

Page 16: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

유명 블로거의 영향력 > 기존 언론

- Andrew Sullivan - 알래스카 기후연구소 자료의 검토를 통해- New York Times 의 알래스카 평균 기온이

지난 30 년동안 화씨 7 도 상승 기사는 오보- 편집인과 편집국장 사임- 실제 상승온도는 5.4 도

데이터 저널리즘은 벌써 시작되었다 !

Page 18: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

열번째 강의

James Surowiecki 가 말하는 소셜 미디어의 전환점

18인터넷 윤리

TED 강의 듣기http://www.ted.com/

주제

James Surowiecki 는 소셜미디어가 이제 뉴스 유통에서 기존의 미디어와 동등한 역할을 하게 되었음을 지적합니다 : 2005년에 일어난 쓰나미 재해 , 바로 그때 유튜브 비디오 , 블로그 , 인스턴트 메신저 , 그리고 SMS등을 통해 빠르게 재난소식이 전달됐으며 비극으로부터 감동적인 개인의 이야기들이 세상에 알려 질수 있었습니다 .

Page 19: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Zero History, 2010

윌리엄 깁슨 Zero History(2010) 에서 트위터

Wired.com: How about Twitter? More than most authors I’ve checked out, your tweet-happy avatar @GreatDismal seems to be most comfortable messaging and cool-hunting on the service. And in the novel, Twitter’s consistently used as a com-munication and parenting device, depending on the spook.Gibson: Well, I discovered Twitter while I was writ-ing the novel, and I immediately saw its odd po-tential for being a tiny, private darknet that no one else can access. I’m always interested in the spooky repurposing of everyday things. After a few days on Twitter, what was most evident to me is that, if you set it up right, it’s probably the most powerful novelty aggregator that has ever existed.

Page 20: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

20

아래 그래프는 날짜별 ‘구제역’ 언급 트윗 메시지 개수 (dabot.com)4 월 17 일 구제역 관련 기사와 함께 이용자들이 민감하게 반응하고 있음을 확인할 수 있음

특정 이슈에 대한 트윗 자료의 예측성을 보여주는 지표

Page 21: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

가상공간의 정보수집 :‘CNN’SL iReports 서비스

Page 22: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

동아일보 : 데이터저널리즘 능동적 활용

http://news.donga.com/3/all/20081110/8655373/1

Page 23: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

동아일보 : 데이터저널리즘 능동적 활용

Page 27: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Data journalism - PANDA will help find context and relationship between data Niemanlab :: News organizations, almost by

their nature, have tons of data, from Census numbers and campaign finance reports to DWI records and housing prices and PANDA wants to give all that info a home where it can be easily accessed. PANDA, a winner of this year’s Knight News Challenge, is what developer Brian Boyer,the news applications editor at the Chicago Tribune, calls a “newsroom data application,” a tool that helps find context and relationships on the fly. It will take one year to set up the open source platform.

Continue to read Justin Ellis, www.niemanlab.org

Page 28: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

First hand - how the New York Times used Twitter to curate election news New York Times :: Nice experience report of the New York

Times, how they used Twitter to collect information. - For the 2010 election, the New York Times built a continuously updated election guide that let readers explore data related to each of the 509 congressional and gubernatorial races.

After adding candidate information, race ratings, polls, election forecasts, campaign finance numbers and historical election results, NYT's staff wanted a way for our political reporters to contribute live updates. They imagined them writing short news items and finding links to related stories from The New York Times and other sources, so that each page would reflect the most recent developments in that contest.

First hand experience - continue to read Andrei Scheinkman, open.blogs.nytimes.com

Page 31: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

웹보메트릭스를 활용한 데이터저널리즘 장점 유력 정치인의 ‘한마디’를 듣기 위해 온갖 노력을 마다않는 언론의 정치 취재 관행은

- 비용이 많이 듦 , - 그것이 아니면 정치의 메커니즘을 제대로 보여줄 도구가

없는 것인가 ???

31http://www.sisainlive.com/news/articleView.html?idxno=9661

Page 32: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

웹보메트릭스를 활용한 데이터저널리즘 장점 정치 네트워크 분석 : 유력한 대안이 될 전망- 객관적 실험이 불가능한 사회과학의 한계와 자기 정보를

감추는 정치인의 성향 때문에 , 정치에 대한 국민의 알 권리는 제대로 충족되지 못했던 경향이 있다 .

- 네트워크 분석은 그런 한계를 넘어 객관적이고 눈에 보이는 형태로 정치를 이해하게 해 준다 .

정치인과 대중 간의 네트워크를 분석하면- 정치인의 메시지가 어떻게 확산되고 누가 확산시키는지를

네트워크 분석으로 보면 , 정치인의 영향력이 어떤 경로로 전파되는지 , 로비단체나 이른바 ‘알바’의 실체가 어느 정도인지도 드러날 수 있다

32

Page 33: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

2012. 4. 11. 제 19 대 국회의원선거일정

시행일정 실 시 사 항

12.13 부터 예비후보자 등록1.12 부터4.11 까지 의정활동 보고 금지

1.12 까지 입후보제한을 받는 자의 사직

2.11 부터4.11 까지 지방자치단체장의 선거에 영향을 미치는 행위 금지

3.27 부터3.28 까지

후보자등록 신청( 매일 오전 9 시 ~ 오후 5 시까지 )

4.5 부터4.6 까지 부재자투표소 투표

4.11투 표 ( 오전 6 시 ~ 오후 6 시까지 )

개 표 ( 투표종료후 즉시 )

5.11 까지기탁금 반환 및 공제명세서 송부

정치자금 회계보고서등 제출

6.8 까지 선거비용 보전

Page 34: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

19 대 총선보도 적용 : 예비후보자들의 인맥관계동시에 언급된 빈도 조사하기

Page 35: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

e- 리서치 도구의 활용 : 웹가시성 분석 웹가시성 (Web Visibility) 은 인터넷 이용자들 ( 공중 )

이 온라인 공간에서 주목하고 있는 행위자 , 사건 또는 이슈들의 현존성을 의미 (Ackland, Gibson, Lusoli, & Ward, 2010; Gauvin, 2010).

Page 36: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

홈페이지로부터 유용한 하이퍼링크 찾아내기

Page 37: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Connecting: Endorsement

Page 38: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

누가 누가 나오면 엔트로피가 많이 생산될까 ?

Politician (A B C) A B C AB AC BC ABC

Na, Won, Noh 18000 377 16000 898 118 50 32

Na, Won, Kang 16000 380 4438 898 1 1 1

Na, Won, Chung 16000 357 14000 898 63 68 1

Na, Noh, Kang 18000 15000 3817 118 1 571 0

Na, Noh, Chung 16000 14000 13000 118 63 737 0

Na, Kang, Chung 15000 3618 13000 1 63 280 1

Won, Noh, Kang 9208 19000 10000 50 1 571 0

Won, Noh, Chung 8353 18000 27000 50 68 737 1

Won, Kang, Chung 8154 10000 28000 1 68 280 1

No, Kang, Chung 18000 9224 27000 571 737 280 151

출처 : Measuring Twitter-Based Political Participation and De-liberation in the South Korean Context by Using Social Net-work and Triple Helix Indicatorshttp://www.springerlink.com/content/77w06uv002179062/

Page 39: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

A comparison of trilateral relationships of five politicians on Twitter

Page 40: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Measuring Twitter-based political partici-pation by using TH indicators The absolute entropy values were lower when the

trilateral relationship included the two conservative politicians: Na and Won. As indicated earlier, the lower the entropy value, the less stable the communication system is. Thus, the communication system became more unbalanced in trilateral relationships that included the two conservative politicians. On the other hand, in those trilateral relationships including only one conservative politician, the entropy values were higher, and the communication system was more stable. These results suggest that the level of political deliberation, expressed in terms of the degree of stability in the communication system, increases when politicians with different political orientations form trilateral relationships

Page 41: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

실시간 모니터링 기법을 통한 시계열적인 변화 추세 분석19 대 총선보도 적용 : 후보 공천 이후

Page 42: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

e- 리서치 도구의 활용 : 웹가시성 분석 블로그 공간에서 후보자들의 웹가시성 수준과 득표 수간에 밀접한 상관성을 나타냄 . ( 임연수 , 박한우 , 2010, JKDAS)

경대수 정범구 정원헌 박기수 이태희 김경회

19,427

29,120

3,071 2,125504

14,218

실제 득표수

평균 블로그 수

Page 43: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

트위터 데이터로 4.27 재 · 보궐선거 예측한 “빵 만드는 웹기획자” http://www.uccp.biz/602

분석 기간 : 2011년 4 월 20 일 수요일 ~2011년 4 월 28 일 목요일소스 출처 :  트윗트렌드 ( http://www.tweetrend.com 

Page 44: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

24May2010

Education Superintendents VS Mayors

Page 45: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

25May2010

Education Superintendents VS Mayors

Page 46: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

26May2010

Education Superintendents VS Mayors

Page 47: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

27May2010

Education Superintendents VS Mayors

Page 48: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

28May2010

Education Superintendents VS Mayors

Page 49: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

30May2010

Education Superintendents VS Mayors

Page 50: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

31May2010

Education Superintendents VS Mayors

Page 51: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

1June2010

Education Superintendents VS Mayors

Page 52: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

2June2010

Education Superintendents VS Mayors

Page 53: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Result - 1

Time (from 24th May to 2nd June)

Mayors

Educational superintend-ents

Web Ecology - 2011 ICA 5/29/2011

Page 54: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

DateLink(2010_M)

N=44Link(2010_E)

N=69Link(2007_P)

N=20 Date

24-May-10 3.77 0.03  

25-May-10 3.82 0.04  

26-May-10 3.86 0.04  

27-May-10 3.77 0.11 869.66 02-Dec-07

28-May-10 3.62 0.15 785.52 05-Dec-07

30-May-10 3.87 0.63 877.92 08-Dec-07

31-May-10 3.92 0.92 940.58 11-Dec-07

01-Jun-10 4.03 1.24 819.72 14-Dec-07

02-Jun-10 4.10 1.36 1129.62 17-Dec-07

Page 55: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Results - 3

Mayors

○Grand National Party●Democratic Party△Independents■Participation Party◆Liberty Forward Party▲ New Progressive Party

Educational superin-tendents

▲Non-Seoul metropolitan Area●Seoul metropolitan Area

Web Ecology - 2011 ICA 5/29/2011

Page 56: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Results - 5

Web Ecology - 2011 ICA 5/29/2011

Page 57: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

( 대통령 후보 경선에서 ) 이명박 - 박근혜 접전-국제저널인 IS(International Sociology) 에 발표한 논문 , Lee & Park(2010)

웹보메트릭스 방법론을 통해서 표면적으로 드러나지 않는 경쟁구도 파악 가능

Page 58: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

분석대상의 수 (N) = 901

( 이명박 : 215)

( 박근혜 : 692)

( 공동 : 6)

사이버공간에 나타난 한나라당 내부 갈등 구조

이명박과 박근혜 후보의 사이버 인맥지도 : 경선기간 링크구조 국제저널인 IS(International Sociology) 발표한 논문 , Lee & Park(2010)

Page 59: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Changes of co-link net-works during 2007 presid-ential campaign period Web-mentions of candidate & party names, web-

site sizes, visitor traffics, inlink counts, and co-links were collected in seven times

3-day interval, 29 Nov - 17 Dec in 2008 Particular usefulness of webometrics survey dur-

ing Korean presidential campaign period- Public survey can be reported only 3-day before

the election- In 2003 presidential election, it used to be 22-day

before

Page 60: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

2 Dec 2007

Changes of co-link net-works during presidential campaign period

Page 61: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

11 Dec 2007

Page 62: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

17 Dec 2007D-1 day

Page 63: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Summary of findings Online attention focused on major parties/candi-

dates cf. Moon GH, Huh KY Frequency counts, Web traffic:

the (conservative) GNP > the liberals Incoming links, size of the site:

the liberals & labor candidates > the GNP Co-link maps = indicative of the relative level of public awareness

and the ideological orientation of candidates= a third-person perspective

Page 64: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

* 후보자들간 텔레비전 토론보도의 경우

쇠고기 수입 반대에 나타난 갈등메커니즘- 텔레비전 토론회의 ‘의미 네트워크 분석’

Page 65: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

네트워크 그림 확대

Page 66: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

정부 측 의견

중립적이고 포괄적인

단어 사용을 통해

관련 정보를 전달

Page 67: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

시민단체 측 의견

자신들의 주장을

드러내는 보다

구체적인 용어를

사용

Page 68: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

집회에 상반된 인식

촛불집회

Page 70: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

맺으며… 오늘날 인터넷으로 비롯된 디지털 네트워크 사회에 대한

과학적 탐구를 위해서는 자료중심적 방법론의 개발 및 활용이 필요 .

이를 위해서는 다학제 (Multidisciplinary) 간 융합연구가 절대적으로 필요한 시점임 .

70

Source: Arzberger et al., 2004a, p.1777

Page 71: 데이터저널리즘과 선거 웹보메트릭스연구사례(24 oc2011)

Thank you!Q & A

Prof. Han Woo PARKWorld Class University Webometrics InstituteCyberEmotions Research CenterDepartment of Media and Communincation,YeungNam University, [email protected] http://www.hanpark.net

WWIWCUWEBOMETRICSINSTITUTEINVESTIGATING INTERNET-BASED POLITIC WITH E-RESEARCH TOOLS