Web 2.0 時代的民意探勘:政府部門網路 輿情分析的概念與實務 2.0... · Web 2.0...

321
Web 2.0 時代的民意探勘:政府部門網路 輿情分析的概念與實務 (資料整理範圍 103105 年度研析報告) 國家發展委員會編印 中華民國 106 3 本報告內容及建議,純屬研究小組意見,不代表本會意見

Transcript of Web 2.0 時代的民意探勘:政府部門網路 輿情分析的概念與實務 2.0... · Web 2.0...

  • Web 2.0時代的民意探勘:政府部門網路輿情分析的概念與實務

    (資料整理範圍 103~105 年度研析報告)

    國家發展委員會編印

    中華民國 106 年 3 月

    (本報告內容及建議,純屬研究小組意見,不代表本會意見)

  • Web 2.0時代的民意探勘:政府部門網路輿情分析的概念與實務

    (資料整理範圍 103~105 年度研析報告)

    受 委 託 單 位 :電子治理研究中心研究團隊及編輯團隊

    研 究 主 持 人 :陳敦源(105 年、104 年)、蕭乃沂(103 年)

    協 同 主 持 人 :廖洲棚(105 年)、黃心怡(105 年)

    編 輯 參 與 人 :陳恭、廖興中

    研究助理(105 年):陳揚中、馮書昭、陳妍如、伊晉安

    國家發展委員會編印

    中華民國 106 年 3 月

  • 序言

    資通訊技術(ICTs)的進展為電子化政府注入各種活力與多元涵容的元

    素,隨著臺灣民主化的進展與演進,網路場域的公共議題討論日益蓬勃,網

    路及社群媒體的高度使用,讓民眾有更自由表達的空間,此一發展受到國內

    外學術社群與政府的高度關注。因此,網路輿情的探勘也日漸成為政府民意

    探詢的重要管道。如何善用巨量資料(Big Data)分析,在大量(Volume)、

    快速(Velocity)、格式多樣(Variety)且須再確認真實性(Veracity)的網路

    聲量資料中了解民意,並能有效回應,是各級政府在網路社會中所需面對的

    挑戰。

    本書集結電子治理研究中心團隊自93年至95年間,對政府應用巨量資料

    網路輿情分析技術議題的研究成果,探討Web 2.0時代下的網路民主發展、政

    府政策行銷與議題管理、巨量資料分析與導入的問題與效益、以及群眾外包

    與政府治理等議題之間的關係,並綜整網路輿情蒐集與政策參與的應用案例,

    包括分析臺北市政府1999人民陳情32,224筆案例資料,應用文字探勘技術,提

    出陳情案件分案派工,及更精準地找到解決抱怨問題的建議;再以自由經濟

    示範區為個案進行網路輿情分析,有系統地建構了解網路討論正負情緒的方

    法,透過群眾外包方式進行網路言論的立場判斷實驗設計,研提進一步了解

    意見發酵與網路言論的可能立場,最後再以一例一休網路討論為個案,強化

    網路言論政策贊成與反對的態度分析。本書整理多年度的研究成果,希可提

    供各界應用網路輿情探勘參考,包括議題篩選策略、議題整合管理機制、網

    路輿情探勘之操作指引,以及網路輿情分析資料的解讀策略,可挹注我國電

    子治理與網路民意探詢的知識內涵。

    本報告業由本會函送各有關機關參考,另為提供各界參閱,爰將報告內

    容整理出版。惟本報告內容及建議,基本上仍屬研究小組的意見。本項研究

    參與成員共計有陳敦源教授、蕭乃沂副教授、廖洲棚助理教授、陳恭教授、

    廖興中副教授、黃心怡助理教授、陳揚中博士生,以及電子治理研究中心跨

    校與跨領域研究團隊參與協助,併此誌明,以表謝意。

    國家發展委員會

    中華民國106年3月

  • 序言:

    (網)民之所欲,常在我心?政府網路輿情分析的漫漫長路

    2014 年春天發生在臺灣的太陽花學運,標誌了臺灣政黨政治、兩岸關係、

    以及民意政治的分水嶺,當時中央的電子化政府相關單位,從過去專注應用

    資訊通訊科技(Information and Communication Technologies, ICTs)於提升政

    府服務品質的單一觀點解放出來,開始關注網路民主與輿情收集暨分析的工

    作。

    2016 年政黨輪替的同時,也造成了網路民主的新時代開始。臉書

    (Facebook, FB)上線是 2005 年的事,根據 2014年 的統計資料,FB 在臺

    灣的滲透率是 65%,全球之冠,而 2016 年活躍的臉書用戶是 1,500 萬之

    譜,Web 2.0 網路平臺成為商戰行銷的必爭之地;相對地,2005 年開啟的社

    群網路溝通模式,社會勢力應用這個新工具參與政治並且鼓動風潮,將成為

    任何一黨執政時都不得不關注的民意場域;然而,對電子治理研究中心來說,

    這個議題屬於電子民主的範疇,相關研究在更早的時間點就開始了。

    本書綜整了過去三個年度(103, 104, 105),執行期間橫跨 2014至2017

    年間研究團隊在政府網路輿情分析上的研究成果,但是,從研究脈絡來看,

    本書的成果其實是由不同階段的研究團隊與議題,所牽引出來的一份跨年協

    力的成果。連同本書的三份報告,總共歷時九年(2009至2017年),由九位

    學者(陳敦源、潘競恆、周韻采、陳俊明、羅晉、廖洲棚、廖興中、蕭乃沂、

    陳恭、黃心怡,按出場序,下同)、四位研究顧問(楊立偉、呂俊宏、陳育

    亮、謝文泰)、二十三位研究助理(王千文、高偉唐、陳弘章、鄒佳宏、李

    政釗、楊和縉、黃重豪、駱呈義、鄭國威、林柏州、許祐嘉、廖乙甄、邱苡

    茜、莊婷宇、熊子翔、呂孟芩、陳揚中、林威志、吳昱明、蔡宇祥、馮書昭、

    陳妍如、伊晉安)、以及無數協助並且參與這些研究的政府公務界與電子治

    理相關學界的無名英雄們,所產製出來的十份研究報告,從這些堆累的文字

    中,臺灣電子民主的研究,累積起了豐富的知識結晶。

    前述十份研究者與主題的表列如下,所有的結案報告與相關資料檔案,

    都 可 以 在 電 子 治 理 研 究 中 心 的 網 頁 上 全 文 全 資 料 檔 下 載

  • (http://www.teg.org.tw/web_zh/research/list.do)。當然,這個跨年協力的研究

    脈絡共分六個階段,本書試著分述如下。

    第一階段,在 2009 年開始,陳敦源與潘競恆(2009)首次關注 Web 2.0

    時代應用如「國家政策網路智庫」收集網路民意的可行性分析,但是當時實

    務上的運作結果是,網民上政府 Web 2.0 政府網站表達政策意見的意願不

    高,因此最後智庫關台並拆解功能放入不同網站,對比 2015至2016 年開始

    暴紅「公共政策網路參與平臺」(俗稱 Join 平臺,網址:https://join.gov.tw/),

    網路智庫的建構思維是領先時代的。

    第二階段,2010 年潘競恆與陳敦源(2010)年的研究,開始用臉書當作

    一個實驗場域,試圖了解臉友網路行為與民意形成的關聯性,實驗結果發現

    政府網路經營者的作法與態度,會影響到臉友參與的意願與評價。

    第三階段,2010 年到 2011 年連續兩年,周韻采與陳俊明(2010, 2011)

    將網路輿情的研究由政府開設平臺收集,轉變成為政府如傳統民調的運作一

    般,上網撈取資料並分析之的模式,開啟了研究網路輿情的技術開發大門。

    第四階段,2012 年的兩份研究報告,分別從公關行銷與內部資料加值應

    用的角度,將網路輿情分析「內部」與「外部」兩種途徑的圖像展現出來,

    前者應用行政資料庫的資料採礦(data mining),尋找民眾意見的有意義整合

    資訊(廖洲棚、陳敦源、廖興中,2012),後者將外部存在的各種網路民眾

    資訊,當作一個分析資料庫,意圖在政府公關與政策行銷既有的工作需求上,

    加入網路分析工具的應用(潘競恆、羅晉,2012)。

    第五階段,從 2013 到 2014 年間,研究團隊針對前述「內部」與「外

    部」的輿情資料分析,分別進行相關研究(廖洲棚、陳敦源、蕭乃沂、廖興

    中,2014),此時巨量資料(big data;或譯「大數據」)的概念在社會上被

    炒熱,研究團隊嘗試不同的資料庫進行相關研究實驗,內部資料主要以臺北

    市政府的 1999 人民陳情案件為主,對外則是從資料撈取的範疇開始鑽研。

    雖在第二階段的時期已經有些經驗,但 2014 年的突破最主要是網路輿情撈

    取的商業應用開始蓬勃,研究團隊開始與資策會暨商業巨量資料公司合作,

    在網路輿情資料撈取上出現系統性的可能。

  • 第六階段,於2015到2017年完成的三項年度計畫(蕭乃沂、陳敦源、廖

    洲棚,2015;陳敦源、蕭乃沂、廖洲棚、陳恭,2016;陳敦源、廖洲棚、黃

    心怡,2017),研究團隊陸續開發並且解決政府網路輿情分析的執行細節,

    包括:議題篩選流程、網路輿情分析外包須知、網路輿情分析群眾外包實驗、

    機器情緒分析和政策贊成反對的對比分析、以及最後提出整合性的網路輿情

    分析的策略步驟等,逐步建立政府網路輿情分析的操作地圖,提供學界與實

    務界參考,當然,這個時期公共政策網路參與的 Join 平臺開始網路暴紅,也

    逐漸衍生跨政府部門的協力參與、平臺運作效能及公民參與品質提升等問題

    的解決需求。

    當然,這些研究歷程與結晶固然可以作為政府與學界進一步開發網路輿

    情分析的基礎本土知識礦脈,但是,本序言的最後,將展示政府網路輿情分

    析的三個根本問題,作為過去研究的暫時性結論,以及未來研究與實務努力

    可能會持續碰觸到的難題,這三個問題包含目的、技術、與倫理等方面。

    首先,就目的來說,政府深化網路輿情分析的職能,到底是要運用在甚

    麼地方?值得深入思考,只有公關參考的目的,讓政府的決策不要離民意太

    遠?還是根本將設計網路平臺,朝向某種「網路公投」的方向移動而還政於

    民?許多網民參與政府的網路意見蒐集平臺,是帶著改變政府心意的期待而

    來,參與意願的問題與此密切相關,並部分牽涉到民主政治決策權力在網路

    時代的重分配問題,已經越來越不可忽視了。

    再者,就技術層面來說,網路所蒐集來的巨量網民意見資料分析,基本

    上會進入語言認知領域的人工智慧深水區,過去的研究發現,單純使用關鍵

    字與情緒字眼分析網民意向,在政治領域卻有很高的錯誤率,網民拐彎抹角

    的語言,讓電腦快速分析的優點,必須受制於「工人智慧」判斷較慢但卻較

    精準的現實;因為語言使用的自由度仍然無法全面資訊規制化,造成邁向網

    路輿情分析全面電子化的困境,但是,這部分的技術開發不完全是資管專業

    的問題,也需要議題領域專家的投入。

    接著,就倫理層面來說,政府投注資源在網路輿情研究,最後得到相關

    知識以後,到底只是從中建構更完整的回應民意機制?還是要用這樣的技術

    來培養自己的「網軍」,為執政者的政策在網路辯護?還是,更進一步訓練

  • 專業的網路「民意下蠱師」,在網路散播利於執政黨的言論,鼓動風潮,主

    導各方媒體成為政府運作的「傳聲筒」(echo chamber)?我們認為,「聆聽

    民意」與「操控民意」之間,有條不容易察覺的倫理界線。

    最後,本書的出版,最該感謝的就是國家發展委員會在過去近十年來的

    信任與托負,將寶貴的政府資源經過公開招標的程序,委託給位於國立政治

    大學公共行政學系的電子治理研究中心,共同為臺灣電子治理(e-governance)

    的發展留下珍貴的紀錄;本書可以算是一個傳承,也能被視為另一個新頁的

    開始,只要臺灣民主持續深化,只要資訊通訊科技不斷創新,只要網民永遠

    有新奇好玩的科技與公共議題的刺激,我們相信,政府網路輿情分析的需求

    就會持續存在,而相關研究與管理的知識產製工作,就不會停歇!

    陳敦源、蕭乃沂、廖洲棚、陳恭、廖興中、黃心怡、陳揚中

    寫於 2017 年 3 月 12 日,丁酉年初春

    貓空山下政治大學公共行政學系

  • 目次

    I

    目次

    目次 ............................................................................................................. I

    表次 .......................................................................................................... III

    圖次 ......................................................................................................... VII

    第一章 緒論 ..................................................................................................... 1

    第一節 研究動機與目的 ......................................................................... 1

    第二節 研究問題 ..................................................................................... 3

    第三節 本書各章節簡介 ......................................................................... 5

    第二章 文獻回顧 ............................................................................................. 7

    第一節 Web 2.0 與網路民主發展 ........................................................... 7

    第二節 政府政策行銷與政策議題管理 ............................................... 12

    第三節 巨量資料分析的發展 ............................................................... 16

    第四節 政府導入巨量資料和輿情分析 ............................................... 38

    第五節 群眾外包與政府治理 ............................................................... 51

    第三章 網路輿情分析的方法與步驟 ........................................................... 57

    第一節 研究設計與研究流程 ............................................................... 57

    第二節 研究方法 ................................................................................... 64

    第三節 預期成果 ................................................................................... 66

    第四章 網路輿情分析實作案例 ................................................................... 69

    第一節 政府內部資料分析與成果:1999 人民陳情案件 .................. 69

    第二節 自由經濟示範區:自動化網路輿情分析 ............................... 96

    第三節 自由經濟示範區:群眾外包輿情立場判斷實驗 ................. 133

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    II

    第四節 一例一休:網路輿情整合式管理機制實作 ......................... 174

    第五節 網路輿情整合式管理機制操作指引 ..................................... 226

    第五章 結論 ................................................................................................. 233

    第一節 研究發現 ................................................................................. 233

    第二節 研究反思與限制 ..................................................................... 239

    第三節 後續研究建議 ......................................................................... 250

    參考文獻 ......................................................................................................... 253

    附錄 ......................................................................................................... 267

    附錄一、 服務建議書徵求文件範本 ....................................................... 267

    附錄二、 網路輿情整合式管理機制操作指引 ....................................... 285

  • 表次

    III

    表次

    表 1:影響線上公民參與的九大構面 ................................................................ 10

    表 2:美國政府政府機關運用巨量資料使用要點 ............................................ 32

    表 3:網路輿情分析導入流程 ............................................................................ 61

    表 4:研究設計摘要 ............................................................................................ 65

    表 5:臺北市 1999市民熱線各發展階段服務內容比較表 .............................. 72

    表 6:臺北市 1999市民熱線陳情案件資料欄位定義一覽表 .......................... 74

    表 7:篩選分析案件權責機關及案件數統計表 ................................................ 77

    表 8:運用分類技術建構之分案規則分案正確率統計表 ................................ 80

    表 9:分群方法 I和分群方法 II之方法特性及優缺點比較表 ........................ 83

    表 10:環保局主辦案件採用分群方法 I的分析結果 ....................................... 88

    表 11:環保局主辦案件常見協力機關 ............................................................... 88

    表 12:衛生局主辦案件採用分群方法 I的分析結果 ....................................... 89

    表 13:衛生局主辦案件常見協力機關 .............................................................. 89

    表 14:環保局主辦案件以分群方法 II的分析結果一覽表 .............................. 90

    表 15:網路輿情分析導入流程(修正版) ...................................................... 97

    表 16:「自由經濟示範區」關鍵詞範例 ............................................................ 98

    表 17:相關性言論品質檢測 ............................................................................ 124

    表 18:正向情緒判讀結果比較 ........................................................................ 126

    表 19:負向情緒判讀結果比較 ........................................................................ 126

    表 20:情緒意向與政策立場交叉分析 ............................................................ 127

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    IV

    表 21:不同之常見網路付費廣告比較 ............................................................ 147

    表 22:輿情平臺 FB廣告成效 .......................................................................... 149

    表 23:輿情平臺 FB廣告受眾年齡與成效分析 .............................................. 150

    表 24:輿情平臺 FB廣告受眾年齡/性別之成效分析 .................................. 150

    表 25:觀察值處理摘要-群眾判斷結果*助理判斷結果 ................................. 153

    表 26:群眾判斷結果*助理判斷結果交叉表(原始) .................................. 154

    表 27:群眾判斷結果*助理判斷之 Kappa一致性結果(原始) .................. 155

    表 28:群眾判斷結果*助理判斷結果交叉表(合併無法判斷資料) .......... 157

    表 29:群眾判斷*助理判斷之 Kappa一致性結果(合併無法判斷資料) .. 158

    表 30:群眾判斷結果*助理判斷結果交叉表(只看判斷為支持與反對立場)

    ................................................................................................................. 159

    表 31:群眾判斷結果*助理判斷之 Kappa一致性結果(只看判斷為支持與反

    對立場) ................................................................................................. 160

    表 32:輿情平臺實驗設計之 4種專案介面 .................................................... 162

    表 33:四種專案介面的群眾判定概況 ............................................................ 163

    表 34:群眾之組內和全體判定結果一致性 .................................................... 164

    表 35:進行立場分析之資料數量建議表 ........................................................ 177

    表 36:一例一休關鍵字一覽 ............................................................................ 188

    表 37:一例一休關鍵字檢核結果 .................................................................... 189

    表 38:一例一休議題聲量與情緒分析表 ........................................................ 191

    表 39:部分停用字列表 .................................................................................... 195

    表 40:主題模型輸出範例 ................................................................................ 196

    表 41:一例一休議題資料之主題模型結果 .................................................... 199

    表 42:一例一休資料數量與主題分布表 ........................................................ 203

  • 表次

    V

    表 43:各主題上架分析平臺資料量 ................................................................ 204

    表 44:上架資料之情緒分析*立場分析交叉列表 .......................................... 207

    表 45:支持立場文章之主題關鍵字 ................................................................ 209

    表 46:T0主題內文章之關鍵支持論述 ........................................................... 212

    表 47:T1主題內文章之關鍵支持論述 ........................................................... 213

    表 48:T2主題內文章之關鍵支持論述 ........................................................... 214

    表 49:T3主題內文章之關鍵支持論述 ........................................................... 215

    表 50:T4主題內文章之關鍵支持論述 ........................................................... 216

    表 51:反對立場文章之主題關鍵字 ................................................................ 217

    表 52:T0主題內文章之關鍵反對論述 ........................................................... 221

    表 53:T1主題內文章之關鍵反對論述 ........................................................... 222

    表 54:T2主題內文章之關鍵反對論述 ........................................................... 223

    表 55:T3主題內文章之關鍵反對論述 ........................................................... 224

    表 56:T4主題內文章之關鍵反對論述 ........................................................... 225

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    VI

  • 圖次

    VII

    圖次

    圖 1:新型態之網路政府與民眾互動模式 ........................................................ 16

    圖 2:巨量資料分析啟動路徑 ............................................................................ 19

    圖 3:引進巨量資料分析技術後的流程循環 .................................................... 23

    圖 4:網路輿情分析流程圖 ................................................................................ 42

    圖 5:巨量資料分析 vs. 政策應用需求落差圖 ................................................ 50

    圖 6:篩選分析案件權責機關及案件數統計圖 ................................................ 78

    圖 7:陳情案件分群作業流程圖 ........................................................................ 84

    圖 8:環保局主辦案件關鍵詞決策樹分析結果 ................................................ 87

    圖 9:環保局主辦案件熱門公共議題及案件量 ................................................ 90

    圖 10:2014年 1至 3月民眾陳情臺北市環境髒亂地點 ................................. 93

    圖 11:衛生局主辦案件熱門關鍵詞網路討論趨勢圖 ....................................... 94

    圖 12:環保局主辦案件熱門關鍵詞網路討論趨勢圖 ...................................... 95

    圖 13:網路輿情分析查詢平臺 ........................................................................ 100

    圖 14:網路輿論的主體與屬性 ........................................................................ 104

    圖 15:聲量與情緒(期間/事件)(一) ...................................................... 106

    圖 16:聲量與情緒(期間/事件)(二) ...................................................... 108

    圖 17:聲量與情緒(期間/事件)(三) ...................................................... 109

    圖 18:聲量與情緒(期間/事件)(四) ...................................................... 110

    圖 19:輿論管道與擴散(期間/事件)(一) .............................................. 111

    圖 20:輿論管道與擴散(期間/事件)(二) .............................................. 112

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    VIII

    圖 21:輿論管道與擴散(期間/事件)(三) .............................................. 113

    圖 22:意見領袖(期間/事件)(一) .......................................................... 114

    圖 23:意見領袖(期間/事件)(二) .......................................................... 116

    圖 24:特定輿論內容(期間/事件)(一) .................................................. 117

    圖 25:特定輿論內容(期間/事件)(三) .................................................. 118

    圖 26:重要關鍵字與議題歸類 ........................................................................ 119

    圖 27:整體結論與因應建議(一) ................................................................ 120

    圖 28:整體結論與因應建議(二) ................................................................ 121

    圖 29:群眾外包之網路輿情分析雛形系統 .................................................... 134

    圖 30:實驗平臺之系統架構圖 ........................................................................ 139

    圖 31:群眾判讀輿情資料的可能順序 ............................................................ 141

    圖 32:群眾外包分析實驗之主要流程圖 ........................................................ 142

    圖 33:輿情立場判定之任務執行介面 ............................................................ 143

    圖 34:提供判讀結果統計的專案執行介面 .................................................... 145

    圖 35:群眾判斷結果*助理判斷之長條圖 ...................................................... 156

    圖 36:群眾判斷結果*助理判斷結果長條圖(合併無法判斷資料) .......... 158

    圖 37:群眾判斷結果*助理判斷結果長條圖(只看判斷為支持與反對立場)

    ................................................................................................................. 161

    圖 38:使用者進入平臺網站之管道 ................................................................ 166

    圖 39:使用者之性別數量與比例分析 ............................................................ 167

    圖 40:使用者所處網域之地區分布 ................................................................ 168

    圖 41:使用者停留時間以及跳出率 ................................................................ 169

    圖 42:使用者連線之網路瀏覽器分析 ............................................................ 170

  • 圖次

    IX

    圖 43:使用者利用網站服務之記錄 ................................................................ 171

    圖 44:不重複之新網站訪客比率 .................................................................... 172

    圖 45:網站使用者操作網站之過程記錄 ........................................................ 173

    圖 46:網路輿情整合式管理機制流程圖 ........................................................ 179

    圖 47:輿情分析平臺首頁 ................................................................................ 181

    圖 48:輿情分析平臺註冊頁面 ........................................................................ 181

    圖 49:輿情分析平臺實驗說明介面 ................................................................ 182

    圖 50:輿情分析平臺操作說明介面 ................................................................ 183

    圖 51:輿情分析平臺伺服器架構 .................................................................... 184

    圖 52:關鍵字檢核步驟 .................................................................................... 187

    圖 53:一例一休議題聲量與正負情緒趨勢圖 ................................................ 190

    圖 54:LDA模型示意圖 ................................................................................... 193

    圖 55:主題模型分析流程 ................................................................................ 194

    圖 56:文本上的主題分布(範例) ................................................................ 197

    圖 57:主題詞彙網路圖 .................................................................................... 198

    圖 58:一例一休議題資料之主題模型關係圖 ................................................ 202

    圖 59:上架平臺資料之聲量-情緒趨勢圖 ....................................................... 205

    圖 60:上架平臺資料立場判斷結果趨勢圖 .................................................... 206

    圖 61:支持立場文章主題網絡圖 .................................................................... 210

    圖 62:支持立場文章主題比例圖 .................................................................... 211

    圖 63:反對立場文章主題網絡圖 .................................................................... 219

    圖 64:反對立場文章主題比例圖 .................................................................... 220

    圖 65:網路輿情分析流程圖 ............................................................................ 228

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    X

  • 第一章 緒論

    1

    第一章 緒論

    第一節 研究動機與目的

    過去臺灣政府在電子化的發展上,「民眾」被定位為「政府服務消費者

    (consumers)」的角色,也就是說,政府建構e化政府的政策目標,就是如何

    更快地「輸送」(deliver)政府的服務給這些顧客,以達到「服務滿意度」的

    回饋。這樣的觀點主要是基於新公共管理將民眾視為顧客來服務的思維出發

    點,並著眼於政府服務效率提升的目標上。然而,自聯合國2000年提出之「千

    禧年宣言(the Millennium Declaration)」,以及在2003年至2005年電子化政

    府的相關評估開始發展「電子化參與(e-participation)」的評估指標後。學術

    界也開始興起從公民參與的角度將ICTs視為一種政府藉之深化民主治理的工

    具,以試圖解除「管理主義」對世界各國政府電子化發展的牢籠效果(陳敦

    源、黃東益、蕭乃沂,2004;Caldow, 2004; Chadwick, 2003)。在這一波電子

    化政府的發展浪潮下,所帶動的不僅只是政府管理技術與效率的提升,其也

    進一步對於民主治理的深化和普及,帶來了極大的貢獻,卻同時也讓我們留

    意到其他問題。例如,政府仍然必須面對並解決其服務與管制雙重角色的底

    線;民眾與政府之間的認知落差對於政府滿意度與信任的減損;電子化對於

    社會和人類行動的快速轉變,加深政府即時回應民眾的壓力與考驗。即便政

    府不主動開放或邀請民眾參與政策議題的溝通,但在網路社群的蓬勃發展以

    及資訊的流通更為快速與便利的情況下,民眾不僅更容易取得與交換相關政

    策資訊,更在虛擬網路的空間中討論各種議題,甚至是進行集結與動員,對

    於政府的各項政策與行動立即做出反應。

    因此,不論是基於開放參與、理解民意與有效回應、抑或是提升政府管

    理的能力或效益的考量,都建議可嘗試藉由發展研判民眾意向的公民調查、

    強化政策過程中橫向專家與縱向民眾參與的廣度與深度、以及提升公務人員

    的對外溝通能力來面對上述Web 2.0時代下政府面對的問題與挑戰。而在這樣

    的發展脈絡下,可預期的是未來政府與民眾在網路時代的溝通與互動,也將

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    2

    逐漸發展出新型態的網路參與和溝通形式。因此,政府也應該隨之發展出新

    策略,以有效地回應民眾需求,不論是回應民眾對於政策的價值偏好、或是

    對於參與治理的渴望,抑或是讓政府與民眾共同發展出新型態的治理機制,

    進而落實當代之民主治理。

    另一方面,不論是流行還是工具的成熟使然,巨量資料(Big Data)分析

    已經成為公私部門組織的創新改革的利器之一;我國政府於2015年公布

    「ide@ Taiwan 2020(創意臺灣)政策白皮書」之後,政府組織如何善用兼具

    Volume(數據資料的大量)、Velocity(資料分析的時效)、Variety(資料格

    式的多樣)、與Veracity(資料內容的真實)所謂4V特質的巨量資料分析能力

    (Desouza & Jacob, 2014; Dumbill, 2012a; Zikopoulos et al., 2013),在政策 e

    化參與,以及數位政府服務等面向,政府各機關已經積極展開各種應用的工

    作,包括行政內部資料的巨量資料分析、網路輿情分析、甚至公共服務「物

    聯網」的規劃和應用等。

    然而,由於這種技術應用的效能,需要創造出具備跨專業領域技術應用

    的雙向回饋機制,才能真正落實巨量資料在政府機關的應用實效;更重要的

    是,從政府公共治理的角度出發,各種政策工具或概念導入於政府的「供給」,

    還必須適當橋接於政府在政策端治理的「需求」,如此才可能有效地被政府

    採納,並且真正提升政府治理效能。因此,在這樣的概念之下,我們都應該

    先清楚定義巨量資料應用的政策目標、正確理解相關技術帶來的效益與限制,

    接著從中尋找結合巨量資料分析與政策端應用效能提升的連接點所在,而後

    進一步開發所需要的分析技術與管理模式組合,如此才能真正落實巨量資料

    分析技術在公部門治理的應用目的。

    舉例而言,目前巨量資料分析網路輿情的技術,與傳統政府民意蒐集的

    機制比較起來,基本上可以補強政府對於網路輿情資料的缺空,目前分析方

    法重點,主要是建構社群網站的言論資料庫,依照政府各機關的「關鍵字」

    需求,用資料探勘技術萃取出相關網路言論資料,進行長期「討論量」、「正

    負情緒(電腦自動分析)」、「言論來源」、以及「關鍵字暴風圈」的趨勢

    分析。然而,這些資料對於政府運作的公共政策端,需要政策立場的分析、

    政策論證內容的掌握、以及如何與其他輿情蒐集管道整合建議的需求,仍然

    有一段距離。當然,政府內部的行政巨量資料分析(含物聯網的內部資料),

  • 第一章 緒論

    3

    也有相同的提升應用效能的問題,包括政府網頁的民眾行為分析、行政資料

    庫民眾使用內涵分析、以及物聯網民眾使用或觸動「感測器」(sensor)的分

    析等,要如何與政府政策端目的以及治理策略連結的問題。

    因此,綜上所述,本書嘗試集結電子治理中心團隊於103年度、104年度

    與105年度間,針對政府應用巨量資料網路輿情分析技術議題上的3年研究成

    果,試著呈現Web 2.0時代下的網路民主發展趨勢、當代政府政策行銷與議題

    管理的問題、巨量資料時代的發展、政府導入各種巨量資料分析技術的問題

    與效益、以及新時代的群眾外包與政府治理等議題之間的關係。除了藉由理

    論文獻的回顧與討論外,更由內而外地針對臺灣政府內部的資料分析以及外

    部網路輿情分析的實作案例,展現Web 2.0時代下新型態的政府與民眾互動的

    概念與實務、以及計畫團隊對於各種新型態的分析技術與概念應用於政府治

    理中所進行的創新實驗。最後,基於上述經驗,本書最終將試著提出一符合

    政府議題管理需求、行政實務脈絡、並有效整合人機分析技術之網路輿情整

    合式管理機制,並針對上述議題討論與實作成果提出結論省思。希望能藉由

    本書的呈現,對於臺灣電子治理中心研究團隊在探索Web 2.0時代下政府網路

    輿情分析的概念與實務後的階段性成果,並期待能供相關實務與研究工作者

    參考,並在本書的經驗基礎上更進一步對於網路民意探勘技術對於強化政府

    政策議題管理能力,促進政府與民眾之間的溝通、互動、與關係上有更好的

    發展。

    第二節 研究問題

    歷經過去幾年在技術上與觀念上的進展,巨量資料(Big Data)分析已經

    成為公私部門組織的競爭利器之一,甚至逐漸形成了跨越統計、資訊科技、

    行政管理等領域的資料科學(data science),組織如何培育並善用兼具volume

    (數據資料的大量)、Velocity(資料分析的時效)、Variety(資料格式的多

    樣)所謂3V特質的巨量資料創造經營管理價值(Value),也逐漸成為跨越統

    計、資訊與特定業務領域的共同議題。

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    4

    以巨量資料分析的實務應用與學術研究來看,除了聚焦巨量資料分析的

    概念引介與技術運作(如演算法、平臺等)之外,多關注於特定產業領域或

    個別企業的成功案例,例如透過顧客購買行為發展出創新利基服務,或是透

    過網路輿論瞭解品牌滲透及行銷關鍵突破。相對而言,較少有研究與實務深

    入討論組織所需搭配的資源能量與相關管理議題。同時,實務與文獻的案例

    也多為私部門組織的應用,尤其是個別領域應用的效益,鮮少涉及政府部門

    如何運用巨量資料分析以提升公共服務與公共政策的績效,與其相關議題與

    配套管理措施。

    再者,運用巨量資料分析政府內部資料以及外部輿情,對於提升政府公

    共治理的效益為何、又該如何達成,在這其中我們應該思考創新技術的導入

    於政府之中,在技術的供給以及治理的需求之間該如何配合與調整。基於上

    述背景與問題,本書在一開始將提出以下3個基本問題。

    (一) 網路輿情何以對政府的決策行為產生影響力?

    (二) 網路輿情如何蒐集與分析?

    (三) 如何判定網路輿情的政策立場與論述?

    本書希望藉由此3項問題的反覆省思以及個案實作,逐步呈現Web 2.0時

    代的政府部門網路輿情分析概念與實務。首先,我們將以Web 2.0與網路民主

    發展的趨勢、政府政策行銷與議題管理的重要性、以及巨量資料分析技術的

    發展,探討網路輿情何以對政府的決策行為產生影響力的問題。

    接著,從政府管理的「需求」端出發,提出政府在進行政策行銷與議題

    管理的內涵與重要性,並強調資料分析的應用目的,必須依據組織議題管理

    的需求而定,而資料分析發展的方向,亦必須以公部門組織議題管理的需求

    為核心。

    第三,本書為呈現巨量資料分析技術的發展脈絡與現況,本書嘗試對其

    概念、內涵、應用進行介紹,探討巨量資料與網路輿情的蒐集、分析技術、

    應用可能、以及所面臨的問題挑戰。

    第四,除介紹各種分析技術以及可能如何導入政府的案例外,更基於前

    述強調政府議題管理的「需求」端的考量,指出政府在導入巨量資料分析的

  • 第一章 緒論

    5

    應用與需求落差。例如,在網路輿情的分析對於政府議題管理的應用上,至

    少必須能夠幫助政府理解各方對於政策議題的立場與論述,才能具備實效。

    第五,基於「網路的問題交由網路解決」的概念啟發,除了對於群眾外

    包(crowdsource)與政府治理的關係進行討論外,在後續的網路輿情分析實

    作上,本書也將嘗試把群眾外包視為一種分析途徑。

    基於綜上議題的討論後,本書將依序呈現計畫團隊在103年度,針對政府

    內部資料分析:臺北市政府1999人民陳情案件;外部網路輿情分析:103年度

    與104年度計畫之自由經濟示範區,以及105年度計畫中的一例一休等個案實

    作研究之研究設計與成果。展現研究團隊如何逐步由內而外推進政府部門網

    路輿情分析的概念與實務發展,考量政府管理實務的需求與脈絡、擷取各種

    人機分析技術間的優勢,最終建構出一套確實能幫助理解巨量輿情資料中的

    各方之政策立場與論述的整合式網路輿情分析管理機制

    最後,再根據以上成果以及對於前述問題的探討與回答,重新回答網路

    輿情如何對政府的決策產生影響力。或者,更精確的說,怎樣的輿情分析機

    制、能力、技術與分析成果,才可能有效影響政府進行決策,幫助政府提升

    公共治理的能力,並於文末針對後續研究與實務的發展進行反思與建議。

    第三節 本書各章節簡介

    本書章節安排規劃如下,本書共分五章,分節為第一章緒論、第二章文

    獻回顧、第三章網路輿情分析的方法與步驟、第四章網路輿情分析實作案例、

    以及最後第五章結論。在此,本章第一章緒論主要為概要介紹本書之背景以

    及探討問題重點。

    第二章之文獻探討共分五節,本書將依序從Web 2.0與網路民主的發展開

    始論述,連結當代政府政策行銷與議題管理的重要性與挑戰。接著,介紹巨

    量資料分析的發展、政府導入巨量資料以及輿情分析技術的現況與問題。最

    後,基於網路的問題交由網路解決的概念引導,討論以群眾外包協助資料分

    析以及政府治理的可能性。

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    6

    第三章為說明本書第四章分析實作案例的研究設計、研究方法、以及預

    期成果,在實作案例上分別為政府內部資料分析:1999人民陳情案件(103年

    度計畫);政府外部輿情資料分析實例:自由經濟示範區(103與104年度計

    畫)、以及一例一休(105年度計畫)等實作案例。

    第四章依序呈現前述政府內部資料分析:1999人民陳情案件;政府外部

    輿情資料分析實例:自由經濟示範區;政府外部資料分析實例:一例一休等

    三大案例之分析成果。其中外部輿情分析實例:自由經濟示範區,又區分為

    完全電腦自動化之網路輿情分析成果(103年度計畫),以及以群眾外包嘗試

    快速進行立場分析(104年度計畫)兩個部分。最後,根據上述實作經驗,本

    書最後以一例一休此案例規劃進行網路輿情整合式管理機制之實作,並提出

    操作指引供實務工作者參考。

    最後,在第五章本書將整理各項研究發現,根據實作案例所面對的各種

    限制進行反思,並嘗試提出後續研究建議方向。

  • 第二章 文獻回顧

    7

    第二章 文獻回顧

    第一節 Web 2.0與網路民主發展

    代議制民主發展至今,許多學者先後指出該制度產生的弊病,無論是成

    熟的民主國家或是新興的民主國家,都出現不同程度的公民參與危機,包括

    投票率下降和對政治愈加疏離等問題。這些民主危機促使我們思考對於代議

    民主的調整、補充、抑或取代的可能,例如參與式民主或審議式民主的提出。

    相較於代議制民主,參與式民主強調公民的政治參與,主張通過公民對公共

    事務的共同討論、溝通、妥協、與行動,解決共同的公共課題;民眾不僅僅

    在投票日當天行使民主,也能提供政策建議給政府。自60年代開始,西方社

    會便視公民參與(public participation)為民主治理與政治決策的合理化基礎。

    然而隨著時代的演進,公民參與的功能日益豐富,除了增加治理合法化之外,

    也希望能透過加強公民參與,進而改善政策制定過程的品質且讓更多公民能

    支持政府的政策(Wagner, Vogt & Kabst, 2016)。

    另一方面,由於網路與資訊通訊技術(Information and Communication

    Technologies, ICTs)的快速發展與普及化,一般民眾愈來愈能夠透過ICTs了

    解政府運作以及社會問題的現況、分享資訊、或相互串聯,並進一步發展實

    際的社會行動。在此情形下,各國政府也積極發展網路的參與機制,包含網

    路公共諮詢(e-consultation)、網路連署(e-petition)、或網路投票(i-voting)

    等各種方式強化政府與民眾之間的溝通。因此,政府治理的電子化也逐漸地

    被學者們認為會是強化民主參與、縮短政府與民眾之間的距離,以及增進民

    眾對政府治理信心的重要機制(Ainsworth, Hardy & Harley, 2005; Norris, 2001;

    Thomas & Streib, 2005; Kampen & Snijkers, 2003)。Fountain(2001)在(Building

    the Virtual State)一書便明白指出新興資訊與通信科技的發明與應用,將翻轉

    式地改變政府治理模式與公共行政運作系統。利用資通訊科技(尤其是網路)

    能快速連結多數個人,無論地理位置遠近的特點,除了劃時代的改變電子化

    政府服務提供方式與流程外,網路也改變了民主的行使方式(Moon, 2002)。

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    8

    換言之,從e化服務到電子治理的過程中,政府經歷了行政資訊化、電子服務

    提供、甚至是近年各國大力推動的電子參與(e-participation),以期能實現電

    子民主的理念。電子參與可以被理解為透過網路的中介效果,使得公民群體

    與政府行政群體進行線上互動與溝通。也因此,即便聯合國將電子參與視為

    電子化政府完成度的一環,但事實上,電子參與背後的意涵與電子民主的連

    結是相當緊密的(United Nations, 2014)。一般而言,廣義的政治參與被定義

    為「一種企圖改變政治決策制定的行為」(Barnes & Kasse, 1979)。在這樣

    的定義之下,新型態的網路公民參與即是主張利用網路與電子媒體的即時連

    結特性,透過共同協力的方式來影響政府的決策。因此,類似實體的政策參

    與,學者也將網路上的新型態政治參與區分為四類,包括:(1)代議民主式

    參與(participation in representative democracy),如線上投票;(2)直接民

    主式參與(participation in direct democracy),如參與式預算與線上連署;(3)

    審議式民主參與(deliberative participation)則強調政府與民眾雙向互動與溝

    通,如線上論壇、以及(4)示威式民主參與(demonstrative democracy)(Kaase,

    2010; Kersting, 2013)。

    除了與民主政治的關係外,電子參與(e-participation)的論文自1998年後

    開始被大量討論,主題也十分廣泛。部分學者從電子參與的影響面出發,認

    為電子參與將能改變或改善民主的型態(Chadwick, 2003; Macintosh, 2004)。

    然而網際網路究竟是賦予人們更多直接參與民主的權力,還是加深社會對立

    與分歧,在學界仍是未定論。但不可否認的,網路能縮短人們溝通與傳遞訊

    息的時間,達到過去在地政治無法接觸的更多群眾,或許樂觀與悲觀的面向

    同時存在,就足以能夠對社會帶來許多巨大改變。但推動電子參與的目標以

    及可能產生的改變究竟可能為何?Macintosh(2004: 3)認為依據參與程度的

    高低,鼓勵與促使公民增加電子參與可達成三階段政治目標,此三階段目標

    分別說明如下:

    目標一:

    使公民得以使用與近用網路、政府資訊與政策訊息取得與使用(e-

    enabling),進而增進公民數位機會。公共政策工具包括:政府資料電子化

    (archive digital data)、提供電子化政府服務(government e-services)、與開

    放政府資料(open government data)等。

  • 第二章 文獻回顧

    9

    目標二:

    使公民得以參加與介入公共事務,將公民角色視為諮詢者,在此階段的

    公民參與活動主要是由上而下,以政府主導的方式向公民諮詢政策意見,以

    期引導出更深入的討論。公共政策的工具包含:建立政府信箱、電子社群(e-

    community)、電子諮詢(e-consultation)、電子公投(e-referenda, e-voting)、

    或電子公民陪審團(e-citizen jury)等。

    目標三:

    最終階段則是使公民能積極的參與公共事務,屬於由下而上,由公民主

    動發起式的影響政策議程之設定。政府可以考慮的政策工具包括:電子請願

    與連署(e-petitions)。

    不過,推動電子參與並不容易,尤其是政策目標二與目標三,在建置鼓

    勵公民進行公共諮詢與政策建議的相關平臺時,Macintosh(2004)曾歸納影

    響電子參與成功的九大構面,包括:參與程度、參與成員、公民參與的時機、

    使用的科技工具、參與規則、參與時間長短、參與規模、參與成本、以及參

    與結果的評估(見表1),適合用來檢視不同電子參與政策工具的機制與成效。

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    10

    表 1:影響線上公民參與的九大構面

    構面 構面說明

    參與程度 公民參與了「什麼」?程度為何?

    參與成員 「誰」參與了這些活動?

    納入公民參與的時機 公民「何時」參與?

    使用的科技工具 「如何」讓公民進行參與活動?「什麼」樣的科

    技工具可以輔助?

    參與規則 「什麼」樣的個人資訊需要被收集?

    參與時間長短 公民參與的時間有「多久」?

    參與規模 「多少」公民參與?從「哪裡」參與?

    參與成本 參與的成本有「多少」?「如何」宣傳?

    參與結果的評估 從政治、法律、文化、經濟、科技等面向評估參

    與的結果

    資料來源:本書整理自 Macintosh(2004)。

    若將視野拉回臺灣,過去臺灣政府在電子化的發展,「民眾」被定位為

    「政府服務消費者(consumers)」的角色,也就是說,政府建構 e 化政府的

    政策目標,就是如何更快地「輸送」(deliver)政府的服務給這些顧客,以達

    到「服務滿意度」的回饋。更深一層來說,這樣政策願景的背後,是從經濟

    發展的角度,應用資訊與通訊科技增進政府服務效率,以滿足「顧客」對政

    府服務的需求(陳敦源等人,2004)。然而,自聯合國2000年從人類發展(human

    development)的角度,提出以「造福全體的發展」(development for all)為

    主軸的「千禧年宣言(the Millennium Declaration)」,以及在2003年至2005

    年的「世界資訊社會高峰會議」中,對於發展資訊社會的過程中,政府該如

    何扮演追求平衡與平等角色的問題逐漸受到重視,電子化政府的相關評估開

    始發展「電子化參與(e-participation)」的評估指標。另一方面學術界也開始

    興起從公民參與的角度將ICTs視為一種政府藉之深化民主治理的工具,以試

    圖解除「管理主義」對世界各國政府電子化發展的牢籠效果(陳敦源等人,

    2004;Caldow, 2004;Chadwick, 2003)。臺灣電子化政府政策的發展亦隨著

    此一趨勢,在推行目標與願景上逐漸從提升行政效率逐步擴大到對於民主政

    治多元價值(如效率、回應、透明等)的體現,而開始將民眾視為是擁有國

  • 第二章 文獻回顧

    11

    家主權的「公民」(citizen),這也是「電子治理」(e-governance)最基本

    的理念(陳敦源、潘競恆,2011)。因此,在這一波電子化政府的發展浪潮

    下,所帶動的不僅只是政府管理技術與效率的提升,其也進一步對於民主治

    理的深化和普及,帶來了極大的貢獻。

    但是,雖然我們已逐漸認識到電子化政府推動措施中,民眾與政府之間

    的各項互動是網路民主機制的重要環節之一,但在這快速發展的網路時代當

    中,公部門仍然必須面對並解決其服務與管制雙重角色所帶來的問題,以及

    民眾與政府之間對於公共事務的認知落差影響民眾對政府的滿意度(蕭乃沂、

    陳敦源、黃東益,2003)。電子化的發展對社會的運作與人類的行動帶來快

    速的轉變,倘若政府的治理模式無法快速的隨之反應與演進,快速的資訊科

    技發展,反而可能對於傳統的政府治理帶來傷害。例如,Web 2.0發展出的溝

    通形式與使用者行為具備高度的自我生產者特性,將促進自發性公民導向的

    審議式民主在網路上持續擴散與成長(Rose & Sæ bø, 2010: 228)。雖然面對

    這樣的改變,使得線上組織與實體參與的虛實整合成為可能(Skoric, Poor,

    Liao & Tang, 2011),但同時政府內部的公共管理者,也必須面對落實民主治

    理壓力越來越大的現實(陳敦源、潘競恆,2011)。

    陳敦源與潘競恆(2011)進一步指出,政府部門在Web 2.0時代落實民主

    政治公民參與的環境壓力下,政府開始面臨決策制定的三大挑戰,包括:公

    民參與的交易成本降低、行政專業壟斷性的削弱、以及官僚與網民間溝通落

    差的擴大等問題。更具體說明則例如,Web 2.0技術的發展與應用降低民眾發

    表與分享公共意見及公共資訊的成本,同時也強化民眾取得專業社群知識的

    能力;平版電腦或智慧型手機等行動上網工具的普及,可能改善民眾數位落

    差的現象,而增進民眾參與表達公共意見的能力;雲端運算(cloud computing)

    的應用可加速資訊內容的產製與散佈,其伴隨而生的巨量資料分析技術,雖

    將有利於公共管理者統整與回應民眾意見的能力,但若公共管理者無法與時

    俱進的學習與應用,反而與會和企業、民眾之間產生技術與溝通落差。由此

    可知,資通訊科技的近期發展,降低了公民參與的成本、降低行政官僚的專

    業性壟斷,可能協助公共管理者化解民眾關心或直接參與公共政策所產生的

    「三大麻煩」。但政府或公共管理者若仍停留在過去以內部運作為主的公共

    政策制定模式,並且無法有效應用新的資通訊與分析技術,政府在民主治理

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    12

    的過程中反而會面對越來越大的壓力。研究團隊建議應該發展可研判民眾意

    向的公民調查、強化政策過程中橫向專家與縱向民眾參與的廣度與深度、以

    及提升公務人員的對外溝通能力。聯合國的電子化政府調查報告也提出類似

    建議,為了創造一個合適的網路參與模式,政府應該建立適當的法律與制度

    框架、對民眾進行電子媒體應用的能力培育、以及連結線上與實體參與機制。

    此外,政府也應善用正式與非正式的管道提升公民參與,如利用民眾習慣使

    用的平臺或管道來提升民眾網路參與的積極性(United Nations, 2014: 6-7)。

    在這過程之中,政府與民眾之間的溝通與互動,在網路時代下,必然逐漸發

    展出新型態的網路參與和溝通形式,而政府也應該隨之發展出新的策略與治

    理模式,以有效地回應民眾的需求。不論是回應民眾對於政策的價值偏好、

    或是對於參與治理的渴望,抑或是讓政府與民眾共同發展出新型態的治理機

    制,進而落實當代之民主治理。

    第二節 政府政策行銷與政策議題管理

    Web 2.0的發展,讓政府實現「以公民為核心的電子政府服務」(Citizen-

    Centric E-government Services; Chen, 2010),就技術上又向前邁進了一步,但

    更重要的,這個發展也讓政府公關與政策行銷的領域,進入一個新的領域。

    早在Web 2.0尚未來臨的時代,McLeod、Scheufele與Moy(1999)的研究就發

    現,人際之間的公共討論,有助於民眾公共參與的意願,以及提升民眾對於

    不同政策選項的判斷能力;進入Web 2.0的時代後,因為前述種種溝通模式的

    轉化,這樣的效果將更為強化,使得論者認為Web 2.0的發展,將使得政府與

    人民之間產生更為緊密的互動關係,理想上也有助於政府對民眾進行政策溝

    通或行銷。

    社群網站的興起,確實讓政府與民眾互動介面產生改變。根據潘競恆、

    王千文、陳敦源(2011)的說法,首先,社群網站讓公民參與的交易成本降

    低,只要發生引起媒體關注的議題,社會團體就能應用網站集結民眾,影響

    公共事務的結果,橫向連繫的成本將不再高昂;再者,社群網站讓政府專業

    壟斷削弱,不論從溝通或是決策的角度來看,受到網路群眾智慧所支持的公

    民,不斷挑戰公務體系的專業話語權;最後,官僚與網民間溝通認知落差擴

  • 第二章 文獻回顧

    13

    大,公務人員與民眾的溝通模式,主要以從上對下的文字為主,但是,網路

    時代非文字多媒體的溝通模式,並不是傳統公務體系所擅長的。此外,就管

    理的層面來說,政府的行銷(marketing)作為是一個「統整的概念」(umbrella

    concept),包含公關手法,以及廣告活動,藉由與外界溝通的策略規劃,而

    達成組織目標;而行銷、公關、與廣告這三個名詞之間的關係包括,行銷著

    重實物、服務或觀念的交換;公關則是著重組織或個人形象的塑造與維繫;

    而廣告是進行前項活動時,溝通技巧與信息內容的規劃。一般政府組織對外

    的溝通任務,通常會以行銷作為代表名詞,雖然政府正面的曝光(publicity)

    這種與公關更為接近的概念,往往能夠導引民眾對特定公共政策的支持與反

    對,但是整體而言,在網路的時代當中,政府的公關與政策行銷作為,應該

    有不同的思維。

    在形式上,公共政策往往是以議題的方式展現,許多政策議題的討論,

    也是圍繞在該政策是否能夠達到相關目標,或是誰贊成?誰反對?以及為什

    麼等問題。而在Web 2.0的時代下,政策議題的討論介面與形式以不僅在傳統

    的報章雜誌、新聞媒體、抑或人們面對面的口耳之間,而更多是在網路世界

    中進行,並且資訊量的增長與擴散速度與程度更是遠勝以往。於是,從政府

    管理的角度來看,網路時代的政府公關與政策行銷專業,還必須將網路上的

    巨量輿情資料納入管理。但不論政策議題的討論形式如何改變,對於政府與

    公共管理者來說,核心的管理概念依舊是政策之「議題管理」( issue

    management),因此,政府該如何應用議題管理的知識,創造網路時代政府

    公關與政策行銷的效果,將是本書希望點出的重點之一。

    「議題管理」是一種組織對外關係的管理系統,最早由學者Ansoff(1980)

    年提出,主要功能是對與組織生存發展有關的議題,進行「提早偵測」(early

    identification)與「快速回應」(fast response)的管理活動。其中除了關注在

    對於外部的趨勢與議題的「發掘-描繪-測量」功能(surveillance-monitoring-

    measurement)外,Perrott(1996)認為,利害關係人(stakeholders; Roloff, 2007)

    的指認與分析,也是議題管理的一個重要環節,因為議題自己不會引起注意,

    而是因為新聞中的利害關係人促成其被大眾注意。所以利害關係人對於議題

    的理解、偏好、或態度、都將大大影響相關政策的發展。

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    14

    關於進行議題管理的功能與流程,Heath與Cousino(1990)提出當代社會

    各類組織落實議題管理可以達到的功能有4種:議題傳播、議題偵測、實踐社

    會責任、以及策略規劃。而陳恆鈞(2011)則指出,議題管理可分為4個步驟

    流程,包括議題界定、議題分析與衝擊性評估、擬定策略行動、以及績效評

    估。對於政府而言,應用資訊科技與巨量資料分析的技術來強化電子參與於

    公共議題管理,應能對於議題的發掘與測量、議題分析與衝擊性評估等工作

    有所助益。除此之外,Bench-Capon、Atkinson與Wyner(2015)更強調,電子

    化參與的核心架構,應該被視為政策的論證內涵,不論是從政策論述中收取

    評論意見,還是從參與者提供的論述中挖出核心論述與反對或贊成意見,都

    是電子化參與應該去面對的技術開發焦點。

    而在這樣的發展趨勢下,我國政府於2015年公布「網路智慧新臺灣政策

    白皮書」之後,政府組織積極對具備「大」(Volume)、「快」(Velocity)、

    「雜」(Variety)、以及「真」(Veracity)等所謂4V特質的巨量資料(Big

    Data)(或稱大數據)投入資源進行探究分析,一時之間在政府部門的各個

    領域,如何善用政府內部擁有,以及取得外部的巨量資料以改善政府決策和

    服務,已成為一個當紅的課題。然而,由於這種技術應用的效能,需要創造

    出具備跨專業領域技術應用的雙向回饋機制,才能真正落實大數據在政府機

    關的應用實效。以政府與外部民眾溝通的網路輿論大數據分析需求為例,比

    較網路輿情分析的技術與傳統政府民意蒐集的機制,基本上可以補強政府對

    於網路輿情資料的缺空。

    舉例而言,目前輿情分析方法重點,主要是建構社群網站的言論資料庫,

    依照政府各機關的「關鍵字」需求,用資料探勘技術萃取出相關網路言論資

    料,進行長期「討論量」、「正負情緒(電腦自動分析)」、「言論來源」、

    以及「關鍵字暴風圈」的趨勢分析。然而,這些資料對於政府運作的公共政

    策端來說並不足夠,其落差關鍵在於這些資料分析的結果,對於政策立場的

    分析、政策論證內容的掌握、以及如何與其他輿情蒐集管道整合建議等需求,

    仍然有一段距離。根據臺灣電子治理研究中心從102年度開始的相關研究顯示

    (廖洲棚、陳敦源、蕭乃沂、廖興中,2014;蕭乃沂、陳敦源、廖洲棚,2015;

    陳敦源、蕭乃沂、廖洲棚、陳恭,2016),政府公共關係與政策行銷的需求,

    與目前從網路巨量資料分析專業團隊能提供的資料之間,還有很大的應用鴻

  • 第二章 文獻回顧

    15

    溝存在。這鴻溝可以包括制度以及管理兩個層面,前者代表政府電子化參與

    機制的建構與評估,後者則顯示網路輿情分析必須進一步融合到政府公關與

    行銷管理的體系當中。也就是說,在沒有適當的電子參與機制,與依循政府

    公關與行銷需要而建構的網路輿情系統,政府許多電子化參與政策將很難落

    實。因此,本書認為,從服務導向的政府管理面向出發,挑選政府與外部利

    害關係人(stakeholders)在民主時代「公民接觸」(civic engagement)關係

    重建的角度,先清楚定義應用巨量資料與外部利害關係人互動的目標,再從

    這目標中尋找結合巨量資料分析與政策端應用效能提升的連接點所在,進一

    步開發所需要的分析技術組合,如此才能真正落實巨量資料在改善公部門外

    部關係的應用目的。

    基於上述,議題管理的概念其實對於政府進行網路民意、輿情的探勘、

    分析與政策應用具有高度的啟發性。其實,不論是巨量資料分析、或是新技

    術的網路民意探勘,抑或是傳統的各種政策評估方式應用,都必須具備的相

    同前提:資料分析的應用目的,必須依據組織議題管理的需求而定,而資料

    分析發展的方向,亦必須以公部門組織議題管理的需求為核心。因此,政府

    在探勘網路輿情以及開放民眾網路參與的同時,依然必須具備策略性的管理

    思維,而針對各項政策的需求及目標為核心進行議題管理。簡言之,政府部

    門在進行民意或輿情探勘以前,應先釐清公共問題的內涵,並以政策需求為

    主軸進行管理,據此引導探勘資料分析的應用方向。

    此外,政府在基於議題管理的需求下進行網路民意或輿情的探勘與分析

    時,也應該同時擴大網路之公共參與,鼓勵公民投入議題性的政策活動並提

    供持續的回饋與諮詢,也藉此賦予公民參與權利與培力公民參與政府決策或

    議題諮詢的能力(United Nations, 2014: 6)。而民眾也能在參與過程中能夠表

    述自己對於政策議題的觀點,共同對於社會議題的政策發展盡一份心力,並

    對於政府治理的狀況有更深的理解,進而在政府與民眾的互動之間形成一個

    良性的循環。

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    16

    圖 1:新型態之網路政府與民眾互動模式

    資料來源:本書自行繪製。

    第三節 巨量資料分析的發展

    二十世紀末1980年開始的網際網路普化以及之後儲存設備的快速發展,

    人類生活的各個層面因著各式組織依照行政目的的蒐集,以及二十一世紀初

    期社群網站興起之後的Web 2.0網路環境下,個人自願上傳與記錄的結果,各

    式各樣來源的資料,包括結構性或非結構性、文字或非文字、程式或普通語

    言的資料大量累積,加上某些個案資料分析的新聞性所吸引。比方說,Google

    用其搜尋引擎資料分析和預測流行病(Lazer, Kennedy, King & Vespignani,

    2014),人類社會進入一個所謂「巨量資料」(Big Data)時代,以資訊科技

    與管理學門引領的各種資料分析技術的發展,包括運用分析技術分析所具有

    大量(Volume)、快速(Velocity)、多元(Variety)與真實(Veracity)的

    資料,越來越受到公、私業界及學界的重視;然而,由於資料特性難以用傳

    統分析方法進行分析,必須用進階的技術和演算法來解讀、儲存、分析與管

    理,當然,不論是企業還是政府組織,都不能不注意這樣的發展。接下來,

    我們先來看巨量資料的技術在企業與政府部門的運用現況,最後再針對其計

    畫內容與分析應用上的異同進行比較。

    政府

    民眾

    開放網路參與

    探勘網路輿情

  • 第二章 文獻回顧

    17

    一、企業運用巨量資料分析的背景

    首先企業界對於運用新科技增加績效及獲利一向有著強大的動機,在商

    業界如Google、Amazon與Facebook(FB)等業者,已經利用巨量資料分析開

    發出新的服務模式和創新的經營型態,在行銷上也都整合巨量資料分析產出

    高附加價值的經營模式。1最早使用巨量資料分析的是幾位 Google 工程師在

    科學期刊(Natural)中發表關於流感的研究,他們從Google將近30億筆搜尋

    關鍵字中,篩選出常用的五千萬筆搜尋關鍵字,再與美國疾病管理局(Centers

    for Disease Control, CDC)在2003到2008年的實際流感感染案例進行比對,發

    現經過數學演數法(Algorism)進行的相關性(correlation)分析與美國疾病

    管理局官方資料相當吻合(林俊宏 譯,2013)。

    前述經過數學演算法與大量資料的比對分析,資訊價值產生了突破性的

    發展,巨量資料分析技術提供了企業部門發展與生存的新利基。由 Google 的

    經驗可知,單單只有儲存資料量龐大是沒有任何用處的,因為資料並不會自

    己進行分析,任何一位企業高階領導者都想知道他們究竟能從大量的資訊中

    得到什麼價值,而新技術的出現雖然比以前蒐集資料容易了許多,許多企業

    仍持續地尋找更好的方式去從他們的資料中取得價值,以利於在市場上與其

    他企業競爭(LaValle, Lesser, Shockley, Hopkins & Kruschwitz, 2011)。

    在這趨勢之下,不同的巨量資料也和各種分析技術發展出許多創新運用,

    對於社會帶來新的變革刺激。例如,在巨量資料的運用上如果結合了地理資

    訊系統(Geographic Information System, 以下簡稱GIS)後,又大大的增加了

    GIS 應用的潛力,位置訊息也是巨量資料分析一個非常重要的分析標的,加

    上行動裝置的普及,除了「人」的位置資訊以外,「物體」的位置也可以利

    用這類的裝置進行大量的蒐集,這些訊息也成為重要的分析資料,用戶的地

    理位置變成非常寶貴的資料(林俊宏 譯,2013)。

    1 資料來源:

    http://www.digitimes.com.tw/tw/dt/n/shwnws.asp?cnlid=13&packageid=8326&id=0000371025_

    K8R1HK2V1NWQAC67YFO4N&cat=。檢閱日期:2014 年 4 月 26 日。

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    18

    Xiang、Schwartz、Jr與Uysal(2015)運用巨量資料中的文字分析(text

    analytics)的方法,分析Expedia.com這個世界上最大的旅遊網上顧客回應的

    資料,先用單字擷取的方法找出80個最常被使用的單字,再用因素分析出包

    括服務態度在內的6個顧客關心的消費面向,最後再用顧客的滿意度作為依變

    數,這6個面向作為自變數,進行簡單回歸分析找出影響旅館顧客滿意度最重

    要的面向為何,這樣的資料分析當然會對管理階層在服務變革的方向上造成

    重大影響,進而影響到商業市場的競爭模式。

    因此,在巨量資料的時代下,企業除了需要因應資料量的迅速成長,從

    龐大且複雜的資料中整理出有效的訊息之外,更重要的是如何透過有系統的

    分析流程與精準快速的分析工具作出最佳因應策略。TechAmerica基金會進一

    步建議巨量資料分析者可依循圖2所示的啟動路徑,推動巨量資料分析

    (TechAmerica Foundation, 2012: 29):

    (一) 定義(define):界定巨量資料帶來的機會,包括關鍵營運與任務挑戰、

    最初導入的單一或一組案例,以及巨量資料可以產生的價值。

    (二) 評估(assess):評估組織現有資料與技術能力,並對照用來滿足界定

    的營運需求與導入案例所需的資料與技術能力。

    (三) 計劃(plan):選擇最適當的部署模式以及導入重點,設計未來的技術

    架構以及確認潛在的政策、需關切的隱私和安全議題。

    (四) 執行(execute):部署現階段巨量資料方案,維持彈性以發揮投資的

    槓桿作用,俾適應接續的營運需求與導入案例。

    (五) 檢視(review):持續地檢視進度,調整原訂的部署計畫,以及測試營

    運程序、政策、治理、隱私以及安全的顧慮。

  • 第二章 文獻回顧

    19

    圖 2:巨量資料分析啟動路徑

    資料來源:TechAmerica Foundation(2012: 29)。

    綜上所述,巨量資料分析的運用已經是組織面對資訊爆炸的時代不可或缺

    的能力,巨量資料時代所發生的資訊通訊科技變革,雲端計算( cloud

    computing)、商業運用(business intelligence)、語意網(sematic web)的發

    展及普適計算(ubiquitous computing)等技術都已經打破時空間的界限(徐子

    沛,2013),未來在巨量資料時代,知識更開放、資訊更流通且權力更分散的

    組織勢必越來越多,社會的主體結構將從結構化轉變為網絡化。在巨量資料時

    代能否妥善運用這些新力量,對組織來說是個非常重要的課題,而組織在資料

    如此多元、複雜且快速的流動化的情形下,又該如何進行巨量資料的分析與管

    理,實際運用上仍需視組織所處的環境與所欲達成的目標而定。

    二、巨量資料對於企業的重要性

    面對巨量資料變革,如何有效擷取、儲存、管理、運用這些巨量資料/

    資訊,已經成為近年來企業尋求市場洞察與競爭力的重要趨勢。巨量資料議

    題在近年開始明顯影響著全球產業的脈動,國際上不論是政府或是企業,亦

    紛紛踏入開放資料與巨量資料領域,挖掘巨量資料時代的龐大商機,國際上

    更是不乏運用巨量資料獲得嶄新商業模式與創新領導地位的成功案例。面對

    全球巨量資料所帶來之商機,近年來我國企業亦開始關注巨量資料管理與分

    析應用機會。林蔚君、詹雅慧(2013)認為帶動產業巨量資料應用有三大新

    趨勢,分別是洞悉、優化、與創新。其中「洞悉」是指企業資訊跨越傳統內

    定義 評估 計劃 執行

    檢視

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    20

    部資料,朝向感應器、社群等外部多元異質資訊來源發展,充分利用多來源

    資料,結合交叉分析將資料淬鍊成具價值的洞察,舉例來說企業可分析顧客於

    社群網站上的評論(如文字、情緒等)與歷史消費紀錄,探索其在不同時間點

    的需求與偏好;「優化」則是指企業可以更即時的掌握並分析資訊,加強對營

    運問題的解析,協助決策者優化決策,例如:企業可透過社群網站與論壇之討

    論內容,即時掌握消費者偏好的轉變,提早佈局產品設計與開發;「創新」是

    指即時地掌握使用者端需求,包括個人及群體行為、喜好、互動方式,結合多

    元資料與分析,創造新價值。例如John Deere農機具公司,透過分析耕作歷史

    與即時資料,協助農民優化耕作的創新服務模式。過去企業主要仰賴在結構化

    資料的收集與儲存;然而隨著社群媒體及網際網路的發展,非結構性的資料越

    來越重要,這些資料的分析會提供企業新資訊,並維持企業的競爭優勢。

    Manyika等人(2011)認為巨量資料對於企業的貢獻主要有以下幾點:

    (一) 增加決策透明(transparency creation)

    在組織中各部門藉由資料的共享與整合,可縮短產品上市時間和提高產

    品品質,企業組織對於非結構化資料能夠進行更有效的處理,也因此能夠累

    積許多結構化與非結構化的資料,對於組織來說,更多的資料能夠進行知識

    的分享與再造,也因為資訊的流通與共享,讓組織內部的決策更為透明、更

    加合理。

    (二) 績效改善(performance improvement)

    巨量資料可提供更精確、詳細的即時績效資料,管理者可利用這些資料

    進行更進一步的內容分析、統計分析與非結構化資料的語意判斷等,協助管

    理者找到績效不佳的根本原因,並加以改善以尋求更佳的績效表現。

    (三) 市場區隔(population segmentation)

    在市場區隔方面,巨量資料可根據適合的產品及服務作出明確區隔。此

    種途徑為著名的市場行銷及風險管理的運用,且可運用在其他領域,許多公

    司也開始運用巨量資料的分析技術進行市場區隔的部署,企業可以利用「微

    市場區隔法(Micro-segmentation)」行銷策略進一步區隔市場,區隔愈精準、

    獨特,企業便愈能透過適當的行銷策略吸引顧客注意。因為巨量資料分析包

    含的資料可能是顧客使用的抱怨、投訴案件或是網路上心得等非結構化的資

  • 第二章 文獻回顧

    21

    料,而這些顧客主動進行的心得回饋變成企業在界定市場取向時的非常重要

    的根據,根據這些非結構化資料的內容分析,可以較有信心的進行市場區隔

    的決策。

    (四) 決策支援(decision making support)

    企業利用所蒐集到的結構化與非結構化的資料,可以幫助決策者擬定較

    佳的決策,並且有效降低風險及提供新洞見(insights),精確的分析可大幅

    提升決策,將決策風險降至最低,且找出潛在有價值的洞見。企業可使用演

    算法找出最佳化的決策過程,例如:運用自動化庫存微調與訂價系統回應具

    有即時性的網路銷售商品。在某些情況下,決策是藉由分析巨量的數據而成,

    例如:許多企業將整體顧客、員工及產品等大量的數據分析納入決策過程,

    以期望能做出更佳的決策結果。

    (五) 新的商業模式、產品與服務(innovative business models, products, and

    services)

    藉由巨量資料分析,幫助企業找到新的創新商業模型或產品服務。巨量

    資料使企業能夠創造新產品和服務,提升現有的產品價值,並創造全新的商

    業模式。製造商藉由現存提供的產品所獲得的數據分析,做為改進下一代產

    品研發的依據及創造新的售後產品服務。此外即時定位數據的出現也創造許

    多以定位為基礎的服務,例如:導航服務的提供即為一例。

    三、企業運用巨量資料分析需具備之能力

    巨量資料對於企業的幫助,在於提供企業更多資訊,例如:使企業洞察

    顧客行為與改善商品與服務的意見;或是協助企業制定策略;利用多渠道行

    銷途徑制定顧客開發途徑、進行廣告整合;也可以用於改善顧客體驗與顧客

    授能(Ramanathan & Sarulatha, 2013)。對於巨量資料技術的運用,比起數據

    的規模,企業更重視分析數據的速度與敏捷性,以在短時間內了解產業現況、

    及時做出回應,甚至是預測未來產業趨勢、商業機會(Bifet, 2013)。

    根據資策會前瞻所與International Data Corporation(IDC)共同執行的2013

    年臺灣巨量資料分析市場調查報告,有4%的企業已經導入巨量資料分析方

  • Web 2.0 時代的民意探勘:政府部門網路輿情分析的概念與實務

    22

    案,6%的企業表示將在未來12個月導入巨量資料分析方案。對於資料量的迅

    速的成長,企業除了需要從龐大且複雜的資料中整理出有效的訊息之外,更

    重要的是如何透過有系統的分析流程與精準快速的分析工具作出最佳因應策

    略。張文貴(2013)提到曾有統計顯示,運用大數據的分析,可讓公司增加

    50%的新客戶並創造出驚人的效益,成功的案例包含:西班牙成衣品牌ZARA

    透過電腦程式分析出顧客的行為模式和消費喜好,做為產品的生產決策,讓

    ZARA創造出銷售的佳績;日本羅森(Lawson)連鎖式便利商店因收集、分

    析社群媒體和網站討論區的大量資料,即時反應顧客意見,營收較為以往成

    長許多;倫敦一間基金公司(Derwent Capital Markets)在2012年5月利用社交

    媒體情緒追蹤系統,比較分析推特(Twitter)上推文的正、負面評價比率,

    預測道瓊指數走勢。王豐勝、黃彥文(2013)提及巨量資料分析平臺在實作

    上能為產業達成幾項重要效益,分述如下:

    (一) 資料前置處理能力

    企業可運用巨量資料的平臺來涵蓋各項現存於資訊系統中可辨識的資料

    蒐集、資料的格式轉換及註解除錯的前置作業,並依據企業各自的需求,分

    析過濾不重要的或不相干的資料,將系統的準確度提升70%至80%以上。此

    外,巨量資料的分析平臺可針對同一資料不同描述進行交叉分析比對,同樣

    能將錯誤修正到七、八成的準確度。

    (二) 數據的抽象瀏覽與存取介面雛形

    可使分析人員在毋需接觸資料的實際來源的狀況下,對企業內部及企業

    外部資料進行資料的儲存與查用。此外,巨量資料分析平臺可依據不同的資

    料介接需求進行各類結構與非結構、分散與集中的資料格式的轉換。

    (三) 分析模組的知識庫

    巨量分析的平臺可提供組織相關的知識庫,使組織成員可查詢儲存於平

    臺內的各項知識庫及分析模組,對於該平臺的內部系統僅需進行些微調整而

    不需做太大的改變,未來企業可運用MapReduce的轉換技術來加速平臺的運

    算能力。

  • 第二章 文獻回顧

    23

    四、企業運用巨量資料的經驗

    在巨量資料的趨勢下,企業積極透過新型智慧運算科技,來優化企業內

    部的運作流程,從而找出更精確的策略方向,以領先市場。目前,巨量資料

    分析科技已廣泛應用於各產業,包括農業、零售、醫療、能源、金融、電信、

    製造、娛樂等產業,不論企業規模大小,皆投入並善用巨量資料來創造新的

    營運模式(劉麗惠,2013)。以下介紹國內外企業應用巨量資料分析的成功案

    例(鐘慧真、梁世英 譯,2013;劉麗惠,2013):

    (一) 日本瑞可利(RECRUIT)成功經驗

    瑞可利運用巨量資料分析的解決方案,如導入Hadoop的平臺建置,來進

    行產品推薦系統的實作,以公司旗下的美食數位電子報〈Hot Pepper〉為例,

    在引進Hadoop之前,由於日誌處理時間的問題,僅能對部分會員發送產品推

    薦郵件,但在引進Hadoop之後,由於Hadoop處理日誌檔資料的高速化特性,

    能發送產品推薦郵件給所有會員。對於瑞可利而言,引進Hadoop的價值在於

    以下三點:

    大幅加速一連串流程的循環(提出假說→製作原始資料→統計→可

    視化分析),並透過反覆地試驗,提高分析的精確度。

    不僅抽樣資料,連長尾(long tail)部分都能進行分析。主要是說明

    驗證的過程中,是以全體資料而非抽樣資料進行分析,此可有效提升

    分析結果的準確度。

    以 Hadoop 來處理一連串的循環流程,可縮短產品的開發週期。

    圖 3:引進巨量資料分析技術後的流程循環

    資料來源:修改自鐘慧真、梁世英 譯(2013:146)。

    提出假說:

    是否能形成

    統計學上的

    邏輯?

    製作原始資料:

    使用 Sqoop 等,將

    整批資料彙入

    Hadoop 環境。

    統計:

    改變各種條件

    計算�