指導教授 : 胡凱傑老師 企碩專一 00753003 王家珍

21
資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資 資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資 資資 資資 D D ata Mining Techniques Applied in Airline ata Mining Techniques Applied in Airline Industry to Explore Segmentation of Industry to Explore Segmentation of Repurchase Intentions and the Best Service Repurchase Intentions and the Best Service Items Mix on Custormer Satisfaction Items Mix on Custormer Satisfaction 資資資資 : 資資資資資 資資資00753003 資資資

description

資料探勘技術應用於航空業顧客再搭意願區隔與服務滿意項目組合之分析 D ata Mining Techniques Applied in Airline Industry to Explore Segmentation of Repurchase Intentions and the Best Service Items Mix on Custormer Satisfaction. 指導教授 : 胡凱傑老師 企碩專一 00753003 王家珍. 報告大綱. 觀光研究學報第 12 卷第 2 期 (95 年 ) P 139~154 頁 摘要 緒論 文獻探討 研究方法 - PowerPoint PPT Presentation

Transcript of 指導教授 : 胡凱傑老師 企碩專一 00753003 王家珍

Page 1: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

資料探勘技術應用於航空業顧客再搭意願資料探勘技術應用於航空業顧客再搭意願區隔與服務滿意項目組合之分析區隔與服務滿意項目組合之分析

DData Mining Techniques Applied in Airline Industry ata Mining Techniques Applied in Airline Industry to Explore Segmentation of Repurchase Intentions to Explore Segmentation of Repurchase Intentions

and the Best Service Items Mix on Custormer and the Best Service Items Mix on Custormer SatisfactionSatisfaction

指導教授 : 胡凱傑老師

企碩專一 00753003王家珍

Page 2: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

報告大綱報告大綱觀光研究學報第 12 卷第 2 期 (95 年 ) P139~154 頁

摘要緒論文獻探討研究方法資料分析結果結論與建議

Page 3: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

摘要摘要一、背景 : 高鐵營運後 (96 年 ) ,國內航空業面臨競爭和挑戰 ,在有限旅客巿場,保留顧客與增加再搭意願 是各家航空關注的顧客管理問題。

二、研究範圍: 1 、以國內某航空公司的顧客資料庫為例 2 、 C4.5 決策樹的資料探勘:不同再搭意願旅客之服務 品質區隔,分析不同區隔之服務品質需求與顧客屬性    之差異。 3 、購物籃分析:挖掘區隔的旅客中有高滿意度之 服務品質的組合。

Page 4: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

緒論緒論 主要研究問題: 1 .再搭意願高之旅客,是滿意那些服務項目 ? 2 .旅客滿意那些服務項目,可使滿意度較易提升 ? 決策支援系統 DSS 中的資料探勘方法 (Data Mining , DM)

1. 從大量資料中探勘出有價值但不易被發現的資訊 與知識 (Berry and Linoff, 2004)

2. 以人工智慧方法克服統計方法之線性限制 (Dutta and Shekhar,1988)

3. 最熱門使用的決策樹與購物籃分析:  應用於服務業預測顧客需求與偵測區隔屬性的管理 4. 航空業曾使用於 : 資料探勘飛機維修系統找出機件 問題

Page 5: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

研究概念及目的研究概念及目的

Page 6: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

文獻文獻 ---- 資料探勘資料探勘一、資料探勘:近年來隨著人工智慧和資料庫技術 發展而崛起的新興應用技術 ( 林傑斌 , 劉明德 ,2002) 二、本研究是知識發現的過程 ( knowledge discovery                  in database,KDD) KDD— 以自動或半自動方式將資料中有意義規則 或知識探勘出來 (Fayyad et al.1996; Sriknt        and Agrawal,1996; Berry and Linoff, 2000,2004)

三、 KDD 流程:定義問題資料選取處理    使用探勘技術 解釋探勘結果。

Page 7: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

四、資料探勘的任務及方法:分類、推估、預測、 關聯分組、集群化與描述等六任務,每一項任務可 由不同探勘技術達成,正確選擇方法將使結果更正 確且有益。

Page 8: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

文獻 -- 決策樹1 .分析結果是以樹狀圖呈現,易讓使用者了解。2 .計算過程採遞迴結構方式來表示分類法的規則 ( Moshkovich, Mechitov and Olson, 2002) 。

根節點 (母體 )(root node)

子節點(child node)

路徑代表一個分類規則

葉節點(leaf node)

Page 9: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

C4.5 決策樹:是 Quinlan(1993) 提出

1. 可處理連續與名目型態的獨立變數2. 資料可以是離散或連續值,所分裂枝葉數不受限制的擴展。 3. 主要透過用熵 (entropy) 計算資訊量 (information gain) , 分類屬性選擇標準是獲得量比值 (gain ratio, 或增益 比例 ) 。

熵:「亂度」,表示母體中預測變數分布的分散狀況, 亂度越高 , 越無規則,因此演算的目標是希望降低 資料分類結果的亂度。增益比例 gain ratio =母節點與子節點的亂度差,除以 分割資訊量 (split gain)

當分割資訊量值越大,相對比值越小,分類純度越高。

Page 10: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

購物籃分析購物籃分析一、利用關聯規則 (Association Rule)說明事件之間的相關  性和組合, Agrawal, lmilienski and Swami(1993) 提出 用「 if…then…」表示發掘顧顧客連續滿意了哪些服務項 目,會有較高的整體滿意度。

二、服務項目組合的關聯大小,須由支持度 support 、 信心水準 confidence 、與增益 improvement 來衡量。

Page 11: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

三、支持度三、支持度:符合關聯組合規則的機率有多少:符合關聯組合規則的機率有多少 (A(A 與與 B B 同時發生交集的聯合機率)同時發生交集的聯合機率) 信心水準:因信心水準:因 AA 發生後,使發生後,使 B B 也發生的條件機率有多少;也發生的條件機率有多少; 信心水準越高,越有參考價值信心水準越高,越有參考價值 增益:增益: AA,B,B事件間的相關性機率,比隨機發生的機率大多少事件間的相關性機率,比隨機發生的機率大多少 例例 : : 滿意滿意 AA 項服務的顧客有項服務的顧客有 8080 人人 ,B,B項的顧客項的顧客 100100 人人 ,, 同時滿同時滿意意 AA 和和 BB 項的顧客有項的顧客有 6565 人人滿意滿意 AA 項顧客中有項顧客中有 6565人也滿意人也滿意 B, B, 滿意滿意 BB 項中同時也有項中同時也有 6565人滿意人滿意 AA 支持度支持度 A=65/80= 81.25% B=65/100= 65%A=65/80= 81.25% B=65/100= 65% 信心水準信心水準 = 0.65 ÷ 0.8125 = 80%= 0.65 ÷ 0.8125 = 80%

Page 12: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

四、 Berry and Linoff(2004)產生關聯規則的 4 步驟: 1 .產生單一服務項目的佔有率 ---A 項滿意度發生的機率 2 .產生兩項服務的佔有率,並依最小支持度、最小信心 水準、和增益大於 1 等門檻值,找出兩項服務關聯規則。 3 、產生三項服務的佔有率,並依最小支持度、最小信心水 準、和增益大於 1 等 門檻找出三項服務項目關聯規則。 4 .繼續增加服務項目。

藉由設定最小支持度,最小信心水準的門檻值來修剪關聯規 則,是為了找出高滿意度之服務組合項目。

最小支持度、信心水準之設定無一定標準,而門檻值設定越 高,篩選出來的組合越具有效度,但得到的關聯組合資訊量 也相對較少。

Page 13: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

研究方法研究方法 一、資料來源 : 某航空公司 91~93 年的 1801筆顧客資

料,

27個服務品質滿意項目

Page 14: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

二、探勘流程二、探勘流程

Page 15: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

資料分析結果資料分析結果一、 C4.5 決策樹:設定門檻值 0.1, 錯誤率< 30

的顧客再搭意願之區隔結果

Page 16: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

C4.5C4.5 決策樹區隔人口統計變數及顧客消費特性:決策樹區隔人口統計變數及顧客消費特性: **越常搭機越常搭機 VVSS 居住北部旅客居住北部旅客再搭意願低再搭意願低 **居住外島居住外島 VSVS 搭機頻率較低搭機頻率較低再搭意願高再搭意願高

Page 17: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

二、購物籃分析最佳服務項目組合:發生A 與 B項服務情況下則 C 服務項目也會發生設定最小支持度 70﹪ ,最小信心水準 90﹪

Page 18: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

購物籃分析購物籃分析 ---- 最佳服務項目關聯規則之消費特性與最佳服務項目關聯規則之消費特性與 人口統計變數人口統計變數

Page 19: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

研究個案結論研究個案結論

Page 20: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

後續研究建議後續研究建議研究來源是某國內航空公司的資料庫,分析變數的完整性受限於既有顧客的資料屬性。

可針對內部員工資料進行關聯規則的資料探勘,以提供內外部服務品質之改善。

可針對競爭者—高鐵的服務品質滿意項目進行分析

購物籃分析主要應用技術在零售業 (Wal-Mart尿布與啤酒案例),藉由分析銷售點 (Point-of-Sale)資料,找出商品交叉銷售或推薦組合的規則。除外也可以

應用在其他領域之決策分析:信用卡消費手機使用的附加功能消費者的常用銀行服務社會保險的配套方式醫院病患歷史資料的關聯性

Page 21: 指導教授 :  胡凱傑老師 企碩專一 00753003 王家珍

The End.

Thanks for your listening.