《DataMining在信用卡客戶分群的应用(ppt40)(1).pptx》由会员分享,可在线阅读,更多相关《DataMining在信用卡客戶分群的应用(ppt40)(1).pptx(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Data Mining在信用卡在信用卡客戶分群之應用客戶分群之應用Ben-Ben Bank總裁*台灣區經理*專員*專員*行銷主任*資訊人員*會議進行中會議進行中Data Mining的意義的意義 Data Mining是指找尋隱藏在資料是指找尋隱藏在資料中的訊息,如趨勢中的訊息,如趨勢(Trend)、)、特徵特徵(Pattern)及相關性(及相關性(Relationship)的過程,也就是從大量資料中發掘資的過程,也就是從大量資料中發掘資訊或知識。訊或知識。Data Mining的功能的功能分類(分類(classification)推估(推估(estimation) 預測(預測(predica
2、tion) 關聯分組(關聯分組(affinity grouping) 同質分組(同質分組(clustering)Data Mining的相關技術的相關技術記憶基礎推理法(記憶基礎推理法(Memory-Based easoning)市場購物籃分析(市場購物籃分析(Market Basket Analysis) 決策樹(決策樹(Decision Trees) 基因演算法(基因演算法(Genetic Algorithm) 群集偵測技術(群集偵測技術(Cluster Detection) 連結分析(連結分析(Link Analysis) 線上分析處理(線上分析處理(On-Line Analytic P
3、rocessing ; OLAP)類神經網路(類神經網路(Neural Networks) 區別分析(區別分析(Discriminant Analysis) 羅吉斯迴歸分析(羅吉斯迴歸分析(Logistic Analysis) Data Mining和一般統計分析不同之和一般統計分析不同之處在於處在於Data Mining可以處理多個維可以處理多個維度的大量資料,避免了下面幾點困度的大量資料,避免了下面幾點困難:巨量的紀錄、高維的資料、蒐難:巨量的紀錄、高維的資料、蒐集到的資料僅有一小部分用來分析。集到的資料僅有一小部分用來分析。Data Mining和統計分析比較和統計分析比較研究工具研究工
4、具Data Mining軟體軟體STATISTICA 6.0基於經費的考量,已取得軟體的基於經費的考量,已取得軟體的使用授權。使用授權。研究架構及步驟研究架構及步驟收集相關的文獻探討收集相關的文獻探討整理及清理資料整理及清理資料資料轉檔資料轉檔研究動機與目的研究動機與目的實際資料挖掘工作實際資料挖掘工作(1)(1)集群分析集群分析(2)(2)判別分析判別分析(3)(3)交叉分析交叉分析(4)(4)決策樹分析決策樹分析(5)(5)羅吉斯迴歸分析羅吉斯迴歸分析(6)(6)類神經網路分析類神經網路分析測試與檢核測試與檢核分析結果分析結果Data Mining流程圖流程圖將原來的資料(2,109,51
5、8筆)切割成三大部分:Training Data (1,000,070筆) Testing Data (555,814筆) New Data (553,634筆) Training Data & Testing Data 隨機抽出0.2%樣本Sample Training Data (2054筆)Sample Testing Data (1125筆)S Training Data & S Testing Data 做群集分析產生分群變數依分群變數資料集結果進行判別分析 將分群變數與原來的變數產生合併資料集將合併後的資料集作交叉分析.羅吉斯迴歸.決策樹.將Training Data(1,000,
6、070筆) 及Testing Data(555,814筆)直接做群集分析將Training Data及Testing Data作群集分析產生分群變數資料集 將分群變數的資料集作判別分析將分群變數與原來的變數產生合併資料集將合併後的資料集作交叉分析.羅吉斯回歸.決策樹.Data Mining抽樣流抽樣流程程Data Mining(未經抽樣)未經抽樣)流程流程 Data Mining(未經抽未經抽樣抽樣樣抽樣流程圖流程圖)研究結果研究結果樣本與母體結構比較分群結果判別結果瑕疵戶預測結果分群特性群集結果群集結果型態型態分群變數分群變數p-valuep-value個人平均月收入個人平均月收入0.000
7、.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.000.00個人平均月收入個人平均月收入0.000.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.000.00個人平均月收入個人平均月收入0.000.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.000.00個人平均月收入個人平均月收入0.000.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.000.00Sample
8、Testing DataSample Testing DataCluster Analysis of VariablesCluster Analysis of VariablesTotal Training DataTotal Training DataTotal Testing DataTotal Testing DataSample Training DataSample Training Data第一群第一群百分比百分比第二群第二群百分比百分比第三群第三群百分比百分比Total Training DataTotal Training Data47510147510147.5%47.5%3
9、1051431051431.0%31.0%21445521445521.4%21.4%Total Testing DataTotal Testing Data26455326455347.6%47.6%17232517232531.0%31.0%11893611893621.4%21.4%Sample Training DataSample Training Data1014101449.4%49.4%60260229.3%29.3%43843821.3%21.3%Sample Testing DataSample Testing Data54554548.4%48.4%34334330.5%
10、30.5%23723721.1%21.1% 單位:筆分群個數分群個數判別結果判別結果型態型態判別分群變數判別分群變數p-valuep-value個人平均月收入個人平均月收入0.000.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.000.00個人平均月收入個人平均月收入0.000.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.000.00個人平均月收入個人平均月收入0.000.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.
11、000.00個人平均月收入個人平均月收入0.000.00平均每月信用卡刷卡刷卡金額平均每月信用卡刷卡刷卡金額0.000.00家庭平均月收入家庭平均月收入0.000.00Discriminant Function Analysis of VariablesDiscriminant Function Analysis of VariablesSample Testing DataSample Testing DataTotal Training DataTotal Training DataTotal Testing DataTotal Testing DataSample Training Da
12、taSample Training Data判別結果誤判率判別結果誤判率第一群第一群第二群第二群第三群第三群Total判斷率判斷率Total Training DataTotal Training Data0010.4510.450097.58%97.58%Total Testing DataTotal Testing Data0010.710.70097.56%97.56%Sample Training DataSample Training Data0.010.01000099.80%99.80%Sample Testing DataSample Testing Data000000100
13、%100%瑕疵戶預測P-valueTotal Training Data0.0000Total Testing Data0.0000Sample Training Data0.0000Sample Testing Data0.0000羅吉斯迴歸模型瑕疵戶預測模型結果瑕疵戶預測模型結果 Y Y:是否為瑕疵戶是否為瑕疵戶 X X:是否逾期超過是否逾期超過3030天天 是否有呆帳紀錄是否有呆帳紀錄 是否有借款餘額是否有借款餘額800800萬萬 是否有退票紀錄是否有退票紀錄 是否有拒往紀錄是否有拒往紀錄 是否有他行強制停卡紀是否有他行強制停卡紀錄錄 對不同顧客如何處理對不同顧客如何處理黃金單身漢黃金單
14、身漢個人月收入個人月收入20,000元(元(100)20,00140,000元佔(元佔(73.59)平均月開銷平均月開銷20,00140,000元(元(15.46) 家庭月收入家庭月收入60,000元以下(元以下(100)刷卡金額刷卡金額60,00180,000元(元(28.02)農林漁牧(農林漁牧(16.55)事務職(事務職(12.21)銷售業(銷售業(11.18)一年內有申請的意願一年內有申請的意願 (30.3)信用卡張數信用卡張數23張張 (55.86)很少使用信用卡很少使用信用卡 (18.92)1524歲(歲(34.23)3034歲(歲(15.08)未婚(未婚(49.76)上,中上(上
15、,中上(76.78)銀行殺手銀行殺手個人月收入個人月收入20,000元以下,元以下,其中沒有收入佔(其中沒有收入佔(56.87)平均月開銷平均月開銷20,000元以下(元以下(84.69)家庭月收入家庭月收入60,000元以下(元以下(100) 刷卡金額刷卡金額40,00160,000元(元(41.73)逾期逾期30天(天(10.81) 呆帳紀錄(呆帳紀錄(9.86)借款餘額借款餘額800萬(萬(12.40) 退票紀錄(退票紀錄(10.82)拒往紀錄(拒往紀錄(11.10)強制停卡紀錄(強制停卡紀錄(11.77) 男男女(差異最大)女(差異最大) 血型血型A型(型(30.52)經常使用信用卡經
16、常使用信用卡(34.33)偶爾使用信用卡偶爾使用信用卡(45.98)大學生(大學生(8.18)專科學生(專科學生(8.25)高中職學生(高中職學生(18.99)敗金高手敗金高手個人月收入個人月收入20,000元以下(元以下(100)其中沒有收入佔(其中沒有收入佔(63.05)平均月開銷平均月開銷10,00120,000元(元(33.91)家庭月收入家庭月收入60,000元以下(元以下(97.23)刷卡金額刷卡金額60,00180,000元(元(49.28)3549歲(歲(32.21)已婚(已婚(23.73)中(中(46.33)中下(中下(24.78)下(下(9.61)一年內有申請的意願(一年內
17、有申請的意願(31.36)信用卡張數信用卡張數34張(張(14.21)很少使用信用卡(很少使用信用卡(20.82)農林漁牧(農林漁牧(19.79)家庭主婦(家庭主婦(14.78) 事務職(事務職(14.75)策略策略黃金單身漢黃金單身漢 (高利潤 + 經濟能力較好)刺激顧客增加刷卡次數。刺激顧客增加刷卡次數。結合百貨公司、大型量販店、或飯店等等,促使其消費便利增加消費次數。對於不常外出購物者寄予消費指南及較高檔的商品型錄,來刺激消費、增加刷卡次數。策略策略銀行殺手銀行殺手(風險變數高)降低信用額度。降低信用額度。加強控管銀行殺手的消費行為 對舊有之顧客,建議採用降低信用卡額度,並 隨時電話追蹤
18、,確認消費無誤,同時長期觀察, 確認其安全性。策略策略敗金高手敗金高手(高利潤 + 經濟能力偏低)留住目前的客戶,提高顧客忠誠度。留住目前的客戶,提高顧客忠誠度。預留一段時間作為審查,合格者施予同黃金單身漢一樣行銷手法。不合格者,加強其風險的把守,同時降低其信用卡額度。黃金單身漢黃金單身漢高利潤高風險敗金高手敗金高手銀行殺手銀行殺手貢獻貢獻針對銀行目前的顧客,依其族群的不同,針對銀行目前的顧客,依其族群的不同,實施不同的解決方法,達到降低銀行風險實施不同的解決方法,達到降低銀行風險並增加利潤的目的。並增加利潤的目的。對於銀行的新顧客,提供不同的策略,以對於銀行的新顧客,提供不同的策略,以得到銀行的最大利益。得到銀行的最大利益。建立一個判定模型,提供銀行在發卡之前建立一個判定模型,提供銀行在發卡之前的一個審核方針。的一個審核方針。報告完畢Thank you!