固網(wǎng)漏話用戶數(shù)據(jù)分析論文
時間:2022-03-27 04:07:45
導語:固網(wǎng)漏話用戶數(shù)據(jù)分析論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1數(shù)據(jù)挖掘和知識獲取
數(shù)據(jù)挖掘是在數(shù)據(jù)庫中進行知識發(fā)現(xiàn)的重要方法,是從大量的表面數(shù)據(jù)中提取隱藏在其中的知識的過程。近年來,該技術發(fā)展迅速,已應用到各個領域。本文主要介紹固話漏話用戶數(shù)據(jù)挖掘和分析。
2數(shù)據(jù)挖掘技術應用于電信用戶數(shù)據(jù)研究
2.1固網(wǎng)用戶數(shù)據(jù)的組成和結構
對于企業(yè)來說,大量的用戶數(shù)據(jù)不僅有利于客戶關系管理(CRM),同時也是獲得用戶知識的源泉。從用戶知識發(fā)現(xiàn)的過程中可以看到,用戶數(shù)據(jù)的質量會對知識發(fā)現(xiàn)的結果產(chǎn)生直接的影響,所以用戶數(shù)據(jù)準備也是一項很重要的步驟。從商業(yè)系統(tǒng)中提取出高質量的用戶數(shù)據(jù)就成為一項最主要的工作。固網(wǎng)企業(yè)的用戶數(shù)據(jù)包括用戶基本信息、用戶賬單信息以及客服信息。數(shù)據(jù)倉庫就是根據(jù)這種方式來組織的。
2.2知識發(fā)現(xiàn)的方法和過程
用戶知識發(fā)現(xiàn)概括如下:根據(jù)提出的商業(yè)目標,分析大量的用戶數(shù)據(jù),找出隱藏的和未知的規(guī)律或者豐富已知的規(guī)律,進而提出模型;最后要將數(shù)據(jù)挖掘和分析的結果轉化成有商業(yè)意義的方法,然后采取進一步的行動。用戶知識發(fā)現(xiàn)必須遵循以下幾個步驟:商業(yè)理解,數(shù)據(jù)理解,數(shù)據(jù)準備,分類模型,評估應用。
2.3數(shù)據(jù)挖掘建立用戶分類模型
近年來,“以客戶為中心”的電信市場開始強調為不同用戶提供個性化服務,其前提條件就是用戶分類。這也說明了過去的消費行為也預示了未來的消費傾向。
(1)商業(yè)理解
對用戶的理解不僅是理解電信市場的開始,也是理解客戶關系管理的開始。在電信企業(yè)中對用戶的理解包括:用戶種類,不同類中用戶的本質屬性區(qū)別,用戶偏好,不同類別之間的用戶如何通信等。
(2)用戶數(shù)據(jù)準備
對用戶分類的研究主要是從用戶屬性中得到用戶特征和行為習慣。主要數(shù)據(jù)來源于用戶賬單信息,同時也需要從商業(yè)系統(tǒng)中得到一些用戶的基本屬性信息。
(3)用戶分類模型
本文使用聚類分析對用戶進行細分以建立分類模型。聚類分析是把大量數(shù)據(jù)點的集合根據(jù)最大化類內相似性、最小化類間相似性的原則進行聚類或分組,使得每個類中的數(shù)據(jù)之間最大限度地相似、而不同類中的數(shù)據(jù)之間最大限度地不同。
3固網(wǎng)漏話用戶數(shù)據(jù)分析
3.1關于固網(wǎng)漏話用戶數(shù)據(jù)分析的商業(yè)理解
通過各種渠道調查,對固網(wǎng)漏話用戶數(shù)據(jù)分析的目標可以概括為以下幾點:
(1)對用戶通話次數(shù)、時間段等分析,找出特征,以此來尋找目標用戶;
(2)對用戶開通漏話保護業(yè)務前后的ARPU值分析比較,分析收益的對比;
(3)對目標用戶數(shù)據(jù)分析,從用戶分類的角度來管理,設計針對性的服務,提升用戶滿意度。
3.2系統(tǒng)用戶數(shù)據(jù)準備
數(shù)據(jù)準備的過程:明確目標;制定計劃;分析變量的獲?。粩?shù)據(jù)收集和獲??;數(shù)據(jù)集成。根據(jù)當前客戶關系管理基本狀況和數(shù)據(jù)挖掘的目的,涉及到的人口屬性變量有:性別、年齡、住址、用戶職業(yè)、婚否、學歷、薪資等。用戶分類結束之后,再使用描述變量來進行分析說明。本文選用某市電信公司運營支持系統(tǒng)和經(jīng)營分析系統(tǒng)的數(shù)據(jù),從中選取了基本客戶基本信息表、客戶詳細話表、賬單及繳費信息表、產(chǎn)品信息表、業(yè)務使用清單等原始數(shù)據(jù)。數(shù)據(jù)挖掘工具選擇SPSSClementine。在使用該工具進行挖掘之前,需要對數(shù)據(jù)進行清洗:
(1)刪掉不滿足要求的數(shù)據(jù):選擇普通的用戶;選擇狀態(tài)正常的用戶;選擇入網(wǎng)時間較長的用戶,使數(shù)據(jù)有完整的用戶周期;
(2)去掉異常數(shù)據(jù):比如用于測試的號碼;
(3)去掉極端值:不具備普遍性的極值容易產(chǎn)生噪聲。
3.3固網(wǎng)漏話用戶數(shù)據(jù)分析結果
考慮到不同分類建立的有效性和簡便性,以及固話用戶和數(shù)據(jù)源的特點,本文采用常見的K-means算法,其高可靠性、高精準性以及低復雜度使其成為主流的聚類算法。本文選用SPSSClementine作為數(shù)據(jù)挖掘工具進行K-means聚類分析。獲取原始數(shù)據(jù)并進行預處理之后,選擇參與聚類的細分變量,輸入簇的個數(shù)k,選擇k=7,然后點擊“聚類”按鈕,使用K-means算法對固網(wǎng)漏話用戶數(shù)據(jù)進行聚類。經(jīng)過正常值選擇、極值處理等一系列的數(shù)據(jù)清洗工作,最后用于研究的記錄有251284條。
3.4分析結果和解釋
93%的遇忙話務都出現(xiàn)在8∶00~18∶00的工作時段,這說明該時段遇忙話務較多,話務量流失嚴重,特別需要遇忙話務的解決方法。而這一時間段遇忙話務量最多的就是政企用戶,這些話務量流失對政企用戶將造成巨大的損失:30000政企用戶一個月遇忙話務損失達到260萬次,本網(wǎng)超過120萬次,每個月預計損失20萬;以電信中等發(fā)達省份為例:符合條件的政企高端用戶約為60萬;每年度損失的潛在業(yè)務收入為50000萬。經(jīng)過分析,得到該市各地區(qū)已開通和未開通漏話保護業(yè)務的用戶分布,如圖4所示。C區(qū)屬于政務新區(qū),未開通漏話業(yè)務的用戶較多,而F區(qū)屬于工業(yè)園區(qū),企業(yè)較多,很多用戶已開通漏話保護業(yè)務,但是還有大量用戶未開通該業(yè)務,所以C區(qū)和F區(qū)應該作為該業(yè)務的重點推廣地區(qū)。綜上分析,固網(wǎng)漏話業(yè)務是一個非常有潛力的業(yè)務,解決漏話問題是提高用戶滿意度和忠誠度的重要途徑。根據(jù)上文的分析,在8∶00~18∶00時間段,用戶遇忙話務量非常多,在這段時間內,企業(yè)需要更多的漏話接入服務器,而在其他時間段可以減少接入服務器以節(jié)約成本。而在不同的地區(qū),用戶數(shù)量和精準用戶的數(shù)量也不同,應該選擇精準用戶較為集中的地區(qū)優(yōu)先推廣漏話保護業(yè)務。由于精準高端用戶帶來的收益遠遠超過普通用戶,所以要對經(jīng)過篩選的精準用戶采取針對性措施,比如在C區(qū)和F區(qū)大力宣傳,以各種形式讓精準客戶看到該業(yè)務帶來的收益,還可以電話推廣為精準用戶提供信息。
4結論
本文將聚類挖掘方法應用到固網(wǎng)漏話用戶數(shù)據(jù)分析中,采用SPSSClementine工具進行數(shù)據(jù)挖掘。漏話保護系統(tǒng)主要針對政企高端用戶提出,主要目的是為了提高通話接通率,以提高政企用戶的效益,達到用戶和運營商的共贏。而對用戶數(shù)據(jù)的分析,是為了運營商可以更好地服務于政企客戶,為企業(yè)帶來更多的利益,從根本上改善固網(wǎng)漏話問題。
作者:孫駿單位:南京郵電大學