客户挖掘

2024-07-19

客户挖掘(精选十篇)

客户挖掘 篇1

随着4G时代的到来,2G用户势必会慢慢过渡,牵引至3G乃至4G,使2G用户享受更快速更优质的网络服务,同时提升终端的销量及用户的消费能力。在过渡、牵引期间,要使运营商有限的资源有效地配置给有需求及有购买力的客户身上,那么挖掘潜在客户,并匹配适合的定制终端就至关重要。

在这样的背景下,本文设计、建设了潜在客户与定制终端匹配模型,输出潜在客户清单、客户类型和适合的终端价格档次,帮助市场部准确定位潜在终端购买客户,辅助营销人员为用户推荐合适的终端, 进而提升一线营销人员终端营销能力,显著提升内蒙古移动的终端销量。

2 实现方案

2.1 建设思路

从用户购买力及购买需求出发,构建潜在客户与定制终端匹配模型。首先,选定高价值用户、高流量用户和他网3G用户作为首选目标用户, 同时将该部分客户群体纳入重点要发展的3G用户群。对于具有3G网络服务需求但特征比较隐性的用户,进行数据挖掘,挖掘识别出潜在客户行为规则。通过对具有购买力及购买需求用户的不同规则及算法, 最终识别出定制终端潜在客户。对潜在定制终端客户进行客户细分,细分出商务客户类型、娱乐客户类型以及普通客户类型,并对潜在客户适合的定制终端价格档次进行识别,最终建立潜在客户与定制终端的匹配关系。

2.2 建设内容

2.2.1 定制终端潜在客户识别

从客户购买力及营销目的出发, 排除移动员工号码、公免号码、红黑名单、虚号码等特殊号码外,符合以下条件的用户直接纳入定制终端潜在客户范畴。

a) 它网3G潜在用户: 使用它网3G终端的移动用户,且其月使用流量大于70M。

b) 高价值潜在用户 :订购全球通上网套餐、全球通商旅套餐128、158、188、288、388、588、888, 全球通本地套餐128以及ARPU值大于150元的正常通信且未在合约期内的用户。

c) 高流量潜在用户:使用2G终端的移动用户,近3个月月均2G流量大于100M, 用户状态正常且未在合约期内。

识别出该部分潜在客户后,剩余客户采用数据挖掘算法识别。排除终端使用时长大于等于3个月的客户 (认为刚换机的客户不会再次购买移动终端),对目标客户进行数据预处理,数据清理,数据集成和转换,数据归约操作。根据变量信息增益,熵值,相关性取值,最终选择7个变量,构建模型。变量分别是市场类别、近3月月均ARPU、近3月月均DOU、近3月月均交往圈个数、近3月月均本地消费金额、近3月月均参与活动次数。为了模型的总精确性,构建了决策树、逻辑回归、神经网络、决策列表等7种模型,最终选择模型效果最优的决策树算法作为定制终端潜在客户识别算法。该模型算法准确率为72%,命中率为65%。

2.2.2 潜在客户细分

对识别出的潜在客户进行客户细分,根据用户特征将潜在目标客户细分为商务类,娱乐类及普通类型。其中,商务类用户主要指使用了全球通商旅套餐的客户及与商旅客户相似度较高的客户;娱乐类用户主要是订购了彩铃、MM、手机游戏、咪咕高级会员、手机动漫中任意一种,且流量大于5兆的客户;非商务类、娱乐类的其他用户定义为普通类用户。

2.2.3 潜在客户适合的终端价格档次

潜在客户与最近一个月换机客户做相似度计算,取距离相对较小的对端客户所在的终端价格档次作为推荐终端档次,否则用该客户近3月月均ARPU*24(合约期)/1.5作为潜在客户适用终端档次。终端价格档次依次为0-500元、500-800元、800-1500元、1500元 -2000元、2000元 -3000元、3000元以上。

相似度计算:通过目标变量与预测变量的相关性及重要性特征,选取漫游次数、DOU、ARPU、本地通话费、漫游通话费、长途通话费、缴费金额、MOU及交往圈个数这九个指标,标准化后作相似度计算。

2.2.4 模型输出

潜在客户与定制终端匹配模型通过规则判断,并结合决策树C5.0算法识别出潜在客户, 对潜在客户进行规则及相似度计算,细分出客户类型及客户适合的终端价格档次。通过固化模型,扩展输出,方便市场部快速响应市场变化,随时调整营销方案与目标客户群。

3 应用效果

3.1 模型查全率查准率显著优于随机抽取

模型6月份上线后,利用挖掘模型的规则和算法识别6月份的换机客户,共识别出65万潜在客户,与内蒙古全自治区当月的实际换机用户进行比较,得出模型的查准率为11.67%,查全率为29.79%。同时,模拟市场终端用户发展模式,通过随机抽取的方式获取65万用户, 并与当月实际换机用户进行比较,得到随机抽取方式的查准率为2.18%,查全率为5.11%。由此可见,挖掘模型效果要显著优于随机抽取。

3.2 终端销量提升显著

潜在客户与定制终端匹配模型输出清单均为具有购买力及购买需求的用户,因此将模型输出结果推向一线营销,终端销量有了较为明显的提升。7-10月内蒙全省终端裸机及合约机的销量持续上升,其中,合约机销量月均增长43.6%,裸机销量月均增长53.4%。

3.3 终端销售质量提升

潜在客户与定制终端匹配模型输出用户为具有较强烈终端购买欲的用户,因此对这部分用户开展终端营销后,在保证合约机销量稳步增长的情况下,有效控制了合约用户的拆包率,提升了终端销售的质量。从7-10月的数据可以看出,内蒙古全自治区销售的合约终端的拆包率在持续下降,10月份合约终端的拆包率只有6.63%,终端保有的效果有了显著提升。

4 结束语

潜在客户与定制终端匹配分析,充分站在客户角度分析,立足2G用户慢慢牵引,过渡至3G乃至4G时代, 帮助一线营销人员提升终端销量,完成KPI指标这样一个出发点。对于有购买力的高价值、高流量的他网3G用户, 直接纳入营销范畴,慢慢渗透,使其享受更快速、更优质的网络服务。对于有购买需求的用户,通过分类算法,识别出有偏好快速网络需求的用户群体,并进行快速精准营销。把有限资源投入到准确的目标客户身上,使得总体营销成本下降,营销质量提升,达到最佳营销效果。

摘要:本文设计了以客户需求为导向的定制终端潜在客户挖掘模型,不仅要有效地挖掘出有换机需求的潜在客户,同时根据各类用户的特征,为其匹配相应价位的终端,并通过市场部门在第一时间向用户开展主动营销,提升终端销量及用户消费能力。

客户挖掘 篇2

淡季不淡,客户常在,在经济危机和市场萧条的阴霾下,这是所有营销人所一致追求的理想。然而,在各种营销理念、营销手段充斥我们大脑的今天,是否还真正需要大规模的创新,甚至搞几个经济危机营销解决方案?答案自然是否定的,系统论认为,新的事物不过是旧的事务的重新组合而已,那些我们熟识的、高谈阔论过的营销理念和方法,有几件得到系统化的落实,有几件又流于风花雪月的谈资?

传统的营销手段包括广告、公关、活动等大众营销方式,单从维系客户情感和深度挖掘客户价值的角度来讲,数据库营销更为实用,不但成本低廉,而且在响应速度和客户接触点方面,都非传统的营销方式所能及。

数据平台和营销系统的转型

传统的操作型CRM更偏重于客户信息的管理和销售的自动化,而分析型CRM则更偏重于营销过程分析。从经营管理特别是营销的实战角度来讲,营销人员更倾向于采用集客户信息管理、营销成果展示(报表等BI应用)、客户接触点管理、分析建模工具和营销活动管理于一身的整合性平台。

针对如何维系客户情感和深度挖掘客户价值,我们重点关注上述几个方面的应用:

营销成果展示:这相当于商业智能(BI)针对市场营销业务主题的应用,通过固定(动态)报表、仪表盘、即席查询甚至OLAP的方式,快速对过去和现在的营销状况进行查询、汇总和分析,并可以在一定程度上实现探查性的分析。

分析建模工具:分析建模工具集成至营销系统当中,可以极大地丰富市场营销人员的思维空间,而针对客户全生命周期的分析方法,特别是客户(价值)细分、交叉销售、向上销售和客户忠诚度计划,都会为客户的情感维系和价值深度挖掘提供详实和精准的理论基础,并由此指导和精炼后期的营销执行工作。

客户接触点管理:客户接触点的管理触角可以延伸至客户与企业接触的各个层面,从实际的应用角度来讲,则更多地集中在呼叫中心、DM/EDM/SMS的管理平台上。例如在呼叫中心的访员端导入客户信息(核实)、满意度问卷、客户消费记录、客户服务记录、客户流失倾向、电话营销、针对性产品推荐等多种应用。而在网络应用方面,则可以根据客户的属性特征和行为特征,针对性地展示个性化的页面及推荐产品和服务。

营销活动管理:根据客户的细分特点,快速测试、策划、执行和反馈个性化的营销活动。如可以一次性为企业所有的客户建立生日(节日)关怀和优惠活动,系统会在客户的生日或相应的节日(如三八妇女节)发送个性化的邮件或直邮(动态姓名、帐单、促销方案等),并迅速反馈营销结果。

数据分析和深度挖掘的深度应用

根据客户关系管理的理论和数据挖掘的应用,针对客户生命周期的分段方法,可以针对性地采取不同的分析方法和策略(见图一)。

而针对维护客户感情,挖掘客户潜力的分析,则主要体现客户价值细分、交叉销售和向上销售方面。客户价值细分可以通过常用的回归分析、决策树或者聚类实现建模,而交叉销售和向上销售的分析方法则很类似,终极目标都是为了深度挖掘客户的需求和价值(见图二)。

从实战角度来看,维护客户感情,和挖掘客户潜力都需要快速的营销反应能力。所以从这一点来看,我们更倾向于注重营销人快速建模的能力,甚至是不懂统计分析的营销人员都可以通过简单的工具快速建模,以期迅速地响应市场和客户的变化,瞬间联络和安抚客户的情感。同时,我们坚持速度优先的原则,可以把模型的质量放在其次。

另外需要特别关注的一个领域就是网络挖掘在电子商务网站方面的应用,电子商务网站的全程数据管理能力,决定了其与数据分析、挖掘的不解之缘。从维护客户感情和挖掘客户潜力的角度来讲,除了上述一些常见的数据挖掘应用外,网络挖掘还特别关注商品的关联分析和购买行为的序列分析,以便将更具个性化和针对性地内容呈现和推荐给客户。

多渠道营销手段的策划和整合

在维护客户感情和挖掘客户潜力方面,我们更建议营销人采取多重营销手段结合的方式来进行针对性的营销,以期最大限度地扩大营销的势能,提升营销手段的复用效率。

而在营销策略方面,应该更加注重营销对象的抽取、营销时间点的选择(营销提前量的时滞分析)、营销通路的选择和针对性的优惠或刺激政策。

我们举2个简单的例子来说明问题:某汽车厂商,其主力车型为微型运输车,主要客户为需要短途运输的个体户和小型公司,经测试,该车型的刹车片的使用寿命为8万公里,而客户每天的运营里程分布在2D0—400公里。根据简单的调研和计算,该厂商便根据客户的情况,每隔7—13个月向客户发送一次短信,在提醒客户刹车片寿命到期的同时,也提示客户去指定的经销店采购正品。就此一项,就为企业带来了可观的经济效益,同时也进一步联络了客户的情感,增加了交叉销售的机会。而另外一个大型的体检机构,则在自己的短信群发系统当中,为不同体检症状的客户,定制了基于不同触发机制的提示和关怀短信:如明天降温,系统会在今天傍晚群发短信到患有呼吸道疾病的客户处,提示他们添衣保暖。由此,客户情感日益精进,客户的保持率和转推介率一直居高不小,企业通过以小博大,以这种特色的营销方式稳固了市场强者的地位。

结语

顾问式销售的客户需求挖掘分析 篇3

如今, 客户都有自己的判断力, 只要他们愿意, 他们大可对某位销售员说:“我比你更懂你的产品和服务, 你还有什么值得我在你身上浪费时间?”所以, 客户有两个选择:要么越过销售人员, 直接他们想要的东西;要么从销售过程中得到些什么。理想情况下, 他们应该获得专业知识、分析数据以及在其他地方无法得到的专家意见。这就是他们需要专家意见的价值:他们需要的不是唾手可得的产品或专业服务, 而是销售人员的专家意见。客户在乎的是这个。

需求就是机会, 机会就是问题, 问题就是对现状的不满。如果医生不了解病人的需求用药, 是庸医之举;销售顾问不了解客户的需求进行销售, 导致客户异议的产生, 信任感丧失, 徒劳无功, 浪费口舌, 荒废光阴, 完不成销售目标。

所以销售顾问向客户销售产品, 相当于医生给病人治病, 应利用望、闻、问、切等手段来充分、全面了解客户的需求所在、期望所在, 然后才能带给客户一个完美的解决方案。

1 需求的本质

需求就是由客户做出陈述, 来表达一种可以由供应商来满足的关心与欲望。其需求的本质就是客户的期望和现状之间的差距。了解需求就是要了解和发掘客户的现状和他所期望达到的目标, 明确这两者之间的差距。差距就是客户的购买需求。销售顾问所能提供的产品或售后服务可以弥补这个差距, 把产品的各种实际价值提升到客户所期望的高度, 甚至提升到比他的期望更高的水平上。如图1所示。

2 需求的层次

需求就是差距, 就是现实与期望之间的距离。因此, 要想缩小距离就必须了解客户的现状, 分析客户的问题, 解决客户面临的困难, 甚至进一步引导并激发客户的不满意, 事客户感到接受现状的痛苦, 从而使客户长生行动力。最后购买我们的产品。同时, 使客户感到达成期望目标的快乐, 从而强化对未来目标的憧憬, 这就是让客户感到痛苦, 感到达成目标的快乐, 最后产生购买的行动。

总结以上, 需求的层次就是从分析现状出发, 了解不满意的原因, 分析客户面临的困难, 找出存在的问题, 激发客户痛苦, 产生想要的快乐, 满足客户的需要, 达成销售行为。需求的层次见图2。

图2需求的六大层次:不满—困难—问题—痛苦—想要—需要

对于销售顾问来说, 想要提升客户的需求层次, 就必须从客户内部着手, 要就客户工作的特点, 将客户不明确的需求发掘出来。销售顾问要善于把自己的产品或售后服务的有点雨客户的工作结合起来, 让客户认识到使用了这样的产品和售后服务会给自己带来更大的经济效益。

优秀的销售顾问都非常明白客户不同的需求层次对于销售效果的影响, 善于将客户的需求层次提高, 提高客户对于产品需求的迫切程度。在这种情况下, 与客户达成协议是比较容易的, 销售业绩也会随之相应地提高。然而, 有很多客户对自己的需求不清晰, 或者有些成熟的客户已经有了明确的需求, 我们要改变客户的想法比较困难, 这是一个重要的问题。解决这个问题最好的方法就是, 在尊重客户需求的基础上, 引导客户, 教育客户, 帮助客户“洗脑”, 从而改变客户的想法, 接受我们的思想, 建立信任关系, 产生购买的动力。这就是教育客户。所以我们说, 解决问题是所有需求产生的原动力, 教育客户才是引导需求的最高境界。

3 需求开发的方法

一个潜在客户, 当他对自己的产品100%满足时, 并不觉得需要被替换的必要性, 存在需求的第一迹象是什么呢?对现有产品100%的满意变成了99.9%, 再也不说绝对满意了。因此, 需求的第一迹象是有轻微的不满足或不满意。

从很多销售成功案例的研究中, 总结之后, 我们可以说需求一般是这样的:从很小的缺点开始, 自然而然地、逐渐地转变为很清晰的问题、困难和不满, 把不满意转变成痛苦、严重的后果、影响, 最后变为愿望、需要或要行动的企图。

研究客户需求时, 需要寻求一种简单的方法来表示各个阶段的发展。先把需求分为两种类型:

一种是隐含需求, 就是客户对难点、困难、不满的陈述。典型的例子如:“我们现在的系统与输出终端不匹配”, “现在的损耗率太高了点”, “现在的软件的速度太慢了”。

另一种是明确需求, 就是客户第一愿望和需求具体的陈述。典型的例子包括“我们需要更快的系统”, “我们正在寻找更可靠的设备”, 或“我希望有一个运行速度更快的软件”。

通常客户不会说出自己的明确需求, 只有不到4%的客户会说出自己的明确需求, 所以96%的需求模糊, 或者不确定, 甚至说不出, 或者不会说给你听。销售顾问需要具备的能力是激发客户的隐含要需求, 让其说出明确需求。

3.1 开发卖方需求的策略

(1) 用你的提问和需求开发技巧, 来发现客户目前使用产品的一点不满意的地方, 来建立每一个隐含需求, 同时, 使隐含需求引申为更大的不满和痛苦, 从而引导客户说出明确需求。

(2) 通过把几个不同的人或部门比较小的隐含需求集中到一起来增加隐含需求的强度。

(3) 找出客户的“关键按钮”, 即客户最关心、最在乎的是哪一个。

(4) 根据重要性来排序, 然后对每一项深入挖掘客户隐含需求 (暗示需求) 。

(5) 只有让客户认为解决问题的严重性足够大, 客户对策的成本才被认为比较值得, 从而产生购买行为。

3.2 挖掘需求的方式———提问

提问是了解客户需求的一个非常重要甚至是最重要的技能。每一次销售拜访都会有一个目的, 而大多数销售拜访的目的就是为了了解客户的需求 (隐含需求或明确需求) ———让客户签署购买订单, 但是在这之前的很多拜访都是为了不断了解需求。

了解需求的最好方法是提问———通过提问去了解客户需要什么?很多专业的销售人员都会将提问当成最终要的销售技巧, 因为了解客户的需求越多, 特别是隐含需求、痛苦需求, 客户成功购买产品的可能性就会越大。

见到客户, 除了询问客户需要外, 还要问哪些问题?这是很多销售员面临的一个难题。多数销售员见到客户时都能轻松展示自己的产品, 介绍自己的公司, 但是到了向客户提问的时候就变得尴尬, 不知道该问什么问题。那么什么问题可以经常问, 而且客户会比较感兴趣呢?

可以选择以下范围作为提问的内容:

(1) 客户的目标或挑战。

可以问一下客户的目标或遇到的挑战有哪些。例如:询问“贵公司今年的产量的目标是什么?”“贵公司今年的市场占有率有什么目标?部门有哪些目标?”每一个人都会为自己的工作目标而努力, 也都会遇到很多的问题。所以, 这些是客户愿意说的, 因为说的是他自己的事情。

(2) 客户的特殊需求。

可以询问客户个人有哪些特殊的需求。这种特殊的需求有些是问出来的, 也有一些是细心观察出来的。

(3) 客户希望的结果。

客户在购买产品的时候总有一些希望和要求, 或者希望出现某种结果, 销售员可以就此加以探问。

(4) 客户以往的经历。

销售员也可以询问客户以往购买产品的一些经历, 如在使用过程中有哪些优点和不足之处。

(5) 客户个人信息。

销售还可以询问客户个人的某些经历或共同感兴趣的爱好, 这些有助于与客户建立更身侧次的关系。

4 需求开发对销售顾问的素质要求

顾问式销售与传统的推销有很大的区别。首先, 出发点不同:传统的推销是以产品为出发点, 而顾问式销售以了解顾客需求为出发点。第二, 目的不同:传统的推销是以销售产品为目的, 而顾问式销售以满足顾客需求为目的。第三, 工作重点不同, 传统的推销以产品的推介为重点, 而顾问式销售以实现顾客价值为重点。第四, 利益重点不同, 传统的销售以实现企业利益为重点, 顾问式销售以实现企业和顾客利益双赢为目的。

自从互联网诞生, 客户对采购以及销售人员的态度发生了翻天覆地的变化, 销售人员在很多情况下“已经没用了”。

勿容置疑, 在这个变革的时代, 许多公司的一线销售代表们面临着一系列改变:首先, 不再只是推销产品, 还要销售解决问题的策略和方案。其次, 要向更高层的决策者和更广泛层次的用户推销。对于解决方案, 直接购买者和最终使用者非常不同, 比如ERP, SCM、电子商务平台等解决方案, 往往关系到企业客户的所有业务部门。最后, 解决方案的销售者必须成为客户心目中可信赖的业务顾问和咨询者, 而不仅仅是产品技术的提供商。

市场环境的改变, 也造就了企业营销策略的改变。要求销售必须以客户为中心, 为客户提供个性化服务。销售更看重知识, 包括客户的核心业务运营、客户服务模式、客户面临的业务挑战等知识, 包括本公司的产品技术应用知识, 以及对业界相关应用趋势的把握。销售必须以客户业绩为基础, 确立持续而密切的客户关系。

这也就是说, 在企业的营销策略从原来的产品销售向“顾问式销售”转型时, 为了适应新的变化, 销售人员需要从知识、态度和技能等方面全面提升自己的销售能力。

4.1 知识方面的能力

只是方面的能力主要指客户知识、本公司产品技术应用知识、相关行业知识以及对竞争市场的认知, 很多情况下这种知识是个人的。

例如, 某公司的客户经理是做面向银行业的应用销售工作的, 工作已有12年之久, 他说:“做方案销售不仅要深入了解本公司产品的应用, 还要跟踪国外相关产品、技术在本行业的发展及趋势, 收集银行业正在酝酿的业务发展趋势的前瞻性信息。我与银行的主管们交流他们感兴趣的业务问题, 为他们提供价值, 这不仅是建立长期合作关系的基础, 同时也为潜在的项目机会作铺垫。现在的竞争, 关键在于建立客户对你的长期信任, 为客户增值。要让客户认为你是一个资源, 能为他带来信息与价值。”

广泛而深人的专业知识是推进顾问式销售的有力武器, 而每位销售人员因人而异的智慧与执著的学习精神, 是他获得这种武器的保障。

4.2 态度方面的能力

成功首先取决于态度而不是能力。顾问式销售比起过去的产品销售更需要销售人员保持积极的态度, 不断激发自身的热情, 并始终贯彻在与客户的交往中。积极的态度不仅是解决问题的前提, 也是建立长期客户关系的保障。心态积极与否有天性因素, 也受到外在环境和自我激励的影响。一个销售员只有热爱销售工作, 才会带着热情与客户相处, 并积极为客户提供个性化的帮助, 最终让客户获益, 也成就了自己。

4.3 技能方面的能力

毫无疑问, 计划与判断能力、人际沟通技能、资源的协调与整合能力、时间管理与控制能力等, 都是优秀销售人员所必备的。而顾问式的销售人员还必须具备项目管理能力, 能够对项目的总体策划与实施进行管理, 如项目规划、项目融资、进度管理、质量管理、风险识别与规避等。他们还需要具有与各种层面的人员特别是高层主管沟通的技能, 具备对变化的快速感知与应对能力, 以及不断学习的能力。

如:在很多新产品的销售过程中, 为提升新产品的销售情况, 需要有效地证实该产品解决问题或者消除不满意的能力。一个有效的做法是:

(1) 在销售会谈中不要过早地进行能力证实。

在传统的产品销售中可先发现问题然后直接说明产品的优点, 但是在顾问式的销售中发现明确需求非常重要, 在提供解决方案之前, 通过暗示问题发现明确需求。过早证实能力在大规模订单销售中是一个常见的错误, 这样做会使事情变得更糟, 原因是许多客户在没有提纲任何需求信息之前就鼓励你说出了解决方案。如:“来介绍一下你的产品, ”他们会告诉你“我们会决定它是否符合我们的需求。”如果你在销售之处被迫介绍产品的特征和优点, 那么你最好在会议之前与对方公司参加这次会议的人员中比较关键的一个人谈一谈, 以求发现一些需求, 这样在你的介绍中至少可以包括一些利益介绍。

(2) 慎用优点陈述。

因为大部分销售培训用的都是适合传统销售的例子, 所以势必会鼓励你在销售中做优点陈述。销售人员做这种陈述时所用的术语被他们称之为“利益”, 这就使这个问题更难懂了。不要让以前的销售培训误导了你。记住, 在顾问式销售中, 有利的陈述是能表明可以满足明确需求的那些利益。如果没有发现也没有满足那些明确需求, 那就不要自欺欺人地想已经给出了很多利益。

(3) 慎重对待新产品销售。

大部分销售员在销售新产品时都会介绍太多心产品的特征和优点, 不要让这种事情也发生在顾问式销售身上。相反, 对于新产品来说, 要提问的第一个问题应该是“它能解决什么问题?”。当你明白了它能解决的问题之后, 才可以进一步策划问题去发掘明确需求。

从销售过程来看, 完成一个简单或复杂的销售过程, 都会需要不同角色的人物参与, 而且, 每一项交易都有一定的环境。从“知己知彼, 百战不殆”的角度考虑, 销售人员需要进入交易各方的内部世界, 顺利推动和控制整个进程。事实上, 无论是个人、家庭还是公司, 在决定购买某种产品之前都会有一个决策过程, 在这个过程中, 决策者会对一系列影响因素进行综合权衡, 如果销售人员对潜在客户的购买决策过程及影响因素都不了解的话, 又怎么去投其所好引起潜在客户的兴趣与购买欲望呢?因此, 识别潜在客户的购买影响力就成为销售人员必须去挖掘的内容。只有销售人员深入挖掘客户的隐含需求或明确需求。并对客户的需求进行有效研究, 针对性地提出解决方案, 才能真正满足客户的需求, 进而达成交易, 获得销售成功。

参考文献

[1]李刚.顾问式销售与顾客价值的实现[J].科技资讯, 2008, (12) .

[2]齐薇.顾问式销售的实质[J].今日工程机械, 2008, (7) .

[3]丁兴良.顾问决定价值[M].北京:经济管理出版社, 2008.

客户挖掘 篇4

近期,相关行业经理在接受媒体访问时表示:投资必定有输赢,我们出售的就是投资品,银行理财产品市场前一阵保本固定收益好卖,后来结构性产品走红,又到打新股热卖,再兜回固定收益产品,这个市场不仅需要银行、提供产品的金融机构、客户、监管部门共同维护,还需要有经验丰富的财富管理机构为客户出谋划策,才能使之健康有序发展。

浦发财富,以全球化视野,凝聚本土智慧,不仅致力于为高净值客户提供专属的资产配置方案,实现财富的保值增值,同时也拥有完善的产品筛选体系,产品涵盖了保本固定收益类、信托质押类、结构化优先及杠杆类、有限合伙等产品。浦发财富会根据产品收益能力和风险特性进行分析、细分,会根据您的财富目标推荐一组最适合您的产品。浦发希望在为您及其家族财富提供定制化的财富管理服务和管家式的增值服务之时,成就您财富的真正价值!

基于数据挖掘的客户价值评价 篇5

[关键词] 客户价值数据挖掘客户价值评价

目前,客户终生价值应用研究的思路是结合客户生命周期理论,研究如何在客户关系发展不同阶段的不同交易期以最优的客户投入实现预期的客户终生价值,特别是客户生命周期中客户投入的调整。该研究主要用于对价值客户未来购买行为的预测分析以及在此基础上的价值客户管理。帮助企业正确认识客户的总体价值(当前价值和价值潜力)贡献,并进行适当的分类,定性和定量化地辅助企业识别、保留和发展价值客户。这方面的研究成果构成了客户关系管理系统中客户价值管理模块的营销理论基础。

一、客户价值评价的必要性

所谓客户价值就是指这些客户能为企业带来的价值,大小等于企业过去、现在、未来从客户身上获得的收益与吸引、发展、保持客户所需的成本之间的差值。这里收益包括货币和非货币两方面;吸引成本是指企业进行投资以便获取客户并使之满意的支出,包括市场营销、广告以及促销等;发展成本是指企业用于加强或维持现有客户关系的支出,包括研发、生产等;保持成本是指企业为延长客户关系持续的时间,降低客户不满意程度,或重新激活客户所进行的活动支出。

虽然客户能给企业带来收益,但由于客户的社会人口特征、个性特征等各不相同,有的客户大量购买企业产品,还可以为企业推荐新的客户;而有的客户却很少购买企业的产品,还提出许多苛刻的要求,因此,不同类型的客户给企业带来的收益是不同的。同时,对企业而言,每一个客户、每一个客户群的增加都是有代价的,这代价不仅仅表现在营销费用上,更多的表现为客户目标不明确,以及目标太多给企业带来的管理成本增加。因此,综合客户收益和客户拥有代价,可以发现客户选择是企业发展的重要因素,客户不是越多越好,而是越准确越好。

目前,对大多数企业而言,通常是各种类型客户并存,企业内客户的价值呈正态分布。由于企业资源的有限性,不可能对每个客户做到面面俱到,因此,通过对客户价值进行评价,并据此对客户进行分类,从而识别和选择企业的客户,将有助于企业把有限的资源用在为企业带来利润的盈利区客户身上,并放弃那些代价高昂、却不能为企业带来太多收益的不盈利区客户,提高企业资源的利用效率和生产经营的针对性,为企业的目标客户带来超出他们期望的价值和体验,创造持久的客户忠诚和企业利润最大化。

客户价值评价,进而展开客户保持是企业实施客户关系管理的主要目标,它对企业的利润有重要影响。资料表明:客户保持率增加5%,行业平均利润增加幅度在25%至85%之间;保持现有客户比获取新客户的成本能够节约4-6倍。但是客户保持也是需要成本的,在现有的客户群体中,并不是所有的客户都会同企业建立并发展长期合作关系。如果不加区别的开展对所有客户的保持努力,势必会造成客户保持成本的浪费。因此,如果事先对客户价值进行评价,预测其是否具有长期价值,识别出具有较大概率同企业保持客户关系的客户,有区别地开展客户保持努力,就会起到事半功倍的效果,大大节省企业的客户保持成本。

二、基于数据挖掘的客户价值评价方法

数据挖掘就是从海量的原始数据中找出隐含在其中的、事先未知的、但又是潜在有意义的知识和信息,从而利用这些知识指导我们的行动。数据挖掘方法以统计方法与人工智能为基础,大致可分为如下5种分析方法:①统计分析:利用统计分析工具中提供的可视化功能和分析功能来寻找数据间的关系,并构造统计模型和数学模型来解释数据;②聚类分析:聚类分析是把整个数据集划分为不同的子集,使子集内的各样本具有较高的相似性,而不同子集样本之间差别明显;③关联分析:挖掘出隐含在数据之间相互关联;④序列分析:重点在挖掘出数据之间基于时间的前后因果关系;⑤分类分析:通过分析已有的数据,揭示客户或事件的特征与结论之间的关系,并按照影响结论的显著程度将这些特征依次排列,进而用来预测未来的客户或事件。

数据挖掘迎合了企业在营销、销售和服务业务中涉及到的客户其数据量大且细节化、分布广泛等的特点,在通过对海量数据的处理估测客户价值、探知金牌客户特征等方面发挥了相当大的作用。

综合国内外的相关文献资料和企业的实际操作,现有的客户价值评价方法可以归纳为以下几种,数据挖掘技术能够有效地支持相应评价方法的运用。

(1)交易量评价法。交易量评价法是以交易额大小来衡量客户价值,进行客户细分。统计分析将客户的交易额进行汇总,并通过可视化工具将客户细分结果以直观的商业图表、图形和表格形式呈现;也可以构造多维表,并通过细剖、排序、旋转等不同操作得到不同地区、不同职业背景、不同收入状况及其它不同人口统计特征的客户群相应的客户价值,便于更深入地把握企业的细分客户群和相应的价值。

(2)ABC评价法。ABC评价法是目前一种较常用的客户价值评价方法,它根据利润额来区分客户。其原理是客户对企业利润额的分布规律:“企业80%以上的利润来源于20%的客户,70%的客户只提供了不足20%的利润,另有10%的客户不仅不会为企业带来任何利益,甚至会削弱企业的盈利水平”。在ABC评价法里,客户被直观地分为A,B,C三类,企业将优先发展A类客户,保持或缩减B类客户,抛弃C类客户。

聚类分析根据事物的特征对其进行聚类或分类,分析基于“物以类聚,人以群分”的朴素思想,认为同类的客户在行为特征上表现出相当的共性,而不同类的客户在行为特征上必然存在着较大的差异。聚类分析问题的实质是一个全局最优问题,利用聚类分析可以自动将样本集按某些特征划分成几类,无需对客户进行事先的指标体系和权重确定,因此基于聚类分析的ABC客户评价比较简单、快捷。

(3)因素组合评价法。因素组合评价法是根据相关因素组合的结果来评价客户价值的大小和对客户进行分类,考虑的因素通常分两种情形,一是考虑客户对企业产品的需求情况;二是考虑客户规模和信用等级情况。

分类分析通过揭示客户内涵特征和结论(客户价值)之间的关系,并按照影响结论的显著程度将这些内涵依次排列,进而用来预测未来的客户的价值。分类分析首先利用分类算法,根据历史客户数据和价值评价结论建立决策树,可称之为“学习”或“训练”阶段。算法寻找历史数据库中具有最大信息量的属性,构造出树根,再根据属性取值大于(等于)或小于树根的属性值建立树的分支,如此下去,直到所有的属性(用户的所有特征)都被用于树形结构中为止。再根据历史经验将决策树转化为分类规则,即对每一个树叶结点得出分类规则。然后,利用分类规则对将来的新客户进行分类,即根据新客户各特征的取值将其归入最接近的树叶结点,并利用分类规则做出相应判断,即得到新客户的价值,同时调整分类树和分类规则。

(4)客户生命周期价值评价法。对于客户生命周期价值的概念,目前基本的共识是:客户生命周期价值是企业在与客户保持长期交易关系的全过程中从该客户处所获得的全部利益的现值。客户生命周期价值评价法不仅考虑到收益流对企业利润的贡献,而且明确地扣除了企业为取得该收益流所付出的代价,同时,充分预计了客户的非货币价值,并兼顾了客户的未来价值潜力,因此,使用客户生命周期价值评价法能够客观、全面地度量客户对企业的贡献。现在,用客户生命周期价值作为客户价值的评价标准,无论在学术界还是企业界都逐渐得到认可。

但是根据客户生命周期价值公式,计算客户生命周期价值,对客户价值进行评价,需要充分估计和计算生命期内企业与客户相关的所有收益和成本,但这在实际操作中是相当困难的,首先因为对生命期内不同时段发生的客户事件及收益的具体预测较为困难;其次因为客户的非货币价值难以量化;再者是因为客户的生命周期跨度难以预测。因此,在理论上虽然可以通过客户生命周期价值模型对个体客户价值进行计算,从而对客户进行分类,找出高价值客户,但实际上实现相当困难。

为克服客户的未来购买产品和服务事件难以预测的困难,客户事件预测法被提了出来。这种方法的基本原理是:针对每一个客户,预测一系列事件发生的时间,并向每个事件分摊收益和成本,从而为每位客户建立一个详细的利润和费用预测表。预测的精度依赖于事件预测的准确性。事件的预测主要基于以下几方面:①产品是有一定的设计和使用周期的,经过一段时间,产品会有检测、维修、更新换代的需要;②一件产品会与其它产品发生若干联系,因此一件产品或服务的购买会引发其它产品或服务的购买;③客户的购买行为具有一定的购买模式,如购买A产品的客户有相当的可能会同时购买B产品,同时客户的购买行为存在着一定的惯性。

关联分析的作用是在客户有关的数据集中挖掘出满足一定条件的依赖性关系,它展示出数据间未知的依赖关系,并有可能描述成关注数据项间的因果关系。因此,关联规则常被用来分析客户的购买模式,而购买模式的揭示有助于预测客户未来的购买行为。

与关联分析有较大相似的是序列分析。序列分析主要针对两个事件在发生时间上有一段间隔的情况,可用来发现符合一定频率规则的购买模式等。例如,用户在购买了打印机后,每隔一定时间就会购买打印纸,一定时间后又会要求产品维修。所以序列分析有助于预测将来客户的购买产品和服务的要求。

三、结论

数据挖掘能帮助企业管理者从海量数据中统计和多维分析客户购买数据,客户分类,识别客户的购买行为特征,发现客户购买模式和趋势,进而展开客户价值评价,达到提升客户层次、保持有价值客户的目的。利用数据挖掘建立客户关系管理系统将极大地提升企业的竞争优势,提高企业的营销水平。本文的探讨将有利于企业建立有效的客户关系管理系统。

电信客户服务需求的关联规则挖掘 篇6

1. 商业背景

由于受到以互联网为代表的新势力猛烈冲击,过去曾带来高额利润的传统话音业务风光不再;在我国,电信体制改革更为市场带来种种变数,各大运营商经营机制变革加剧,电信业市场竞争日益升级。电信运营商纷纷意识到:在转型的过程中,只有开发出更新鲜更丰富的综合增值服务,才能抓住更广阔的市场与客户群,不断发展,创造价值。

目前,各家运营商的增值业务都名目繁多,如来电显示、呼叫转移、三方通话、国际长途、IP电话、宽带上网等。对于客户来说,如何才能在不浪费的情况下选择到自己最需要的业务,是一个难题。因此很多客户干脆不熟悉的业务都一概拒绝。对于企业来说,是很大的损失。企业需要做到的是:利用多年积累的已有客户的业务数据,从中挖掘出客户可能需要的新业务类型,主动加以推广,以获得更高的利润。

2. 关联规则挖掘

关联规则是当前数据挖掘的主要模式之一,是发现数据库中不同项目之间的联系,这些规则找出事物或人们的行为模式,在电信数据分析中我们可以得到一些具有关联规则的数据,客户数据中可能存在着很多具有内在相关内容的数据。

沃尔玛的“啤酒和尿布”的经典案例不少媒体都曾报道过,“买啤酒时也会买尿布”,这一规律的抽象表示就成了数据挖掘里的关联分析法。例如:客户月使用费用和新业务使用费与年龄之间的关系,费用下降和客户离网之间的关系等.这些内容有些是常识也有些是我们所不知道的知识,这就需要通过对现有的数据进行处理,将知识挖掘出来。

例如:我们从电信客户服务数据中可以发现,一般使用宽带上网业务的客户也都同时开启了IP电话服务业务。挖掘这样的关联规则,可以预测服务需求,更好地确定电信服务的营销策略。

二、关联规则挖掘的定义及Apriori算法

1. 关联规则挖掘

关联规则挖掘是数据挖掘研究的重要内容之一,它是发现大量数据中项集之间有趣的关联或相关联系的技术方法。

Agawal等人在1993年首先提出了从顾客交易数据库中发现客户购买模式的相关性问题,并提出了基于频繁项集的Apriori算法[1]。在现有的关联规则挖掘算法中,广泛采用了“支持度—可信度”(Support-Confident)的评价标准。

2. 经典关联挖掘算法——Apriori算法

关联规则挖掘算法中最著名、最有影响的是Apriori算法。该算法由Agrawal等人在1993年设计出来,该算法是一种挖掘布尔关联规则频繁项集的算法。它通过对数据库D的多趟扫描来发现所有的频繁项目集,在每一趟扫描中只考虑具有同一长度k(即项目集众所含项目的个数)的所有k-项目集。在第一趟扫描中,Apriori算法计算数据库D中所有单个项目的支持度,根据最小支持度minsup获得所有的频繁1-项集L1。在后续的每一趟扫描中,首先以前一趟中所发现的所有频繁项目集为基础,生成所有新的候选项目集,即潜在的频繁项目集,然后扫描数据库D,计算这些候选项目集的支持度,最后根据最小支持度minsup确定候选项目集中哪一些真正成为频繁项目集。重复上述过程直到再也发现不了新的频繁项目集[2]。

三、Apriori算法的不足及改进

1. 传统Apriori算法的不足

传统的Apriori算法可以很好的应用于关联规则挖掘,但是也存在以下两大不足:

1)Apriori算法是一种产生候选集,然后检测其支持度的算法。在形成频繁项集的过程中,Apriori算法需要反复地扫描数据库来计算候选集的支持度,再生成新的长度加的候选集。数据挖掘的数据库数据量一般都较为庞大,并且有些项已经被证明是非频繁的;有些事务中根本不包括要寻找的项目。多次扫描大型数据库增加了算法的I/O负载,使算法消耗的时间大幅增加,算法速度慢,效率低,存在着“浪费”资源的现象。

2)通过分析经典的Apriori算法及改进算法,可以发现,不管哪种算法,都没有解决k-项集数量过多的问题,Apriori逐步迭代产生候选项集规模也可能十分巨大,呈现组合式的增长速度。一个长度为的m频集模式意味着需要生成2m-2个额外的频集并且计算其支持度,生成大量候选集并计算其支持度大大增加了计算机的负载,也消耗了大量的时间。

2. 基于表操作的关联规则挖掘算法

为了提高算法的效率,压缩存储空间,根据电信客户服务需求的数据库的特点,我们提7出基于表操作的关联规则挖掘算法。

(1)压缩数据表

为了解决重复多次扫描数据库的问题,我们采用将数据库表示为0-1矩阵的方法,称这个0-1矩阵为该数据库的压缩数据表。构造压缩数据表的具体方法如下:

例如,我们从电信获得的客户服务原始表格我们有如图1所示的电信客户服务原始表格(部分数据),见图1。

在这张图中,我们可以视客户为事务的集合,业务为项的集合。这样,该数据库我们可以用一个n×m的表格来进行表示。我们可以对这张数据表进行优化我们用0表示客户未使用该项业务,1表示客户已使用该业务。将客户名和业务名均用编号代替。这样,可将该表转换成为一个0-1矩阵,即压缩数据表。如表1,记为表T。

由上面的矩阵可以得出,要计算某一项集的支持度,只要计算该项中为“1”的行的总数。

利用这个方法,可以将一个庞大的数据库转换成为一个存储量很小的0-1矩阵,与反复扫描数据库相比,利用0-1矩阵,算法速度将得到很大提高。

(2)压缩数据表的性质

由压缩数据表的定义及频繁项集的反单调性,我们可得到压缩数据表的如下一些性质:

定理1如果包括T中的某一列所对应的项的k-项集均不为频繁项集,则该列可以从T中删去,而不影响频繁k+1,k+2,…,n项集的挖掘。(证明略)

定理2如果T中的某一行所对应的客户所选择的服务项目所构成的所有k-项集均不为频繁的,则该行可以从T中删去,而不影响频繁k+1,k+2,…,n项集的挖掘。(证明略)

(3)压缩数据表的更新及频繁项集挖掘

应用压缩数据表的上述性质,我们可以在该表上逐次挖掘频繁k-项集(k=1,2,…n),同时逐步删去一些不必要的列和行,以缩小搜索范围,加快挖掘速度,算法的过程如下:

(1)、在产生频繁1-项集的时候我们可以看到,如果不作优化,n项将生成n个频繁1-项集。

在本例中,我们假定minsup=4。我们很容易可以发现,S4项“1”的个数“2”

这样,可以直接生成频繁1-项集{S0},{S1},{S2},{S3},{S5}。

(2)、我们由表T1继续生成候选2-项集。并计算其支持度,如下表所示:

表2候选2-项集及其支持度

频繁2-项集为:{S0,S2},{S0,S3},{S2,S3},{S2,S5},

由T1中的客户C0,C5所对应的行我们发现,表中的C0客户,他的服务集合为{S0,S1,S5},三个服务子集为{S0,S1},{S0,S5},{S1,S5},均不属于频繁2-项集,根据定理2则可将此客户从表中删除。同样地,C5客户,他的服务子集为{S1,S3},也不属于频繁子集,故C5客户也可删除。{S3,S5}

这样,表T1可简化为如下的表:

在上表中我们发现,S1业务所涉及的项集均不为频繁项集,我们将该列删除。这样就完成了对表T1的第二次优化,得到表T2:

(3)、根据表T2,我们可以产生出候选3-项集,并计算其支持度。

频繁3-项集为{S2,S3,S5}。不存在频繁4-项集。

(4)、因此,当minsup=4时,频繁2、3-项集为{S0,S2},{S0,S3},{S2,S3},{S2,S5},{S3,S5},{S2,S3,S5},可生成的关联规则如下,并计算其支持度和可信度。见表6。

一般我们取可信度>60%的规则,故可取规则:

三、算法描述

综上所述,基于表操作的关联规则挖掘算法ARMTO(Associate Rule Mining based on Table Operation)描述如下:

四、实验数据及分析

我们取得了泰州电信客户业务数据信息我们在江苏省泰州市电信客户业务数据信息中,取其中1000条客户记录,对以下部分业务进行关联规则挖掘实验。见表所考虑的电信服务业务如表7所示。

利用ARMTO算法进行管理规则挖掘,设最小支持度minsup=500,最低可信度conf=60%,所得到的规则集合如,见表8所示。

五、小结

本文对电信业务中客户服务的关联规则进行挖掘,对电信客户的服务需求进行预测。针对传统关联规则挖掘中求频繁项集的Apriori算法需要反复扫描庞大的数据库及生成的频繁项集项数过多的不足,根据电信客户服务需求数据库的特点,提出了一种基于表操作的求频繁项集的算法。该算法将电信客户服务需求数据用一个二值的矩阵表示,然后在该矩阵上求出频繁项集,在此过程中可利用Apriori性质删去不必要的行和列,以缩小搜索空间,该算法具有占存储空间小,速度快的优点,可以有效地挖掘电信客户服务需求的关联规则。

参考文献

[1].蒋良孝,蔡之华.基于数据仓库的数据挖掘研究[J].计算技术与自动化,2003,(03).

[56].[2].王媛媛,胡学钢.关联规则挖掘研究[A].全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C],2004.

[79].[3].吴志勇,吴跃数据挖掘在电信业中的应用研究.计算机应用.2005.12(增)

[80].[4].吴海玲.基于关联规则的数据挖掘算法研究.河海大学硕士学位论文.2007.3

[82].[5].蒋良孝,蔡之华.基于数据仓库的数据挖掘研究[J].计算技术与自动化,2003,(03).

[83].[6].施伯乐,汪卫.数据仓库与数据挖掘研究进展[J].计算机应用与软件,2003,(11).

[84].[7].汪光一关联规则挖掘算法的研究北京交通大学硕士学位论文2006.12.

基于数据挖掘的客户价值评价研究 篇7

客户价值就是指客户为企业带来的价值, 它是企业进行客户细分的一个最重要依据, 也是企业制定营销策略的基础和前提。因此, 正确地进行客户价值评价是企业最为关注、最需解决的一个首要问题, 但是, 如何准确地评价客户价值仍是一个在不断探索和有待解决问题。本文提出了一种基于数据挖掘技术的客户价值的综合评价方法, 设计了7项客户价值评价指标, 通过对客户消费行为数据、产品属性数据和客户属性数据等数据的挖掘与分析, 实证评价了客户的当前价值和潜在价值, 为企业提供了一种新的客户价值评价方法。

二、客户价值评价指标体系

1、客户价值的评价方法

完整地说, 客户价值是指客户在其整个客户生命周期内为企业创造的所有价值总和, 即客户终生价值 (CLV) 。对于客户价值可以从多个方面进行考量, 第一, 按表现形式, 客户价值可由赢利价值、能力价值和推荐价值三部分构成。其中, 赢利价值是指客户给企业带来的直接利润, 这是最重要的一项价值, 也是企业最为关心、最容易衡量的价值;能力价值是指客户对改进和完善企业产品和服务性能方面所带来的价值;推荐价值是指客户作为企业的推荐者所带来的价值。第二, 按创造时间, 客户价值由当前价值和潜在价值两部分构成。其中, 当前价值是指客户至今已经给企业创造的价值, 潜在价值是指客户未来可能给企业带来的价值。相对而言, 客户的当前价值的评价相对容易一些, 而客户的潜在价值的评价是一个至今没有解决的问题, 这也就是评价客户价值的难点所在。目前, 对于客户潜在价值只能用预测的方法来估计, 难以得到一个精确的结果。不过, 用预测的客户价值结果作为判别客户价值的大小的方法正被学术界和企业界所接受。为此, 已出现了一些评价模型和评价方法, 如交易量评价法、ABC评价法、因素组合评价法和客户生命周期价值评价法等, 这些方法在评价客户价值起到了一定的作用, 但是均存在一些不足。如交易量评价法只是以交易额大小来衡量客户价值, 没有考虑相同的交易额情况下, 客户的盈利能力往往是不同的;有的方法只是提出了一种理论指导, 而缺乏可操作性, 如客户生命周期价值评价法。

为此, 本文提出了一种通过对客户消费行为数据、产品属性数据和客户属性数据的挖掘与分析, 并设计了相应的评价指标来客观地评价每一个客户的当前价值和潜在价值, 最终确定客户的综合价值。

2、客户价值评价指标体系

为了能全面评价客户价值, 客户价值指标体系从客户当前价值和客户潜在价值两方面进行评价。客户价值评价指标的选取应以简洁性和实用性为准则, 以可操作性和有效性为目标, 为此, 本文共选择了7项评价指标。

(1) 当前价值指标

总金额 (X1) :统计期内客户的消费总金额, 是客户消费能力的一个指标。

总盈利 (X2) :统计期内企业从该客户获得的总盈利, 这是企业最关注的一个指标。

平均交易额 (X3) :统计期内客户每次消费的交易额 (=总金额/购买频率) 。

平均盈利额 (X4) :统计期内客户每次消费给企业创造的盈利 (=总盈利/购买频率) 。

(2) 潜在价值指标

购买频率 (X5) :统计期内客户总的购买次数, 该指标反映的是客户的忠诚度。

平均盈利率 (X6) :统计期内客户总盈利/总金额, 该指标反映的是客户的盈利贡献率。

持续时间 (X7) :统计期内发生第一笔交易至最后一笔交易间的时间长度, 以月为单位, 该指标反映的是客户的客户生命周期。

三、数据挖掘技术

数据挖掘 (Data Mining) 就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。从商业角度出发, 数据挖掘是一种新的商业信息处理技术, 主要是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理, 从中提取辅助商业决策的关键性数据。综合地说, 数据挖掘是按企业既定业务目标, 对大量的企业数据进行探索和分析, 揭示隐藏的、未知的或验证已知的规律性, 并进一步将其模型化的先进有效的方法。

数据挖掘一般要经过6个流程:即商业理解、数据理解、数据准备、建立模型、模型评估和模型发布。商业理解是数据挖掘中最重要的部分, 商业理解包括决定商业目标、形势评估、决定数据挖掘目标, 以及指定一个项目计划。数据理解和数据准备包括从明细交易数据转换到中间数据和建模数据的过程, 明细交易数据指的是与客户发生交易时的最原始的记录, 这类明细数据的数据量巨大、零散, 不能直接用于建模, 需要对明细交易数据进行提练、综合、汇总成中间数据。再根据建模要求, 对中间数据进行分析, 生成模型所需要的相应变量, 完成从中间数据到建模数据的转换, 运用相关软件或程序对建模数据进行统计分析, 最终得出数据挖掘结果, 即模型发布。

本文利用数据挖掘中的一种较常用的方法K-Means聚类分析方法, 通过对客户数据、产品数据和客户交易数据的挖掘与分析处理, 评价客户的当前价值和潜在价值。

四、实例验证

1、实验数据。

本文以某电子企业某年内的客户消费行为数据、产品明细数据和客户数据为样本, 抽取的客户消费行为数据累计有3241条记录, 实际发生交易行为的产品有1184种、涉及的客户有77家。运用K-MEANS聚类分析法, 以客户价值评价指标体系中设计7项评价, 对这77家客户进行当前价值和潜在价值的评价, 并给出一个详细评价过程和评价结果。

2、数据理解与准备。

根据企业提供的客户消费行为数据、产品属性数据和客户属性数据, 提练出满足数据挖掘需要的各项原始数据, 组成一个包含 (序号、销售日期、客户编号、产品编号、数量、单价、金额、产品成本价、盈利) 等数据项的中间数据, 其中, 前7项取自客户消费行为数据, 第8项取自产品明细数据, 第9项是根据按“数量* (单价-产品成本价) ”的公式计算而得, 此项数据表示客户的盈利能力。

然后, 再对中间数据进行按客户进行分类汇总, 生成以客户为单位的客户消费行为数据, 其数据结构包含 (客户编号、购买频率、总金额、总盈利、第一笔交易日期、最后一笔交易日期) 等数据项的数据文件。

3、建立模型数据。

根据7项评价指标的要求, 对上述数据进行分析和计算, 构成一个含有 (客户编号、总金额 (X1) 、总盈利 (X2) 、平均交易额 (X3) 、平均盈利额 (X4) 、购买频率 (X5) 、平均盈利率 (X6) 、持续时间 (X7) ) 等8项数据的模型数据文件。

4、数据预处理。

为了减少不同评价指标单位和纲量的不同, 按公式:Xi= (XiXmin) / (Xmax-Xmin) , (其中:Xmax为该指标中的最大值, Xmin为该指标中的最小值) , 对7项原始指标数据进行标准化处理, 结果存入BX1、BX2、BX3、BX4、BX5、BX6和BX7等7个变量中。

利用SPSS18.0统计分析软件, 分别对反映当前价值的4项评价变量和反映潜在价值的3项评价变量, 进行K-Means聚类分析, 其中, 聚类数设定为5类, 分别表示:价值最高、价值高、价值一般、价值低、价值最低等5个等级。即对客户划分成5×5=25个区域, 如图1所示的客户价值矩阵。

5、实验结果

(1) 当前价值聚类结果, 如表1所示:

(2) 潜在价值聚类结果, 如表2所示

(3) 客户价值的评价最终结果

根据对这77家客户当前价值和潜在价值的评价, 得到如下结果, 如表3所示:

6、结果分析

根据表3的客户价值评价最终结果可知, A001、B004客户是该企业最好的客户, 它们不仅当前价值最高或高, 而且潜在价值也是最高或高;DF11、DF12客户的潜在价值最高, 但它们的当前价值却不太高;W007、W00122客户的当前价值和潜在价值均最低, 故只能排列所有客户中最后。ED11、EF14客户的由于平均盈利率特别高, 故从潜在价值的最低类中单独选出列为一类。

五、结论

本文提出了利用数据挖掘技术, 从客户的当前价值和潜在价值两个方面进行综合评价, 并运用聚类分析法根据客户消费行为数据、产品数据、客户数据等数据进行评价, 阐述了详细的评价过程和方法, 并给出了一个评价结果。实证结果表明, 基于本文的方法对客户价值的评价更为简单实用, 取得了较好的评价效果, 为企业提供了又一种新的客户价值评价方法。

摘要:本文设计了7项客户价值评价指标, 运用数据挖掘中的聚类分析法, 对客户消费行为等数据进行了挖掘和分析, 详细阐述了评价过程, 并给出了一个评价实例。实证表明, 本文提出的评价方法简单实用, 评价结果准确。

关键词:客户价值,客户价值评价,数据挖掘,聚类分析

参考文献

[1]、陈明亮.客户全生命周期利润预测方法的研究[J].科研管理, 2003 (4) :102-109

[2]、李德强, 傅铅生.SMC模型在客户潜在价值发现的应用实证研究[J].价值工程, 2007 (2) :29-33

数据挖掘中客户的特征化及其划分 篇8

关键词:客户关系管理,数据挖掘,聚类分析

一、引言

在激烈的市场竞争中, 客户关系管理 (Customer Relationship Management) 逐渐成为各企业关注的焦点。一个成熟的CRM系统要能够有效地获取客户的各种信息, 识别客户与企业间的关系及所有交互操作, 寻找其中的规律, 为客户提供个性化的服务, 为企业决策提供支持。

在企业与客户的交互操作中, “二八原则”是值得借鉴的, 即2 0%的客户对企业做出8 0%的利润贡献。但究竟谁是那2 0%的客户?又如何确定特定消费群体的消费习惯与消费倾向, 进而推断出相应消费群体或个体下一步的消费行为?这都是企业需要认真研究的问题。

二、客户的特征化及其划分

企业认识客户和潜在客户是在市场保持竞争力的关键。特征分析是了解客户和潜在客户的极好方法, 包括对感兴趣对象范围进行一般特征的度量。一旦知道带来最大利润客户的特征和行为, 就可以直接将其应用到寻找潜在客户之中。有效寻找客户, 认识哪些人群像自己的客户。因此, 在争取客户的活动中, 对感兴趣对象进行特征化及其划分是很有意义的。

对客户的特征化, 顾名思义就是用数据来描述或给出客户 (潜在客户) 特征的活动。特征化可以在数据库 (或数据库的不同部分) 上进行。这些不同部分也称为划分, 通常他们互不包含。

划分分析 (Segmentation Analysis) 通常用于根据利润和市场潜力划分客户。如:零售商按客户在所有零售商店的总体购买行为, 将客户划分为若干描述他们各自购买行为的区域, 这样零售商可以评估哪些客户有最大利润。划分是把数据库分成互不相交部分或分区的活动。一般有两种方法:市场驱动法和数据驱动法。市场驱动法需要决定那些对业务有重要影响的特征, 即需要预先选择一些特征变量 (属性) , 以最终定义得到划分。数据驱动法是利用数据挖掘中的聚类技术或要素分析技术寻找同质群体。

三、数据挖掘的概念

数据挖掘 (Data Mining) 是从大型数据库或数据仓库中提取人们感兴趣的知识, 这些知识是隐含的、事先未知的潜在有用信息。通过数据挖掘提取的知识表示为概念、规则、规律、模式等, 它对企业的趋势预测和行为决策提供支持。

1. 分类分析

分类是指将数据映射到预先定义好的群组或类。分类要求基于数据属性值来定义类别, 通过数据特征来描述类别。根据它与预先定义好的类别相似度, 划分到某一类中去。分类的主要应用是导出数据的分类模型, 然后使用模型预测。

2. 聚类分析

聚类是对抽象样本集合分组的过程。与分类不同之处在于聚类操作要划分的类是事先未知。按照同一类中对象之间较高相似度原则进行划分, 目的是使同一类别个体之间距离尽可能小, 不同类别中个体间距离尽可能大。类的形成是由数据驱动的。

3. 关联规则

关联规则是从大量的数据中挖掘出有价值的描述数据项之间相互关联的知识。关联规则中有两个重要概念:支持度 (Support) 和信任度 (Confidence) 。它们是两个度量有关规则的方法, 描述了被挖掘出规则的有用性和确定性。关联规则挖掘, 希望发现事务数据库中数据项之间的关联, 这些规则往往能反映客户的购买行为模式。

4. 时间序列分析

时间序列分析是通过对过去历史行为的客观记录分析, 揭示其内在的规律, 预测未来行为。它旨在从大量的时间序列中提取人们事先不知道的, 但又是潜在有用的、与时间属性相关的信息和知识。

5. 孤立点分析

数据库中包含那些不符合大多数数据对象所构成规律 (模型) 的数据对象, 称为孤立点。对孤立点挖掘分析可以处理一些特殊事件。

6. 回归分析

在掌握大量观察数据的基础上, 利用数理统计方法, 建立因变量与自变量之间的回归关系函数。回归分析法是定量预测方法之一, 它依据事物内部因素变化的因果关系来预测事物的发展趋势。

四、数据挖掘在C R M中的应用

1. 对客户的相关属性分析

(1) 挖掘客户的特性

DM的第一步就是识别客户群, 挖掘客户特性, 如:了解客户地址、年龄、性别、收入、教育程度、爱好等基本信息, 还有健康、嗜好、配偶、家庭环境等特征信息, 发现其行为规律, 制定吸引客户的策略。

运用分类与聚类方法, 从客户基本库中发现不同的客户群, 用购买模式刻画不同客户群的特征, 针对不同类型的客户, 提供个性化的服务。

(2) 客户行为分析

(1) 客户满意度

客户满意度分析是对其产品或服务的消费经验总体评价, 应用数据挖掘分析方法可以从零散客户反馈的信息中, 分析客户的满意度, 找出客户不满意原因。

(2) 客户忠诚度

客户忠诚度是指客户愿意继续购买该企业产品或服务的倾向。以客户的购买倾向为度, 对客户数据分析, 对高忠诚度的客户继续保持, 对低忠诚度的客户要下功夫将其培养成高忠诚度客户。利用分类、聚类方法将客户分为不同客户群, 并从中确定那2 0%的对企业有8 0%贡献率的最有价值的客户群, 对不同价值贡献率客户采取不同策略和措施。

(3) 客户保持

保持客户的同时不断挖掘潜在客户, 是企业持续发展的重要手段。通过数据挖掘的决策树、神经网络等方法建立预测模型, 识别潜在客户。还可以通过客户盈利能力分析, 帮助企业制定市场策略, 留住有价值的客户, 开发潜在客户。用聚类 (分类) 和关联分析, 发现有价值稳定的客户群, 有价值易流失的客户群, 低价值稳定的客户群和低价值不稳定的客户群, 采取不同的服务 (推销) 和价格策略稳定有价值客户, 转化低价值客户。

(4) 客户跟踪服务

对客户的变动要及时跟踪分析客户变动原因, 防止客户群体的流失, 指导企业合理配置资源, 为客户提供“一对一”个性化服务, 以抓住现有客户并吸引潜在客户。

(5) 客户生命周期价值

基于客户生活方式和购买行为建立客户分群, 计算不同客户分群的生命周期价值, 设计差异化的沟通策略。分析客户不同时期收入、成本、风险, 利用价值理论公式得出客户的价值并提供预测。数据挖掘技术分析和预测不同市场活动情况下客户盈利能力的变化, 帮助企业制定市场策略。

(6) 交叉销售

分析客户消费记录, 发现潜在交叉购买需求, 选择最合适的交叉销售形式。数据挖掘可寻找那些影响客户购买行为的因素, 挖掘隐藏在数据间的表面看似独立事件间的相互关系。如发现“90%的顾客在一次购买活动中购买A商品的同时购买B商品”之类的知识, 展开交叉营销。

(7) 异常分析

异常事件在商业领域中往往具有显著价值, 如:金融欺诈、客户流失等。通过数据挖掘中的偏差分析可以迅速准确地找到异常事件, 制定相应的营销策略。客户流失是异常情况之一, 根据以前的客户流失数据, 包括:客户属性、服务属性、消费属性与流失可能性关联的数学模型, 找出客户流失原因, 建立预测模型推测现有客户的流失情况。

2. 市场分析

预测不同区域消费者对不同产品的消费趋势、季节变化、非规则变化等。采用时序分析方法, 对基于时间序列销售数据进行趋势分析, 预测市场的趋势变化、循环变化、季节性变化、非规则或随机变化。通过对客户关系管理系统分析, 可有效地指导企业在市场、销售、服务等方面将资源分配给有价值的客户, 掌握客户的行为模式, 以应对各种客户行为以及市场变化。

3. 市场划分方法

依据客户消费习惯、收入、偏好、购买频率等因素将客户分类, 使同一细分市场里的客户具有相似偏好和需求。在市场划分前, 先做好如下工作:定义业务目标, 构建市场划分团队, 检查和评估数据需求, 选择恰当的分析层次, 在客户群体中选择好用于分析的样本, 从指定的数据源为样本抽取数据, 清理数据, 然后选择恰当的划分方法。

(1) 预定义划分方法

分析人员根据已有经验分析市场, 分析各个变量和数据, 然后决定划分市场。使用不活跃交易群体, 可能流失客户群体和潜在信用使用群体等进行市场划分。恰当的市场划分取决于商业目标和对客户的了解程度。

(2) 统计划分方法

在客户划分数目太多或对目标群体不是很了解时采用, 这种方法是利用各种数据统计技术划分客户。开展新客户工作或对当前客户所知甚少时, 采用此方法。

(3) 复合划分方法

综合采用预定义划分和统计划分方法, 具体采用何种顺序取决于对客户群体的了解。综合使用两种方法能够敏锐地洞察客户群体。

应用合适的划分方法, 需要看划分效果如何?看这样划分与业务目标是否相关, 是否可理解和容易特征化。这种评估分析可以通过定性和定量两个步骤, 分析的内容主要是判断同一个划分内的客户是否类似 (特征、频度分布) , 每个客户划分是否与其他客户划分都不相同, 每个客户划分是否都有与之对应的面向业务目标与策略。

对潜在客户的挖掘, 往往是在“信息不对称”情况下做出的决策, 这种决策不可避免带有人为因素。因为一般是利用可行 (成熟、廉价、易得) 的技术、手段来减少信息的不确定性与不对称性。这种情况下无法对客户作全面了解和测评, 所得出的结论往往带有个性化因素, 有可能漏掉部分重要客户。

4. 聚类分析以发现客户划分

聚类分析是将数据 (样本) 分割成具有相似特性的群体以实现划分。在聚类分析中, 衡量不同数据在属性上的相似性主要有两种方法:距离与相关系数。数据之间相似性的程度高低, 可以通过数据在空间分布之间的距离衡量其相似性。数据之间的相似性还可以通过在不同变量之间的关联程度来反映。相关系数主要用于衡量不同变量之间的协同程度, 即一个变量变化与另一个变量变化之间的关系。使用距离或相关系数法, 把特征上相似的观察数据值聚在一起, 试图把相异的观察数据分开, 以实现分类划分。聚类分析所形成的结果是一个聚类模型, 分析人员可根据聚类模型, 研究不同类别在各个变量上的特性, 形成一组类别划分规则。

五、结论

客户的特征化及其划分是数据挖掘最直接、最简单而有效的应用。准确掌握顾客的消费偏好改变, 对潜在客户群体建立响应模型, 适时提供客户所需要的服务与信息, 维持与掌握客户的满意度, 有效利用数据挖掘结果做决策。但数据挖掘不是万能的, 在实际应用中还要受到许多条件限制。要有足够合适的数据, 选择恰当的模型和算法, 有决策者的支持等都是有效应用数据挖掘技术的必要条件。

参考文献

[1]Olivia Parr Rud著 朱杨勇等译:数据挖掘实践[M].北京:机械工业出版社, 2003

[2]Jiawei Han, Micheline Kamber著 范明等译:数据挖掘:概念与技术[M].北京:机械工业出版社, 2001

[3]刘友军 吴 建:数据挖掘在CRM中的应用研究[J].商场现代化, 2007 (35) , 37~38

客户挖掘 篇9

当今电信市场竞争激烈,运营商每月客户流失率在1%~3%,挽留将要流失客户,降低客户流失率是近年来热门的研究领域。而数据挖掘技术是解决这一问题的有效途径,本文以业界公认的CRISP-DM(跨行业数据挖掘标准流程)为基础,探讨数据挖掘在电信PAS(无线市话)客户流失预测分析中的应用。

1 商业理解

本次研究将提取电信客户中状态为“用户申请拆机”和“正常”的个人客户和家庭客户为研究对象,建立客户流失预测模型,并使得模型达到一定的预测覆盖率和预测准确率。

2 数据理解

数据建模之前我们需要明确模型的目标变量和输入变量。

2.1 目标变量

目标变量表示了数据挖掘的目标,在客户流失分析中目标变量通常为客户流失状态。依据商业理解中的定义,我们将状态为“用户申请拆机”的用户定义为流失客户,将状态为“正常”的用户定义为未流失客户。

2.2 输入变量

输入变量用于在建模时作为自变量寻找与目标变量之间的关联。我们主要从客户基本信息,客户消费信息,客户通话信息,客户账务信息这几方面选取输入变量。

输入变量的选取至关重要,分析人员需要和业务人员经过多次协商,在业务人员的经验指导下进行选择。经过变量的分解、合并、筛选、处理,我们最终选择了如下列表共43个变量作为模型的输入变量(其中客户编号只作为客户唯一标示,不参与建模)。

3 数据准备

经过了数据理解阶段对目标变量、输入变量的定义后,我们开始从数据源提取数据,数据主要来自电信97系统、电信10000号客服系统、网络中心系统、账务中心系统。

在提取数据之前,我们还需要确定时间窗口和抽样比例。

3.1 时间窗口

我们取数据窗口为五个月、时间间隔为一个月、预报窗口为一个月,如图1所示。选取2008年1月至5月的历史数据作为7月目标客户的训练数据,用这部分数据训练模型,即训练集;选取2008年2月至6月的历史数据作为8月目标客户的测试数据,用这部分数据测试模型,即测试集。

3.2 抽样比例

电信企业每月的客户流失率一般在1%~3%左右,如果直接采用某种模型(比如决策树、人工神经网络等)可能会因为数据概率太小而导致模型的失效,通常将这种情况称为“薄靶”。解决这一问题有多种方法,本文采用“过采样法”把流失客户在总样本中的比例提高到10%。

4 建立模型

本文建模工具采用的是SPSS公司的Clementine工具,该工具使用节点连接的方式建立模型,能让我们直观的了解建模过程,方便控制项目的进度。采用分类回归树(CART)算法和C5.0算法分别建模,并对模型优劣做比较,从中选出适合本次研究的最优模型。建模数据选用7月的训练数据。

设置适当的参数分别建立CART和C5.0预测模型。经过反复试验多次调整模型后得出最佳参数。经过多次建模后得到的最终CART预测模型如图2所示。

从模型结果来看,数据集被ZB-BD13(本地通话相对三月平均下降百分比)分成了两个分支:ZB-BD13>-75.50的有46556用户,其中有96.4%的用户未流失,分离率相当高;而ZB-BD13<=-75.500的有8320用户,这些用户又被QF3(3月平均欠费)分成两个分支,其中QF3>3.500的分支流失用户占到了77.52%。其他分支以此类推。从分支节点也可看出哪些属性是判断流失的重要属性,分支节点依次为:ZB-BD13,QF3,BD-3,ZB-BD13,BD-2。另外,我们也可以把模型切换到“查看器”更直观的观察模型。

同样建立C5.0预测模型,C5.0算法建立的模型与CART算法建立的模型有着显著不同,CART算法的结果是二叉树,而C5.0算法的结果是多叉树,分支比CART模型分支茂密。

5 模型评估与改进

评估模型时采用的数据是8月测试数据集,我们另外建立单独的测试数据源来连接CART模型和C5.0模型。

5.1 评估指标

客户流失预测模型要达到两方面的准确率,一是预测覆盖率,二是预测命中率,如表2所示。其中A代表实际不流失预测也不流失的用户,B代表实际不流失而预测流失的用户,C代表实际流失而预测不流失的用户,D代表实际流失预测也流失的用户。

覆盖率的定义为实际流失预测也流失的用户在所有实际流失用户中的占比,公式为D/(C+D);命中率的定义为实际流失预测也流失的用户在所有预测为流失的用户中的占比,公式为D/(B+D)。

我们用生成的CART模型和C5.0模型连接8月测试数据集,再通过“Analysis分析”节点来计算各模型的覆盖率和准确率。CART模型经过分析后得到的结果如图3所示,行表示实际值,列表示预测值(其中0表示未流失,1表示流失)。

我们看到,8月测试数据集经过CART模型的预测后,总体正确率为93.07%,需要说明的是,因为真正流失比例只占到10%,即使把所有用户都预测为不流失,那么也会有90%的准确率,但这并没有任何意义。实际流失预测也流失的用户数为2149,这是我们重点关注的人数,而预测错误的情况有两种:一种是实际流失预测为不流失的用户,有2851个;另一种是实际不流失而预测为流失的用户,这部分有962个。经过计算得出CART的覆盖率为42.98%,命中率为69.08%。

而C5.0模型经过分析后得到的结果如图4所示。

经过与CART分析的对比我们发现,C5.0实际流失预测不流失的用户数和实际流失预测也流失的用户数都相差不大,但实际不流失预测流失的用户数下降到了648个,计算后得到覆盖率为42.64%,命中率为76.69%,相比CART模型还是有一定提升。

5.2 模型改进

到目前为止,我们评价模型的好坏还仅仅是哪种算法能更好的提升对数据的适合度。而在实际应用中,我们还必须考虑发生各种错误所产生的成本,成本的高低也是判断模型优劣的一个因素。

例如在本例中,从图3、图4的符合矩阵我们看到预测结果可能出现两种错误:一种是实际流失而预测为不流失,称为Ⅰ类错误;另一种是实际不流失而预测为流失,称为Ⅱ类错误。发生Ⅰ类错误时我们未识别出真正要流失的客户,不会对他们及时采取挽留措施,任其流失;发生Ⅱ类错误时我们对原本就不会流失的客户采取挽留措施,浪费人力。很明显,两种错误造成的损失不一样。

为此,我们以C5.0建模为例,在建模过程中加入成本控制中的误分类损失。我们假设未识别出真正流失客户(即Ⅰ类错误)造成的损失将是挽留不流失客户(即Ⅱ类错误)的5倍。如图5所示。

对使用了误分类损失的C5.0重新建模,再次用测试数据集验证模型。经过分析节点得到的结果如图6。结果表明,Ⅰ类错误得到了很好的控制,用户数从之前的2364个下降到1864个,同时Ⅱ类错误数从之前的648个上升到了2487个,这个代价是在所难免,因为要将更多的实际流失用户预测出来,那么势必会增加不流失用户被预测成流失的人数。最后,使用误分类损失的C5.0对比未采用误分类损失的C5.0模型,覆盖率从42.64%上升到了62.72%,而命中率从76.69%下降到了55.77%。那么从成本角度对比,哪种模型更优呢?

为从成本角度验证模型的优劣性,我们将总成本定义如下。假设预测正确时不产生任何成本,而Ⅰ类错误产生的成本是Ⅱ类错误的5倍,总成本的计算公式如下:

总成本=Ⅰ类错误数*5+Ⅱ类错误数*1

由公式我们得到各模型的总成本表3,可见采用误分类损失的C5.0模型总成本最低。因此综合覆盖率、命中率、成本三方面综合考虑,我们认为使用误分类损失的C5.0模型在本次研究中的最佳模型。

6 模型应用

此模型已经在电信得到了一定程度的应用,每月我们通过客户流失预测模型得到可能流失的用户名单,同时得到这些客户的流失概率,这些名单可以用在呼叫中心,通过对客户的电话回访了解客户的需求,提升满意度;也可以用在市场营销部门,对流失客户进一步细分,得到不同客户细分群并分析原因,对不同客户细分群采取有针对性的营销策略。

7 结束语

本文在CRISP-DM方法论的基础上,通过决策树的两种算法,对电信客户流失建立了预测模型,比较分析得到效果好的模型,并加入了成本因素对模型进一步优化。最后实践表明,基于误分类损失的C5.0模型在电信客户流失管理中具有一定的应用价值。

摘要:针对电信客户日益严重地流失问题,通过某电信运营商的历史资料,对电信PAS流失客户的自然属性和行为属性进行研究,利用决策树算法建立了客户流失预测模型。通过对模型进行评估分析,得到预测效果较好的模型,最后加入成本因素,进一步优化了模型。

关键词:数据挖掘,客户流失,决策树,预测模型

参考文献

[1]谢邦昌.数据挖掘Clementine应用实务[M].北京:机械工业出版社,2008.3.

[2]Corinne Baragoin.Mining Your Own Business in Tele-coms Using DB2 Intelligent Miner for Data[J].IBM Red-book Publication,2001.

客户挖掘 篇10

关键词 数据挖掘 客户关系管理 关联算法 粗糙集方法 聚类

中图分类号:TP311.13 文献标识码:A

对于企业而言,“以客户为中心”的最终目的是企业自身利润的最大化。因此,企业还需进一步对真正的客户的价值进行挖掘。客户的价值挖掘工作要求企业通过数据分析,掌握客户的行为规律,运用于企业决策中。随着数据仓库、数据挖掘技术的发展和成熟,客户的价值挖掘工作得到了必要的技术支持。

1数据挖掘技术

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘常用的分析方法包括分类和预测、聚类分析、关联规则、序列模式、孤立点分析等。本文分别从关联算法、粗糙集方法和聚类等角度阐述数据挖掘技术在客户价值管理中的应用。

2数据挖掘技术在客户价值管理中的应用

2.1发现新客户

2.1.1 数据挖掘应用需求

“以客户为中心”的CVM,客户是企业的生命,不断获取新客户是企业生存和发展的必要条件。发展新客户的目的是将潜在的客户转变成消费企业的产品或服务的现实客户。针对不同的消费者需要采用不同的策略才能有效的获取到需要的新客户。另外,客户也分优劣,选择优质客户进行获取是企业获取新客户的先决条件。采用数据挖掘可以辅助新客户开发活动。

2.1.2 Apriori算法

APr1ori算法是最著名的关联算法。此算法利用一种逐层搜索的迭代方法:k项集用于探索(k+1)项集。具体方法是:首先找出频繁1-项集,记为L1;然后利用L1来挖掘L2,即频繁2-项集;不断循环下去直到无法发现更多的频繁K-项集为止。

Apriori算法利用了两个重要性质。

性质1:k维数据项目集x是频繁项集的必要条件是它的所有k-1维子集均是频繁项集。

性质2:若k维数据项目集x的任一k-1维子集不是频繁项集,则x不是频繁项集。

对于新客户的发展而言,得到了新客户的市场反馈并收集之后,就可以使用Apriori算法对客户数据提取特征。

2.2 客户保留

2.2.1 数据挖掘应用需求

随着市场竞争的日益激烈,大部分市场己趋于饱和状态。获得一个新客户的成本越来越高,因此,保留原有客户的价值也显得越来越重要了。对于客户保留,企业可通过数据挖掘对客户数据库中大量的客户信息作针对性研究,根据分析结果制定使潜在离开者留下来计划和方案,改善客户关系,争取保持客户并提高收益。

2.2.2 粗糙集算法

粗糙集是由波兰学者Z.Pawlak在1982年提出的一种研究不精确、不确定性问题的数学工具,其基本思想是,将数据库中的属性划分为条件属性和结论属性,把数据库中的元组根据各个属性不同的属性值分成相应的子集,然后根据条件属性划分的子集和结论属性划分的子集之间的上下近似关系生成判定规则。其中下近似是指所有对象都一定被包含,上近似是指所有对象可能被包含。

设{X1,X2,X3,…}是基于条件属性的划分,{Y1,Y2,Y3,…}是基于结论属性的划分,则有:

定义1:Yj最小包含(下近似)X,是指等价类X,中的所有元素都包含在Yj中;

定义2:Yj最大包含(上近似)X,是指等价类X,中的所有元素可能包含在Yj中。

2.3 客户分类

聚类已经被广泛地应用于许多领域,聚类分析根据在数据中发现的描述对象及其关系的信息,将数据划分成有意义或有用的簇(也可以称为组)。其目标是,簇内的对象之间是相似的(相关的),而不同簇中的对象是不同的(不相关的)。簇内的相似性(同质性)越大,聚类就越好。

K-均值算法是一种迭代算法,也是一种最古老的、最广泛使用的聚类算法。

利用K-均值聚类算法所得到的组,组内成员间的相似程度很高,同时不同组中成员的相异度也很高。给定组K={t1,t2,…,tm},则其均值定义为:

M=(t1+t2+…+tm)/m。

其基本算法如下:

(1)选择K个点作为初始均值,K是用户指定的参数,即所期望簇的个数;

(2)repeat;

(3)将每个点指派到最近的均值,形成K个组;

(4)重新计算每个组的均值;

(5)until均值不发生变化。

3结语

客户关系管理是企业保持市场竞争力的重要手段和不可缺少的重要环节。数据挖掘作为一种先进的数据分析的方法,是实现对客户数据进行深入分析的有效工具。对于管理人员来说,掌握这方面的知识是必要的,可以为公司管理客户提供有价值的信息。

参考文献

[1] 李蕾.数据挖掘技术在客户关系管理中的运用[J].企业活力,2006.03.

[2] 顾桂芳,何有世.数据挖掘在客户关系管理中的应用研究[J].江苏商论,2007.07.

[3] 黄洁.基于数据挖掘技术的客户关系管理:以电信企业为例[A].中国企业运筹学学术交流大会论文集[C],2007.

[4] 庄小将.数据挖掘在客户关系管理中的应用[J].广东财经职业学院学报,2008.02.

上一篇:文学发展要求下一篇:中医药诊疗