首页>新闻公告
新闻公告
返回列表
CRM系统数据挖掘的步骤
CRM系统数据挖掘的步骤大致分为:数据准备,建立模型,模式解释和评价,知识表示。数据准备
数据准备又可分为四个子步骤:数据选取、数据集成.数据预处理和数据变换。
1、数据选取:根据用户的需要从原始数据库,数据文件等处抽取相关数据。确定发现任务的操作对象。
2、数据集成:将多种数据源集成到统一的数据仓库中,组合在一起,以便于数据的进一步处理。
3、数据预处理:一般包括消除噪声、推导计算缺值数据、消除重复记录完成数据类型转换。有的数据挖掘算法专门针对离散值,因此,需要将连续值数据转换为离散值的数据以便于符号归纳;而有的算法需要将离散值转换为连续值,这些变换都可以在该阶段完成。
4、数据变换:可以将数据变换或统一成适合挖掘的形式,并可以消减数据维数,从初始特征中找出真正有用的特征以减少数据开采时要考虑的特征或变量的个数。
CRM模型建立
有些人认为数据挖掘即为这一步,这可以说是狭义的数据挖掘。首先要确定任务或目的是什么,如分类、聚类、概念描述、关联规则发现等。任务确定后,要决定使用什么样的挖掘算法。同样的任务可以用不同的算法来实现。
选择算法的时候主要从以下两方面考虑:一是根据数据的特点来选择与之相关的算法;是根据用户或是运行系统的要求来选择相应的算法,有的用户希望获取描述型的容易理解的知识,有的用户希望获取预测准确度尽可能高的预测型知识。选好算法后,运行挖掘算法,得到问题的模型。
模式解释和评价
CRM软件模型建立阶段发掘出的模式,经过用户或机器的评价,可能存在冗余或无关的模式,需要将其剔除;也有可能模式不满足用户要求,则需要整个发掘过程退回到发掘阶段之前,如重新选取数据、采用新的数据变换方法,设定新的数据挖掘参数值,甚至换一种挖掘算法。
知识表示
为了便于用户理解,实用可视化技术蒋发掘的模式,可视化,或将结果转换为用户易懂的另一种形式表示,例如,将分类决策树转化为“if...then...”的规则。