首页>新闻公告
新闻公告
返回列表
什么是CRM数据粒度
CRM系统数据粒度是数据仓库中极其重要的概念,如果粒度设计恰当,则数据仓库其他方面的设计和实现就会比较容易,粒度级别的选择主要是对管理多大数据量和使用数据单元详细程度的一种处理。CRM数据的综合层度不同,其数据量将相差很大,数据越详细,粒度越小,数据量越大,级别就越低;数据综合程度越高,粒度越大,忽略了众多的细节,数据量就越小,级别就越高。
CRM软件数据仓库主要是面向联机分析处理和数据挖掘的,对于两者来说,数据粒度有不同的意义,联机分析处理的一个重要功能就是向最终的用户呈现不同综合程度的数据,第一种粒度就是对数据仓库中的数据综合层度的一个度量。
对于多维查询,使用的是细节数据,而对于综合层度较高的问题,使用细节数据将需要进行运算后回答,这将增加用户的等待时间,而使用综合数据则可以迅速回答这样的问题,因此数据仓库中多重的数据粒度是必不可少的。
CRM数据挖掘常常会使用非常复杂的算法,如果将数据仓库中的巨量数据直接运算,则计算时间和空间复杂度将太高,以至于系统难以承受,因此,进行数据挖掘时,需要对数据仓库中的数据进行抽样。
抽样率是数据粒度的另一种形式,它是一个样本数据库,是通过对数据仓库按照一定的抽样率进行抽样后得到的,一个样本数据库,数据挖掘将在这个样本数据库中进行,这样抽样的思想是合理的,因为进行数据挖掘是为了建立分析模型,反映事物发展规律和趋势。
而抽样带来的模型误差可以在建模之后再次使用源数据对模型进行校验和调整,这样可以大大缩短模型建立的时间,提高模型的精确度。