数据挖掘“三点式”手册

数据挖掘是高层次的商业智能应用,不是一拍脑子就能上的项目。企业至少应该弄清楚以下三点:起点、难点、重点。

     一、起点:建立数据仓库

     企业需要具备什么信息技术基础才能应用数据挖掘技术?较为理想的起点就是建立一个数据仓库。这个数据仓库里面应保存着所有客户的数据,并且还应有相应的市场竞争对手的相关数据。数据挖掘的数据应该来自于数据仓库。所用的数据库可以是各种市场上的数据库:IBM、Oracle、Sybase、NCR等等。

     在数据挖掘中有一句至理名言是"垃圾进来,垃圾出去",指的是进来的数据质量不佳,最后的结果一定不理想。数据的质量一方面靠供应商提供的模型来保障,另一方面靠企业自身。如果给出的最初数据不对,模型再好,最后做出的预测也肯定是错的。

     企业级数据仓库的建立在国内刚刚起步,主要集中在IT基础建设比较完善的金融电信行业。对大多数企业来说,一开始就建立整个企业的庞大数据库,显然不太现实。企业可以根据具体的情况,由总部先定下一些规范性文件,授权和指导不同分支机构在此规则之上运作。每个分支机构根据不同的特点分别建立小一点的数据库,但必须互相交流,确保今后可以把不同的数据库整合起来。如此一来,最后企业级数据仓库的建立就水到渠成了。

   

    二、难点:和业务目标紧密结合

     数据挖掘本身并不产生价值,实施了数据挖掘的结果才有价值。如果没有和业务的核心应用紧密相连,促进业务,那么引入数据挖掘就毫无意义。

     怎么让数据挖掘与业务目标真正结合?企业需要思考一系列问题:为什么要上数据挖掘?面临什么紧迫的业务挑战?要解决什么主要的业务问题?业务在哪些方面有改进的余地?现在做得不太好的差距何在?这些差距可以通过发现什么规律得到解决?所需要的信息哪些是可以得到的?在这种思路指导下,才能保证数据挖掘得到最大的投资回报。

     借助数据挖掘实现业务目标,确定可量化的指标也是很有必要的。要明确系统建立后,能达到什么效益,清楚地定出各个阶段不同的KPI(核心绩效指标)来衡量项目是否成功。当达到一个指标时,会激励大家向下一个阶段努力,帮助推进项目的整体进程。

   

     数据挖掘是一套整体解决方案,除了技术因素,咨询服务也是很重要的环节。用户在选型规划的时候,除了选择有成熟的产品、领先技术的厂商外,还要看他是否有丰富的实施经验、行业应用经验、项目管理经验,最好在销售产品的同时也能提供商业咨询服务。厂商的这种知识传递能避免用户少走很多弯路。

     三、重点:培养真正消化技术的实施队伍

     数据挖掘项目组的具体构成有:业务类的市场分析人员;IT的分析人员;数据工程组(负责把数据抽取出来,准备数据,如果有了数据仓库,数据工程组就会相对轻闲一些);业务的用户(他们要参与,要看某个工具是否有用);项目管理员、负责人。

     项目组成员所要具备的技能,分为四个方面:了解数据源,了解数据准备过程,了解算法,了解业务。其中数据准备和了解数据源是相关的,了解业务和算法之间的关系最重要。

   

     显然,数据挖掘项目组的成员来自于各个部门,对人员素质的要求是很高的。他们要能够掌握相应的技术匹配和支持服务,才能最大限度地自主应用数据挖掘于业务中。企业内部必须培养一支专门的、真正消化技术的实施队伍,否则是不可能获得成功的。

     数据挖掘在国外蓬勃发展,很大程度是由于客户成熟度的提高。企业自身将此提高到战略层的高度来重视,而不仅仅是作为IT项目的投入,从业务部门到技术部门都全方位地重视,同时形成相配合相支持的实施队伍。

    随着时代的发展,数据挖掘技术就变得越来越重要。它能够将企业的生产销售情况量化处理,为企业决策提供强有力的依据。目前国内有不少企业已经明白数据挖掘的重要性,但对具体实施过程却不甚明了,由此,掌握数据挖掘“三点式”手册,就变得尤为重要。
数据分析, 数据挖掘


风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部