怎么学习数据挖掘_如何系统地学习数据挖掘
扫描二维码
随时随地手机看文章
学习数据挖掘,必须明确自己的发展方向和目标。很多人对数据行业里发展方向并不清楚,我们先来说说数据行业的职业发展方向。
数据行业从广义上讲可以分为以下几个职位:
一、数据挖掘工程师数据挖掘工程师多是通过对海量数据进行挖掘,寻找数据的存在模式,从而通过数据挖掘来解决具体问题。其更多是针对某一个具体的问题,是以解决具体问题为导向的。例如:聚类分析,通过对于会员各种人口统计学、行为数据进行分析,对客户进行分类,更好地理解客户,知道公司会员是到底如何?高、中、低低价值的客户构成,既可以后期公司的运营提供指导,提高活动效率,可以指导公司的营销。
做数据挖掘工程, 必须精通数据库。很多时候,你模型的数据预处理,可能完成在数据库里完成,你用到的数据库技巧更高。必须要会成熟的数据挖掘工具、数据挖掘算法,等,当然如果你会一、二款开源软件,并会写一些程序代码那是最好的,大公司都喜欢用开源的软件。
二、数据分析师数据分析师更注意是对数据、数据指标的解读,通过对数据的分析,来解决商业问题。主要有包括:(1)业务监控:诊断当前业务是否正常?是否存在问题?业务发展是否达到预期?如果没有达到预期,问主要问题在哪?是什么原因引起的?(2)建立分析体系:这些数据分析师已经对业务有一定的理解,对业务也相对比较熟悉,更多帮业务方建立一套分析体系,或者更高级是做成数据产品。例如:营销活动。分析师会告诉业务方,在活动前你应该分析哪些数据,从而制定恰当的营销计划。在营销过程中,你应该看哪些数据,从而及时做出营销活动调整。在营销活动,应该如何进行活动效果评估以及行业未来发展的趋势分析。
三、商业分析师。
商业分析师在行业、宏观的层面进行业务分析,预测未来行业的发展,竞争对手的业务构成,帮助公司制定战略发展计划,并及时跟踪、分析市场动态,从而及时对战略进行不断优化。主要技能要求:要熟悉基本的统计分析知识、对于与网站相关的业务还可能要求掌握等网站分析工具等。
四、数据建模师这个职位与数据挖掘工程师还是有本质区别的。数据建模师,更多偏向于中、小数据量,而且其使用更多更多是统计学的方法,数据建模师其实很少会提到算法这个词。但是有时候,这二个模型越来越没有明确的分工,一般来说都会二个职位的人都会去学习对方的知识,所以这二个职位有合并的趋势。
新进入数据行业的同学,可以根据自己的背景背景选择相应的职位,学数据、统计学的朋友更多可以偏向于建模师,而计算机特别是写编程好的同学,可以走数据挖掘工程师,也许适应性更好,但这不是绝对的。
那么如何学习数据挖掘呢?磨刀不误砍柴工。在学习数据挖掘之前应该明白几点:
数据挖掘目前在中国的尚未流行开,犹如屠龙之技。
数据初期的准备通常占整个数据挖掘项目工作量的70%左右。
数据挖掘本身融合了统计学、数据库和机器学习等学科,并不是新的技术。
数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)
数据挖掘适用于传统的BI(报表、OLAP等)无法支持的领域。
数据挖掘项目通常需要重复一些毫无技术含量的工作。
如果你阅读了以上内容觉得可以接受,那么继续往下看。
学习一门技术要和行业靠拢,没有行业背景的技术如空中楼阁。技术尤其是计算机领域的技术发展是宽泛且快速更替的(十年前做网页设计都能成立公司),一般人没有这个精力和时间全方位的掌握所有技术细节。但是技术在结合行业之后就能够独当一面了,一方面有利于抓住用户痛点和刚性需求,另一方面能够累计行业经验,使用互联网思维跨界让你更容易取得成功。不要在学习技术时想要面面俱到,这样会失去你的核心竞争力。
一、目前国内的数据挖掘人员工作领域大致可分为三类。
1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告。
2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析。
3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用。