玩转大数据:深入浅出大数据挖掘技术(Apriori算法、Tanagra工具、决策树)
课程背景:“大数据”作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。 “大数据” 其实离我们的生活并不遥远,大到微博的海量用户信息,小到一个小区超市的月销售清单,都蕴含着大量潜在的商业价值。
正是由于数据量的快速增长,并且已经远远超过了人们的数据分析能力。因此,科学、商用等领域都迫切需要智能化、自动化的数据分析工具。在这样的背景下,数据挖掘技术应用而生,使得海量数据的分析变得易如反掌。
适应人群:
数据库工程师、软件开发工程师、市场分析专员
课程目标:
目标一. 可以让学员了解与理解主要的数据挖掘技术。
目标二. 可以让学员迅速掌握各类数据挖掘技术的应用场景。
目标三. 可以让学员迅速掌握常见的数据挖掘工具的使用方法。
目标四. 可以让有一定基础的学员对数据挖掘的代码实现入门。
课程简介:
本课程名为深入浅出数据挖掘技术。所谓“深入”,指得是从数据挖掘的原理与经典算法入手。其一是要了解算法,知道什么场景应当应用什么样的方法;其二是学习算法的经典思想,可以将它应用到其他的实际项目之中;其三是理解算法,让数据挖掘的算法能够应用到您的项目开发之中去。所谓“浅出”,指得是将数据挖掘算法的应用落实到实际的应用中。课程会通过三个不同的方面来讲解算法的应用:一是微软公司的SQL Server与Excel等工具实现的数据挖掘;二是著名开源算法的数据挖掘,如Weka、KNIMA、Tanagra等开源工具;三是利用C#语言做演示来完成数据挖掘算法的实现。
根据实际的引用场景,数据挖掘技术通常分为分类器、关联分析、聚类算法等三大类别。本课程主要介绍这三大算法的经典思想以及部分著名的实现形式,并结合一些商业分析工具、开源工具或编程等方式来讲解具体的应用方法。
**** Hidden Message *****
666666666666666
回的人少,我来小顶一下
页:
[1]