产业气象站|看完这份详细的学习指南就够了!,零基础入门数据挖掘

AI时代 , 在招聘网站公布的招聘数据中 , “算法”、“机器学习”、“数据挖掘”相关岗位平均招聘薪资高于其余同等学历、工龄要求的技术岗位30%以上甚至更高 , 吸引了一大波人开始学习数据挖掘 。
今天本篇就来说说 , 对于零基础小白 , 应该如何入门数据挖掘 , 并且在文中附上我之前用过的学习资料及书籍 。
数据挖掘的基本概念先来理解一下什么是数据挖掘 。
数据挖掘是从大量的数据中 , 挖掘出未知的且有价值的信息和知识的过程 。 但是不是所有的信息发现都能叫数据挖掘 , 比如通过数据库查找个别记录 , 通过搜索引擎查找特定的网页等 , 这些都属于信息检索 , 数据挖掘是数据库中的知识发现 , 把没加工的数据转换为有用信息的过程 。
产业气象站|看完这份详细的学习指南就够了!,零基础入门数据挖掘
文章图片
机器学习和数据挖掘有什么区别?
机器学习和数据挖掘很类似 , 很多人以为两个说的是一样的东西 , 虽然两者本质上的区别不大 , 但是还是有一些细小的区别:
机器学习更侧重于技术方面和各种算法 , 一般提到机器学习就会想到语音识别 , 图像视频识别 , 机器翻译 , 等等各种模式识别 , 核心就是各种精妙的算法 。
数据挖掘更偏向于“数据”而不是算法 , 它包括了很多数据的前期处理 , 数据的爬取、清洗、整合 , 数据的有效性检测 , 数据可视化(画图)等等 , 最后才是用一些统计的或者机器学习的算法来抽取某些有用的“知识” 。 前期数据处理的工作比较多 。
所以 , 数据挖掘的范畴要更广泛一些
数据挖掘需要哪些技能?我是前几年入坑数据挖掘的 , 纯粹是个人爱好 , 由于有好几年的数据分析基础 , 我上手起来不是特别困难 , 类比数据分析 , 我也给大家梳理一下数据挖掘的一些必备技能
产业气象站|看完这份详细的学习指南就够了!,零基础入门数据挖掘
文章图片
编程语言
数据挖掘和数据分析不一样 , 数据分析可以利用一些现成的分析工具完成 , 但是数据挖掘绝大部分要依赖于编程 , 在数据挖掘领域常用的编程语言有R、Python、C++、java等 , R和python是最受欢迎的两种 , 可能有一部分人之前在接触数据分析的时候学过python , 如果做数据挖掘的话 , 我也推荐python
推荐学习书籍:《Python核心编程(第二版)》 , 《利用Python进行数据分析》
产业气象站|看完这份详细的学习指南就够了!,零基础入门数据挖掘
文章图片
大数据处理框架
做数据挖掘不可避免的要接触大数据 , 目前常用的大数据框架就两个 , Hadoop和Spark , Hadoop的原生开发语言是Java , 资料多 , Spark的原生开发语言是Scala , 不过也有Python的API 。
产业气象站|看完这份详细的学习指南就够了!,零基础入门数据挖掘
文章图片
数据库知识
这个不用多说 , 既然是和数据打交道 , 数据库知识自然少不了 , 常见关系数据库和非关系数据库知识都要掌握 , 如果要处理大数量数据集 , 就得掌握关系型数据库知识 , 比如sql、oracle 。 详细设计的知识点 , 看下图:
产业气象站|看完这份详细的学习指南就够了!,零基础入门数据挖掘
文章图片
推荐学习书籍:《SQL必知必会》、《数据库系统概念》、《Redis设计与实现》、《高性能MySQL(第3版)》(顺序由入门到进阶)
数据结构与算法
精通数据结构和算法对数据挖掘来说相当重要 , 在数据挖掘岗位面试中也是问的比较多的 , 数据结构包括数组 , 链表 , 堆栈 , 队列 , 树 , 哈希表 , 集合等 , 而常见的算法包括排序 , 搜索 , 动态编程 , 递归等
关于数据结构和算法的学习 , 很多人推荐《算法导论》和《数据结构与算法分析(C语言描述)》这两本书 , 这两本我都看过 , 个人觉得《算法导论》太难看完了 , 里面虽然讲的很细致 , 但是晦涩难懂 , 所以我推荐《算法(第4版)》 , 虽然这本书使用Java讲解常见的算法 , 但是基本上没有特别难懂的语法 , 没有Java基础也能轻松看懂