excel|再见了繁琐的Excel,掌握数据分析处理技术就靠它了( 二 )


但是如果会用编程 , 就很简单了 。
这个道理好懂 , 但为啥是这个SPL , 编程语言不是很多吗?

结构化数据 , 能很方便地处理结构化数据的程序语言 。 只有SPL和SQL , 还有Python看起来也能对付 。
但还有很多场景下没法用数据库也就没法用SQL 。 程序员也要对文件数据做处理 , 有多个数据库的情况也没法直接跑SQL , 能跑SQL的数据库叫关系数据库 , 还有一堆不是关系数据库的数据库 , 比如MongoDB , 还有jsonxml这些奇怪格式的数据 。 这时候 , 掌握SPL技术就方便多了 , 它不要求有数据库 , 啥场景都能算 。

而且 , SQL在处理很多有过程运算的时候也不方便 , 企业应用中常常会出现我们前在说过的长达几K十几K的SQL 。 而大多数情况用SPL要简单得多 , 开发效率也就高得多 。 有过企业报表开发经验的同学都知道 , 报表没完没了做不完 , 开发成本极高 。 而我们的国产报表工具已经把呈现解决得很好了 , 仍然会出现这种现象 , 主要就是因为用SQL或Java等去实现数据计算的难度太大效率太低 。 会了SPL , 这些事就会轻松多了 。
SQL
程序员世界里的数据分析处理技术 , SQL是首当其冲的 。 数据库可能是存储最多数据的地方 , 而这里的数据主要就是用SQL来耍 , 不会SQL很难在数据圈里混 。
简单SQL长得像英语 , 语法学起来很容易 。 如果已经掌握了结构化数据的概念和运算 , 估计也就看上几小时语法书就能上手写查询了 , 按说不应该是个专业级的技术 。 但是 , 你学会了没地方用啊 , 得有个数据库才能跑SQL , 安装数据库以及把数据倒腾进去来做查询 , 都是很专业的任务 , 会折腾这种事的你已经是个半职业的程序员了 。
倒是可以用SPL来学 , SPL中也实现了常见的SQL , 可以让使用者针对文件执行SQL 。 不过 , 如果学会了SPL , 在处理分析文件数据时也没必要学SQL了 , SPL的运算处理能力要远远强于SQL 。
SQL入门容易 , 但精通很难 , 复杂的SQL始终还是很复杂的 。 三行五行的简单SQL通常只会大量出现在教科书和培训班 , 现实中用于做数据分析的SQL语句 , 说起长度时我们通常是用K(千字符)而不是用行作为单位的 。