选择遗忘|程序员不用的R语言,在这些行业却“香”到不行

作为一门编程语言 , R已经演变和发展了20多年 。 开发者的目标非常清晰 , 就是使R成一款简单易用且灵活的 , 能够综合执行统计计算、数据探索和可视化的工具 。
在众多统计软件中 , R能够脱颖而出 , 有几个优势:免费开源、高度通用性、作为动态脚本语言的灵活、代码可重复性 , 除此之外 , R语言还有着丰富的资源和强大的社区 , 来自不同领域的统计学、计量经济学等专业研究者 , 在为R语言做贡献 , 使R有幸将数据科学知识应用于现实世界 , 进一步提高其功能并揭示其潜力 。
当然 , R也存在一些固有缺点 , 例如学习曲线相对比较陡峭、第三方包的质量良莠不齐等 。 但我相信 , 未来的R将不再局限为一种语言 , 而是成为行业间通用的交流货币 。
选择遗忘|程序员不用的R语言,在这些行业却“香”到不行R语言都有哪些行业在用
● 统计分析
在统计分布、假设检验和统计建模里 , R语言是“绝对王者” 。 借助ggplot2画静态图 , plotly画交互图 , 你可以快速创建所需的各种可视化图表 , 方便又直观(跟领导汇报时都多了份底气)
选择遗忘|程序员不用的R语言,在这些行业却“香”到不行● 金融分析
R语言在金融领域的应用主要包括量化策略、投资组合、风险控制、时间序列等 。
以时间序列为例 , 在金融市场里 , 最重要的一个维度就是时间 , 一切交易和价格随着时间一点一滴地被记录下来 。
此外 , R语言被长期应用在量化金融分析领域 , 其专门的量化投资包能够满足投资者量化投资的需要 , 通过数据处理和运算 , 自动判断未来价格走势 , 从而自动择股 。
● 数据挖掘
数据挖掘领域通常面临着关联规则挖掘、聚类、分类这三大问题
很多人对R的第一印象是 , 它只是一个统计计算的一个软件 。 但R有足够的能力以一个快速和简单的方式来实现机器学习算法 , 并通过使用机器学习的方法来构建预测模型的基本能力 。
● 互联网
R语言在互联网的主要应用是推荐系统、消费预测和社交网络等 。
在互联网高速发展的今天 , 通过建立社交网络 , 形成人类行为相关性的分析框架 , 而且对于寻找行为相似性更高的用户进行轨迹预测、商品推荐、链路预测等场景都有着直接或潜在的应用价值 。
● 全球地理科学
国内一些R语言的先进组织 , 已经开发出了地理可视化、天气预测等功能 , 比如这张批量绘制GIS图 , 简直不要太好看:
选择遗忘|程序员不用的R语言,在这些行业却“香”到不行R语言与医学大数据
医学数据分析已经成为当前的热门领域 , 它是医学、统计学和计算机科学等领域的交叉学科 , 而R语言在临床数据统计方面拥有其他语言无法媲美的优势 , 因此受到了广大医学科研人员追捧的“香饽饽” 。
现在的趋势是医疗数据的大量爆发及快速的电子数字化 , 比如基因数据:一次全面的基因测序 , 产生的个人数据则达到 300GB;在生物医药方面 , 功能性磁共振影像的数据量也达到了数万TB级别 , 每一幅影像包含有5万像素值;此外 , 各种健身、健康可穿戴设备的出现 , 使得血压、心率、体重 , 血糖 , 心电图(EKG)等的监测都变为现实和可能 , 信息的获取和分析的速度已经从原来的按“天”计算 , 发展到了按“小时” , 按“秒”计算......
这种数据的扩展速度和覆盖范围是前所未有的 , 数据的来源也纷繁复杂 。 大数据给生物医学领域带来了巨大的影响 , 而生物医学领域的发展离不开数据分析 。 数据的开发、利用、整理和分析为临床实践及科学研究提供了大量有价值的信息 。