希捷|一次性总结:64个数据分析常用术语( 三 )


41、聚类分析(Clustering analysis)
它是将相似的对象聚合在一起 , 每类相似的对象组合成一个聚类(也叫作簇)的过程 。 这种分析方法的目的在于分析数据间的差异和相似性 。
42、对比分析(Comparative analysis)
在非常大的数据集中进行模式匹配时 , 进行一步步的对比和计算过程得到分析结果 。
43、数据分析(Data Analysis)
是指根据分析目的 , 用适当的分析方法及工具 , 对数据进行处理与分析 , 提取有价值的信息 , 形成有效结论的过程 。
44、数据处理(Data Processing)
数据处理是指根据数据分析的目的 , 将收集到的数据进行加工、整理 , 形成适合数据分析的样式 , 它是数据分析前必不可少的阶段 。
45、数据挖掘(Data mining)
数据挖掘是通过使用复杂的模式识别技术 , 从而找到有意义的模式 , 并得出大量数据的见解 。
46、数据清洗(Data cleansing)
对数据进行重新审查和校验的过程 , 目的在于删除重复信息、纠正存在的错误 , 并提供数据一致性 。
47、数据质量(Data Quality)
有关确保数据可靠性和实用价值的过程和技术 。 高质量的数据应该忠实体现其背后的事务进程 , 并能满足在运营、决策、规划中的预期用途 。
48、数据建模(Data modelling)
使用数据建模技术来分析数据对象 , 以此洞悉数据的内在涵义 。
49、数据集(Data set)
大量数据的集合 。
50、判别分析(Discriminant analysis)
将数据分类 , 按不同的分类方式 , 可将数据分配到不同的群组 , 类别或者目录 。 是一种统计分析法 , 可以对数据中某些群组或集群的已知信息进行分析 , 并从中获取分类规则 。
51、探索性分析(Exploratory analysis)
在没有标准的流程或方法的情况下从数据中发掘模式 。 是一种发掘数据和数据集主要特性的一种方法 。
52、机器学习(Machine learning)
人工智能的一部分 , 指的是机器能够从它们所完成的任务中进行自我学习 , 通过长期的累积实现自我改进 。
53、网络分析(Network analysis)
分析网络或图论中节点间的关系 , 即分析网络中节点间的连接和强度关系 。
54、异常值检测(Outlier detection)
异常值是指严重偏离一个数据集或一个数据组合总平均值的对象 , 该对象与数据集中的其他它相去甚远 , 因此 , 异常值的出现意味着系统发生问题 , 需要对此另加分析 。
55、模式识别(Pattern Recognition)
通过算法来识别数据中的模式 , 并对同一数据源中的新数据作出预测
56、预测分析(Predictive analysis)
大数据分析方法中最有价值的一种分析方法 , 这种方法有助于预测个人未来(近期)的行为 , 例如某人很可能会买某些商品 , 可能会访问某些网站 , 做某些事情或者产生某种行为 。 通过使用各种不同的数据集 , 例如历史数据 , 事务数据 , 社交数据 , 或者客户的个人信息数据 , 来识别风险和机遇 。
57、回归分析(Regression analysis)
确定两个变量间的依赖关系 。 这种方法假设两个变量之间存在单向的因果关系(译者注:自变量 , 因变量 , 二者不可互换) 。
58、路径分析(Routing analysis)
针对某种运输方法通过使用多种不同的变量分析从而找到一条最优路径 , 以达到降低燃料费用 , 提高效率的目的 。
59、情感分析(Sentiment Analysis)
通过算法分析出人们是如何看待某些话题 。
60、SQL
在关系型数据库中 , 用于检索数据的一种编程语言 。
61、时序分析(Time series analysis)
分析在重复测量时间里获得的定义良好的数据 。 分析的数据必须是良好定义的 , 并且要取自相同时间间隔的连续时间点 。
62、文本挖掘(Text Mining)
对包含自然语言的数据的分析 。 对源数据中词语和短语进行统计计算 , 以便用数学术语表达文本结构 , 之后用传统数据挖掘技术分析文本结构 。
63、可视化(Visualization)
只有正确的可视化 , 原始数据才可被投入使用 。 这里的“可视化”并非普通的图型或饼图 , 可视化指是的复杂的图表 , 图表中包含大量的数据信息 , 但可以被很容易地理解和阅读 。
64、仪表板(Dashboard)
使用算法分析数据 , 并将结果用图表方式显示于仪表板中 。
【希捷|一次性总结:64个数据分析常用术语】以上 。
"