《成为数据分析师:6步练就数据思维》_精选读后感_1300字
《成为数据分析师:6步练就数据思维》_精选读后感1300字
分析是指,使用大量数据、统计和定量分析、解释和预测模型以及基于事实的管理来推动决策过程与实现价值增生。
根据分析的方法和目的,分析可以被划分为描述性分析(descriptive analytics)、预测性分析(predictive analytics)和规范性分析(prescriptive analytics)。描述性分析包括数据收集、整理、制表、制图以及描述正要研究的事物的特征,这类分析以往被称为“报告”。描述性分析可能非常有用,但它不能解释某种结果出现的原因或者未来可能会发生的事情。
预测性分析不仅可以对数据特征和变量(可以假定取值范围的因素)之间的关系进行描述,还可以基于过去的数据预测未来。预测性分析首先会确定变量之间的关联,然后基于这种已知关联预测另一种现象出现的可能性,比如在看到某个广告后,一位消费者可能会去买产品的可能性。虽然预测性分析中的预测是基于变量之间的关联做出的,但这并不代表预测性分析都需要明确因果关系。事实上,准确的预测并不一定需要基于因果关系。
规范性分析是更高层次的分析,如实验设计和优化等。就像医生会在处方上建议患者采取什么行动一样,实验设计试图通过做实验给出某些事情发生的原因。为了能够在因果关系研究中信心饱满地做出推断,研究人员必须妥善处理一个或多个独立的变量,并有效控制其他无关的变量。如果处于实验环境下的测试组的表现大大优于对照组,决策制定者就应该立即推广这种实验环境。
优化是规范性分析采用的一种方法,指试图识别出一个特定变量与另一个变量之间理想的关系水平。例如,我们可能会对识别最有可能让产品实现高收益的价格感兴趣。同样地,优化这种方法能够识别出使零售企业最大限度避免缺货情况的库存水平。
根据分析采用的方法以及收集和分析的数据类型,我们可以将分析分为定性分析(qualitative analysis)和定量分析(quantitative analysis)。定性分析的目的是深入了解某种现象出现的根本原因和诱因。非结构化数据通常是从少数非代表性案例中收集而来,并进行了非统计性的分析。定性分析是分析的最初阶段,它通常是探索性研究的有效工具。定量分析是指通过统计、数学或计算的方法对现象进行系统的实证研究。通常情况下,结构化数据是从大量典型案例中收集而来,并进行统计分析。
为了服务于研究者的不同研究目的,存在以下几种类型的分析:
·统计学:收集、整理、分析、说明和呈现数据的学科。
·预测:根据已有数据,预测一些感兴趣的变量在未来某个特定时间点的情况。
·数据挖掘:通过使用算法和统计技术,自动或半自动地提取大量数据中未知的有趣模式。
·文本挖掘:用类似于数据挖掘的方式从文本中得出模式和趋势的过程。
·优化:在同时满足约束条件的情况下,按照某些标准,利用数学方法来寻找最优的解决方案。
·实验设计:给各组随机分配被试,然后使用测试组和对照组来推导出特定结果中存在的因果关系。
虽然此处给出了一系列常用的分析方法,但在使用的过程中,会不可避免地出现相当大的重叠。例如,回归分析(regression analysis)是预测性分析中最常用的方法,与此同时,它也是统计学、预测和数据挖掘中常用的方法。此外,时间序列分析(time series analysis)是用于分析数据随时间变化的一种具体统计方法,在统计学和预测中也经常被用到。