当前位置首页 > 读后感大全 > 读书笔记> 正文

大数据时代读书笔记(3)篇

2019-05-23 05:39:27 读书笔记
大数据时代
作者:维克托·迈尔-舍恩伯格
"《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据时代的预言家”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。维克托·尔耶·舍恩伯格在本书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。"
大数据时代读书笔记 第(1)篇

物互联靠智能感应落地生根,大数据重建人们认识世界的基础,而人工智能与大数据和智能感应结合,将形成一种全新的能力,这种能力能够渗透到社会生活的每一个角落,影响和改变世界的进程。“大数据时代”,这是一个被信息包围的时代,这是“数字蝶变”时代,在这样的时代下,一切的发展超乎我们的想象,为我们提供了许多便利,但同时也掺杂着隐患。

大数据时代下数据到底有什么样的潜在价值?那些数据的核心是什么?那些数据又存在哪些风险呢......这些是大数据时代下数据的发展延伸出来的。

大变革——生活、工作与思维

不再是随机样本数据,不再是追求精确性,不再是寻找因果关系。一切发生了改变,开始了“样本=总体”庞大的数据资源使得各个领域开始了量化进程。

大数据的价值体现在哪?

大数据的科学价值和社会价值。一方面,对大数据的掌握程度可以转化为经济价值的来源。另一方面,大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。

大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。

大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。

拥抱混杂,寻找窗口

大数据经过三个方面的转变:

第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。

第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。

第三个转变我们不再热衷于寻找因果关系。确定“是什么”而不再是“为什么”

执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。

们能够得到一个事物更完整的概念,我们就能接受模糊和不确定的存在。就像印象派的画风一样,近看画中的每一笔都感觉是混乱的,但是退后一步你就会发现这是一幅伟大的作品,因为你退后一步的时候就能看出画作的整体思路了。

价值——取之不尽,用之不竭

数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。

所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。

为什么企业会把数据看的那么重?那是他们公司数据的核心,从中可以分析出不一样的内容,大部分的信息价值来自于这,即潜在价值。

大数据同时也给我们带来了巨大的风险。它使得目前用以保护隐私的法律手段和核心技术失去了效果。而今天,即使是最无害的数据,只要被数据收集器采集到足够的量,也会暴露出个人身份。匿名化或是单纯隐藏已不再适用。出台的相关隐私政策不过是无规则的马奇诺防线。

当世界由探求因果关系变成挖掘相关关系,我们怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类前行的基石,又取得实际的进步呢?

大数据的不利影响并不是大数据本身的缺陷,而是我们滥用大数据预测所导致的结果。

在这个利用数据做出决定的世界里,人类存在的目的是什么?难道是为了运用直觉和违背事实?

大数据时代读书笔记 第(2)篇

此书的可读性很强,本以为会涉及到好多专业词汇让人望而生畏,结果很幸运,并没有。作者对于观点的阐述很细致,道理深入简出,甚至有点啰嗦之嫌,但对于并没有相关知识基础的人来说,是好事,可以加深印象。

第一部分: 大数据时代处理数据理念上的三大转变:

1.要全体不要抽样,抽样=全体。

2.要效率不要绝对精确,允许结果存在一定偏差。

3.要相关不要因果。

大数据时代带来的变革革命关键点不在于分析数据的机器,而在于数据本身和我们如何运用数据。摒弃以往采取抽样的方式,数据的选取往往带有目的导向性,并遵循由预设的因果关系来验证结论的正确性;在大数据时代,选取全部数据,保留数据的原始广泛性,通过算法计算机程序来推测因果关系,从而由以往数据结论来预测未来,但这里能预测的未来,我个人更倾向于对于无生命体的机器运作的预测,由于机器工作的程序化和规范化,很容易由大数据分析来得出某种情况会对应哪种问题,这样即是高效率和精准性都得到了大幅度的提升。但对于人行为能力的预测分析我是不那么赞同的,毕竟人掺杂着复杂的思考过程,就像头脑风暴,说来就来,说走就走,拉风着呢。

2011年《科学》杂志上的一项研究显示,来自世界上不同文化背景的人们每天、每周的心情都遵循着相似的模式,这项研究建立在两年多来对84个国家240万人的5.09亿条微博的数据分析上,这在以前是完全无法做到的。情绪真的已经被数据化了。书中不止提到人情绪的数据化,基于现在互联网的广泛普及,个人信息被不同程度零星的分布在不同软件或者平台上,大数据工作就类似穿珠引线的一根线,珠子其实早已存在,甚至连预防犯罪都可以做到,可能以后的人的一生:衣食住行没有不可以被量化的,那么问题来了:基于这样的透明化世界,个人还有隐私可言吗?自由意志在多大程度上可以由自我掌控?法律对个人言行或者隐私保护的规范都是等到不得不进行的时候才出台,同样今后大数据运用只会越来越广泛,那么具体会有哪些规范保护我们少的可怜的隐私呢,我静静地期待着。

文中提到的第二部分:数据拥有强大的潜在价值 观点:不同于物质性的东西,数据的价值不会随着它的使用而减少,也不会有折旧损耗,而是可以不断地被处理。数据的潜在价值有三种最为常见的释放方式:基本再利用、数据集整合和寻找“一份钱两份货”。对于同一数据源的不同目的,可以多次建立相关关系分析,数据的价值是其所有可能用途的总和。比如:沃尔玛,亚马逊,谷歌,还有脸书等,,,

转接文中的第三部分: 根据所提供价值的不同来源,来分类如下三种大数据公司。这三种来源是指:数据本身、技能与思维。这得具体看公司的整体实力,是侧重于获取数据源还是兼顾有处理数据的能力还是说看到了数据的价值,去创新性实际应用等等不同初衷的综合,都是一个巨大的商机。这对创业公司初步定位还是很有参考价值的。

第四部分:大数据带来种种有利处的同时,风险也是无处不在,进行大数据分析的人可以轻松地看到大数据的价值潜力,这极大地刺激着他们进一步采集、存储、循环利用我们个人数据的野心,有贪婪就会有私欲。在大数据时代,以往可能行之有效的告知与许可这个经过了考验并且可信赖的基石,要么太狭隘,限制了大数据潜在价值的挖掘,要么就太空泛而无法真正地保护个人隐私。于是紧逼新的法案的诞生,具体怎样,我也是擦亮眼睛走着瞧。

结尾部分的谈到大数据带来的自由与责任并举而行, 一切被预测好的人生着实让人无味,人类的未来必须保留部分空间,允许我们按照自己的愿望进行塑造。否则,大数据将会扭曲人类最本质的东西,即理性思维和自由选择。

文章最后两部分开放空间很大,值得我们自己去思考,应对这么一个数据化时代,你能为你自己做点什么?此时的出版和事实分析是早几年前的事情了,有些观点我也是不认可的,但这种大数据思维方式值得我们去深思,去借鉴,读书就是一个思维不断碰撞揉杂,再重组的过程,内容很精彩,值得一读。

大数据时代读书笔记 第(3)篇

部分思考和案例有价值,整体思想有误导之嫌,来看看本书抛出的三个最重要的观点。“在大数据时代应该获得“全部”数据”?对于一笔订单,多少维度才算是全部数据?需要记录下单用户当时的血压、心跳、发型、带没带眼镜吗?口径多小才算是精确?订单发生的时间需要精确到毫秒还是纳秒皮秒?数据需要储存到天荒地老吗?数据的存储还是需要考虑成本的,其维度、口径、和生存周期要考虑数据当时的价值,如果数据产生了所谓的“二次价值”,自然也要重新评估数据的储存方式。“大数据时代允许不精确是一个亮点”?不精确是对成本权衡的结果,如果可以不计成本,数据当然越精确越好,作者在本书的第三部分就前后矛盾地描述了数据不精确带来的各种问题,甚至引用了“错误的前提导致错误的结果”这句话。“大数据时代更看中的是相关关系而非因果关系”?事实上避免相关性产生错误结论是大量技术和文章的主题。肥胖和受教育程度有相关性,因为生活富裕的人才有肥胖和受良好教育的条件,但机器学习工程师当然不会认可他们的算法给出“为了减少肥胖概率请不要读书”这样的建议。读书一定要有自己的思考和判断。

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:baisebaisebaise@yeah.net