《大数据——正在到来的数据革命》读书笔记
最近,我读了涂子沛先生的《大数据-正在到来的数据革命》,还未读完,已经被作者的思考的深度和信息的力量所震撼。这本书讲述美国半个多世纪信息开放、技术创新的历史,书中涵盖了很多美国信息技术方面的经典案例,包括美国政府对数据的重视和数据治国的成功经验,也向我们揭示了大数据时代的发展与危机,向人们详细阐述了数据创新给人民、政府以及社会带来的种种挑战和变革。最后作者还简单提出了对中国应对大数据挑战的建议。这本书以通俗易懂且略带诗意的语言,向我们铺开了一幅信息化发展的历史画卷,同时为我们勾勒出正在到来的大数据时代的宏伟蓝图。
进入20xx年大数据一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者消费浪潮的到来。“大数据”的运用在各个领域发挥着前所未有的重要作用,渗透到了当今每一个行业和业务职能领域,成为重要的生产因素,并对人类的数据驾驭能力提出了更新的挑战。 我认同作者的观点,大数据的形成主要归因于5个技术,包括摩尔定律、普适计算、数据挖掘、社交媒体、云计算,它们促成了“大数据”。其中,摩尔定律为我们解决一个问题,就是人类现在可以以很低的成本来保存数据;在某种意义上,那么信息共享的成本也将越来越低,这里体现了信息的无限共享性;第二,普适计算使得人类收集数据的能力得到增强,不仅是保存数据,我们还能够广泛地收集数据,并且对数据进行计算;第三,数据挖掘在我们能够收集、保存数据的基础上,又加强了人们的数据分析能力;第四,到了社交媒体时代来临的20xx年,大数据时代真正拉开了帷幕,大家都在贡献数据,这时的数据量是前所未有的,人类数据的80%都是非结构化数据;第五,云计算的发展又给大数据插上了新的翅膀,即使有很多的信息,即使存储设备非常的便宜,都不用存储在这些设备上,而是存在云上实现规模化和专业化。这五大技术的综合使得大数据变成了不可逆转的时代潮流。
“我们信奉上帝,除了上帝任何人都要以数据说话。”信息技术发展,数据指数级增长,已经彻底改变了政府,社会,商业群体的决策方法。书中花费了大量篇幅介绍美国信息开放的历程,只有信息自由才谈得上进一步的数据开放和数据共享。信息自由法已经成为美国不可缺少的一个基本法案。“向公众隐瞒政府实情的力量就是摧毁这个政府的力量。这种力量不能轻易授予,也不能轻率使用。” 美国政府开放了40万项数据,其实这不只是向美国人开放,而是放在互联网上向全世界开放,我们每个人都可以下载美国政府的数据来使用。美国政府的每项开放数据都经过了严格的论证,他们只有两条标准。第一是不危及国家的安全,第二是不侵犯公民的隐私。在开始的时候,美国政府存在着很多争议。他们对于国家安全也拿不准,也知道不同的数据经过整合会产生新的价值,也许一些数据整合起来就会泄漏国家的安全机密。但是他们最后还是选择了开放,因为这是推进社会的进步,推进经济的发展、保证公民的知情权、完善民主制度等方面有更好的作用,这方面的作用比国家安全受到威胁大多了。相比之下,我国的政府数据几乎处于封锁状态,政府内部数据共享的任务都没有完成,内部彼此都还没有开放,现在就筹划对外开放肯定是不合理的。正如作者所说,阳光是最好的防腐剂,数据开放是历史的正确方向。政府只有建立起透明、公众参与和多方合作的
制度才能取得公众的信任。但开放也要等待适当的时期,不能盲目开放。和美国相比,中国在数据收集、使用和管理的各个方面,都存在差距。作者认为,最大的差距是意识和态度。中国长期重定性、轻定量、重观点、轻数据。在现实生活中,数据也往往成为任政府粉饰的装饰画,得不到应有的尊重,数据的质量不高、公信力严重不足。
书中另一个让我很有感触的方面就是大数据时代的个人隐私保护问题。“在信息时代,计算机内的每一个数据、每一片字节,都是构成一个人隐私的血肉。信息加总和数据整合,对隐私的穿透力不仅仅是1+1=2的,很多时候是1+1>2的。”书中的一个例子更是生动地说明了这个问题:通过对一部自动提款机几周的数据记录进行分析,发现每天午夜12点到2点之间,都有大量的款项被提现,为防止这涉及诈骗等操作,进行侦探发现该提款机靠近一家色情俱乐部,顾客提现是为了不想在信用卡上留下不体面的消费记录。这个例子说明了当你在银行存钱、提款时,你留下的信息不仅仅是一笔银行交易,还告诉了银行你的地理位置。比如你的提款记录和你当天的通讯、消费、旅行等其他数据记录整合起来,很可能成为你其他行为的解释,从而透露一个人的隐私,你当天的行踪和作为,就几乎无秘密可言。在大数据时代数据整合1+1>2的效果,在美国社会体现得已经很明显。今年6月份,斯诺登向媒体透露了美国政府的“棱镜”窃听计划,美国情报机构一直在九家美国互联网公司中进行数据挖掘工作,从音视频、图片、邮件、文档以及连接信息中分析个人的联系方式与行动。其中包括两个秘密监视项目,一是监视、监听民众电话的通话记录,二是监视民众的网络活动。在美国这样一个宣誓人权和自由的国家,也会采取这种侵犯公民隐私的行为,big data is big brother,拥有数据才是信息社会的王道,美国尚且如此,让人很容易揣测中国以及其他国家政府的行为。2000万酒店开房信息随意查询下载、伪基站群发95588诈骗短信?在我们变成"透明人"的背后,是信息安全行业面临的前所未有危机,是互联网隐私安全对每个人生活的直接严重影响。
涂先生从数据本身的革命、社会科学的革命、企业管理的革命、社会管理的革命四个方面深刻阐述了大数据的重要意义,以最前沿的视野、直接的解读和剖析为我们理清了大数据时代的发展思路,让我们意识到:大数据的时代,是不可逃避的。中国社会更需要有人系统地梳理中国人对于数据的认识以及当前信息技术为中国发展提供的机会,争取在信息技术层面为中国如何深化改革、扩大开放提供思考和借鉴。我们是信管专业的学生,在第三次信息化的浪潮中,我们应该独立思考,掌握好专业知识,抓住发展的机遇,为个人发展创造空间,也为国家的腾飞贡献自己的微薄力量!
第二篇:大数据读后感
《大数据》读后感
沂源四中 田玉才
有人说生活像一团乱麻,剪不断理还乱;我说生活像一团乱码,尽管云山雾罩惝恍迷离,最后却总会拨云见日雨过天晴。维克托迈尔舍恩伯格就把这团乱码叫做大数据,在他的这本书里,试图给出的就是拨开云雾见青天的玄机。这玄机说来也简单,就是放弃千百年来人们孜孜追求的因果关系转而投奔相关关系。说来简单,其实却颠覆了多少代人对真理探求的梦想。我觉得作者是个典型的实用主义者,在美帝国主义万恶的压迫和洗脑下,始终追逐性价比和利益最大化,居然放弃了追求共产主义真理最基本的要求!不像我们在天朝光芒的笼罩下,从小就开始学习和追求纯粹的共产主义唯心科学历史文化知识啦!这或许就是我们永远无法获得诺贝尔奖、永远无法站在科技最前沿的根本原因吧。其实小学时候,我就想过这个问题,相信所有的人都问过类似的问题,例如现在仍然很多人在问,妈的从来没人知道我每天摆摊赚多少钱,你们他妈的那人均收入四五千是怎么算出来的。中国是抽样的代表,因为中国人最喜欢用代表来表现整体,最典型的例子莫过于公布的幸福指数满意指数各种指数永远都高于你的预期,你完全不清楚他是怎么来的,一直到最后汇总成三个代表,真心不清楚它到底能代表了啥。说这么多显得自己是个愤青,其实只是想表达“样本=总体”这个概念在科技飞速发展的今天,在世界的不同角落,还是会体现出不同的价值,受到不同程度的对待及关注。在大数据观
念的冲击下,我们是不是真的需要将平时关注的重点从事物内在的发展规律转移到事物客观的发生情况上。
大数据的出现,必然对诸多领域产生极大的冲击,某些行业在未来十年必将会得到突飞猛进的发展,而其他一些行业则可能会消失。这是废话,典型的三十年河东三十年河西的道理,就像三十年前的数理化王子们,现在可能蜷缩在某工厂的小角落里颤颤巍巍的修理机器;就像三十年前职业高中的学生才学财会学银行,如今这帮孙子一个个都开大奔养小三攒的楼房够给自己做墓群的了;当然也不乏像生物这种专业,三十年前人们不知道是干啥的,三十年后人们都知道没事别去干,唯一可惜的是我在这三十年之间的历史长河中却恰恰选了这么一个专业,这也是为什么我现在在这写读后感而没有跟姑娘去玩耍的原因。其实乍一看这个题目,我首先想到的是精益生产的过程控制,比如六西格玛,这其实就是通过对所有数据的分析来预测产品品质的变化,就已经是大数据的具体应用了。而任何事物都会有偏差,会有错误,也就是说,这全部的数据中,肯定是要出现很多与总体反应出的规律相违背的个体,但是无论如何这也是该事件中一般规律的客观体现的一种形式,要远远好过从选定的样本中剔除异常值然后得到的结论。换句话说,也大大减少了排除异己对表达事物客观规律的影响。就好比是统计局统计中国人民的平均收入一样,这些数怎么这么低啊,这不是给我们国家在国际社会上的形象抹黑么,删掉删掉;这些数怎么这么高啊,这还不引起社会不满国家动荡啊,删掉删掉。所以说,大数据至少对反应客观事实和对客观事实做预测这两个方面
是有非常积极地意义的。而这个新兴行业所体现的商机,既在如何利用数据上,又在如何取得数据上。