大数据读后感

时间:2024.5.4

大数据读后感

我阖上这部书,闭上眼睛。我思路在飞驰,我要在看完这部书的瞬间,找到一个词,说明我此刻最真实的感受,哦,我找到了,这个词就是:机遇!我们常为一生错过各种机遇而扼腕叹息,甚至,我们的国家也是如此,“大数据”就是这样一个尚没有错过的重大的机遇,大家不要错过啊!

信息爆炸当然不是自今日起,但是,今年来他对人们的逼迫是越来越甚了。互联网特别是移动互联网的发展,加快了信息化向社会经济各方面、大众日常生活的渗透。有资料显示,19xx年全球网民平均每月使用流量是1MB(兆字节),20xx年是10MB,20xx年是100MB,20xx年是1GB(1GB等于1024MB),20xx年将是10GB。大数据被用来描述信息爆炸所产生的海量数据。Jim Gray的新摩尔定理认为,每18个月全球新增的信息量是计算机有史以来全部信息量的总和。截至20xx年,人类拥有的信息总量大约是1.2ZB(1ZB等于1万亿GB)。IDC预计,到20xx年,世界上的数据存储总量将达35ZB。随着宽带化的发展,人均网络接入带宽和流量也迅速提升。全球新产生数据年增40%,即信息总量每两年就可以翻番,这一趋势还将持续。目前,单一数据集容量超过几十TB甚至数PB已不罕见,其规模大到无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理。数据之所以增长如此之快,也源于各类传感器、智能终端的剧增。而高清晰图像和视频,更使得数据呈指数级增长。如何收集、管理和分析数据日益成为信息通信技术创新的重中之重。

一 金矿

书皮上施伯乐先生写了这样一段话:《大数据》这部书揭示了数据在未来社会中的革命性作用。大数据将是下一个社会发展阶段的“石油”和“金矿”。??,谁能更好的使用数据,谁就会在竞争中脱颖而出。

随着数据规模的扩大,处理的难度也随之增加,利用数据仓库、可视化处理、联机分析处理(OLAP)工具和数据挖掘等技术进行的商业智能分析就更具价值,这就是大数据热的原因。大数据技术可运用到各行各业。宏观经济,天气预报,医疗保健,工业制造,政府服务等处无不有它的影子。

这本书以美国的信息产业和政府职能改进为两条主线,勾勒出从20世纪初年到如今的一个个信息时代发展的里程碑。其中,美国政府的信息自由制度的建立过程,真可谓一波三折,奥巴设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结,充满传奇,它也真的就是传奇,这个过程让我们看到,在公民社会中来自民间的力量是如何与政府博弈的,社会又是如何自省和努力实现进步的。这种博弈的结果就是《信息自由法》和一系列涉及信息公开的法案通过与实行,最典型的应用应属美国联邦政府的统一数据开放门户网站——Data.Gov,旨在向全美开放政府拥有的公共数据,鼓励新的创意,提供更透明、更丰富的公共服务。截至20xx年12月,Data.Gov共开放原始数据3721项、地理数据386429项。更重要的是,该网站还汇集了1570个数据可视化应用。从空气质量与工厂数量的关系,到胖子数量与快餐店的多寡,给人无限的启示和便利。

在软件业的发展过程中,美国联邦政府也起了举足轻重的作用。整个软件产业最早是由个别大项目推动的。这些大项目,基本上都是由联邦政府认购、买单。其中最大的项目之一,是美国国防部和IBM在19xx年开始合作的一个防空项目

(Semi-Automatic Ground Environment),该项目致力于用计算机软件处理雷达收集的信号,侦察、跟踪天空飞行物的活动。---摘自《大数据》第八章

软件业的起家就是从数据分析开始的,现在软件行业的发展最大机遇还是数据,可以说是:得数据者得天下。支撑大数据组织管理和价值发现相关的企业经济活动会成为软件行业发展的主流,如何将先进的数据观念引入我们自身的产品,提供符合大数据时代的软件服务是今后生存的根本。我们平台的“共享交换系统”其实就是具有“大数据”概念和内涵的优秀产品。从网上抄的大数据产业的几个流程如下:

二 看看美国如何运用数据的一个例子吧

数据“打”假:最大的争议就是福利滥用。

根据CMS中心的统计,20xx年,医疗保险计划支出共5023亿美元,覆盖了4700万的美国人口;医疗补助计划共支出3739亿美元,覆盖了5680万美国人口。10由于两个计划都是针对社会的弱势人群,它们之间也互有交叉,例如,对于老年的贫困人口群,就可能同时适用两个计划。20xx年,有850万人同时受惠于两个项目。

福利政策在全世界最大的争议,就是福利滥用、最后养了懒人,导致社会发展缺乏动力。美国虽然慎之又慎,但这两块免费大蛋糕,也不例外。20xx年,联邦调查局在《财务犯罪年度公开报告》中估计,联邦政府每年的医疗开支当中,大概有3%到10%涉嫌造假和欺诈。11面对利益,人类的创造力总是无穷的:虚假账单、重复申报、无中生有,小病大治、慢治、长治,隐瞒收入和存款、装穷吃低保,林林总总,不一而足。

两个项目的受惠人群,加起来有近1亿人,平均每人每月上一次医院,一年就有12亿张账单,按照联邦调查局的估计,大概会有3600万到1.2亿张账单存在问题。如果要依靠人力去张张审查,其工作量是难以想象的。

目前,CMS中心最主要的措施,就是通过数据来打假。---摘自《大数据》第三章

下面我推想演绎一下美国的 “数据来打假”。

首先,定义那些是假的,就美国的医疗美国的福利制度而言,大致包括:虚假账单、重复申报、无中生有,小病大治、慢治、长治,隐瞒收入和存款、装穷吃低保等等。

再者,找到欺诈的痕迹,这书没有说这么多,我凭专业知识在这里补充:虚假账

大数据读后感

单,应该就是福利医疗机构虚构患者或者虚构治疗,不符的就是就医院虚构病人或

已经死亡人员还就医(还有永远不死的患者);重复申报,就是一次治疗多次申报,不符的同一天或不够治疗周期重复治疗;装穷吃低保就是不够条件的人员混福利,不符的是假装的穷人买车买房等等。

最后,就是根据欺诈的痕迹,设定一个标准,利用数据工具(应该主要联机分析)进行数据的搜索和检索,以找出可能的不符事件。如患者超过120岁的患者的治疗(可能不用这么老),先判断为异常,再利用人力逐笔核对等等。这就是所谓的数据挖掘的一种。书上说的: 20xx年,加州州政府率先推出了一个数据挖掘的项目“保险补助双向核对”(Medical-Medicaid Data Match),将医疗保险和医疗补助两个项目的数据整合起来,利用两个计划中的人员、时间、价格、地点等数据信息对每一宗申报进行互相核实,通过计算机算法自动确定相互矛盾、有异于常态的支付记录,一旦发现造假或者不实申报的可疑账单,则转入人工追讨的环节。

还要提高管理水平。书上说:“保险补助双向核对”这大大缩小了人工审查的范围,提高了打假的效率。由于效果显著,20xx年,这个项目在个别州的实施范围进一步扩大,由事后追讨推进到了事前防范。这意味着,CMS中心一收到申请报销的账单,就启用数据挖掘系统对该申请的数据记录进行“风险评分”:得分低于预定风险额度的申报则转入自动支付的环节;得分超过该风险额度的申请将退回申请人,或提交专门的小组进行人工复审。支付后的账单,最后还要经过另一个数据挖掘算法的审核,发现可疑的,再转入人工追讨的环节。

上面这个例子就是经典的使用数据进行内部控制的范例。

三 几粒“沙子”

真正的读书人应该永远有批评者的立场。就我想到为这书挑点毛病。

这部谈到中国人民的“国民性”,我认为有可以探讨的地方。中国人缺乏精确,是有这个毛病,但是,这跟数据没有关系。其实,谈任何国民性都是非常危险的事情,我个人观点“国民性”是个伪命题。书中有提到了做菜,说什么食盐少许,醋一勺等等,其实,这是反证中国人的精确,全世界有这么多中国餐馆,大家都爱吃中国菜就是事实,事实是最大的数据。据说德国菜是搞的很精确的,但是德国菜搞的很难吃。因为,好吃不好跟精确与否无关,甚至是不精确带来的好吃,数据当然是重要,但是数据不是也不可能知识的全部。

这部书是明显有政治倾向的,此书中只要是民主党总统都是数据共享开源的支持者,只要是共和党总统都是信息公开的反对者,甚至州、市的领导人也是如此。虽然,我不懂美国的历史和政治制度,但是,直觉告诉我这样说肯定是有问题的。

最后,这部书过分强调了数据对于人类社会的作用,读完之后给人的感觉是不管什么领域,只要一引入数据,马上大为改观,成效立现。我看真正高明的数据使用应该是无形的,是于无声处起风雷,这个世界美好而简单,大家在郊外散步,运动,谈天说地,数据在默默地,不知不觉地为我们服务,因为,我们大多数人是不喜欢看到数据的本身的。

利用了几个晚上的时间阅读了胡总推荐的《大数据》一书,从中感悟很多。其实,刚刚看完这部著作,我马上想到了另外一部著作,这部著作与《大数据》是风马牛不相及的,是什么呢,是一部讲绘画的书就是《芥子园画谱》,有“渊博”的同仁可能会知道,那是讲画画类书,有大量的中国画的实例(记得上面有福美女图题诗云“自对梅花描小象,欲呼明月前生。”),我也很觉得诧异,难道自己老糊涂了。我仔细想来不是啊,这两者还真有联系,其联系大致如下:其一,《芥子园画谱》是

国画的数据库,里面分门别类的统合了大量的绘画的实例;其二,《芥子园画谱》在介绍画法的时候,往往是从古人说起,说这个山宋人怎么画,元人怎么画,明人怎么画,…..,不但,是有数据,还讲了数据的历史,这一点还真是同本书合拍啊;其三,《芥子园画谱》堪称中国绘画的教科书,而《大数据》对人们理解使用数据也具指导意义;其四,正直初春天气,看着就要发芽的各种书的枝桠,想到了那些表象植物的中国画吧。

注:《芥子园画谱》,又称《画传》,诞生于清代。清代著名文学家李渔,曾在南京营造别墅“芥子园”,并支持其婿沈心友及王氏三兄弟(王概、王蓍、王臬),编绘画谱,故成书出版之时,即以此园名之。此画谱堪称中国的教科书。在中国的画坛上,流传广泛,影响深远,孕育名家(齐白石、潘天寿等),施惠无涯者,《芥于园画谱》当之无愧也。

------------------------------财务部 田玉 2013-3-14

大数据读后感


第二篇:大数据读后感


《大数据》读后感

沂源四中 田玉才

有人说生活像一团乱麻,剪不断理还乱;我说生活像一团乱码,尽管云山雾罩惝恍迷离,最后却总会拨云见日雨过天晴。维克托迈尔舍恩伯格就把这团乱码叫做大数据,在他的这本书里,试图给出的就是拨开云雾见青天的玄机。这玄机说来也简单,就是放弃千百年来人们孜孜追求的因果关系转而投奔相关关系。说来简单,其实却颠覆了多少代人对真理探求的梦想。我觉得作者是个典型的实用主义者,在美帝国主义万恶的压迫和洗脑下,始终追逐性价比和利益最大化,居然放弃了追求共产主义真理最基本的要求!不像我们在天朝光芒的笼罩下,从小就开始学习和追求纯粹的共产主义唯心科学历史文化知识啦!这或许就是我们永远无法获得诺贝尔奖、永远无法站在科技最前沿的根本原因吧。其实小学时候,我就想过这个问题,相信所有的人都问过类似的问题,例如现在仍然很多人在问,妈的从来没人知道我每天摆摊赚多少钱,你们他妈的那人均收入四五千是怎么算出来的。中国是抽样的代表,因为中国人最喜欢用代表来表现整体,最典型的例子莫过于公布的幸福指数满意指数各种指数永远都高于你的预期,你完全不清楚他是怎么来的,一直到最后汇总成三个代表,真心不清楚它到底能代表了啥。说这么多显得自己是个愤青,其实只是想表达“样本=总体”这个概念在科技飞速发展的今天,在世界的不同角落,还是会体现出不同的价值,受到不同程度的对待及关注。在大数据观

念的冲击下,我们是不是真的需要将平时关注的重点从事物内在的发展规律转移到事物客观的发生情况上。

大数据的出现,必然对诸多领域产生极大的冲击,某些行业在未来十年必将会得到突飞猛进的发展,而其他一些行业则可能会消失。这是废话,典型的三十年河东三十年河西的道理,就像三十年前的数理化王子们,现在可能蜷缩在某工厂的小角落里颤颤巍巍的修理机器;就像三十年前职业高中的学生才学财会学银行,如今这帮孙子一个个都开大奔养小三攒的楼房够给自己做墓群的了;当然也不乏像生物这种专业,三十年前人们不知道是干啥的,三十年后人们都知道没事别去干,唯一可惜的是我在这三十年之间的历史长河中却恰恰选了这么一个专业,这也是为什么我现在在这写读后感而没有跟姑娘去玩耍的原因。其实乍一看这个题目,我首先想到的是精益生产的过程控制,比如六西格玛,这其实就是通过对所有数据的分析来预测产品品质的变化,就已经是大数据的具体应用了。而任何事物都会有偏差,会有错误,也就是说,这全部的数据中,肯定是要出现很多与总体反应出的规律相违背的个体,但是无论如何这也是该事件中一般规律的客观体现的一种形式,要远远好过从选定的样本中剔除异常值然后得到的结论。换句话说,也大大减少了排除异己对表达事物客观规律的影响。就好比是统计局统计中国人民的平均收入一样,这些数怎么这么低啊,这不是给我们国家在国际社会上的形象抹黑么,删掉删掉;这些数怎么这么高啊,这还不引起社会不满国家动荡啊,删掉删掉。所以说,大数据至少对反应客观事实和对客观事实做预测这两个方面

是有非常积极地意义的。而这个新兴行业所体现的商机,既在如何利用数据上,又在如何取得数据上。

更多相关推荐:
《大数据》读后感

大数据读后感佘洁婕读完大数据我才意识到这并不是一本枯燥无味的书籍作者运用案例和讲故事的方式把美国数据开放收集使用背后的立法故事公民故事技术故事商业故事娓娓道来引人入胜令我大开眼界我在想大数据概念对于教育来说会产...

大数据 读后感

从徐子沛的大数据中得到的感悟数据对于我们现代社社会来说已经是再熟悉不过了大量化Volume多样化Variety快速化Velocity和大价值Value这四个V就是大数据的基本特征每天我们都不得不和数据打交道比如...

《大数据时代》读书笔记-20xx0203

大数据意味着什么大数据时代读书笔记自英国人维克托迈克舍恩伯格ViktorMayerSchonberger20xx年写了一本叫大数据时代生活工作和思维的大变革的互联网专著大数据一夜之间成为全球互联网领域的核心关键...

大数据时代读书笔记

大数据时代读书笔记一引论1大数据时代的三个转变1可以分析更多的数据处理和某个现象相关的所有数据而不是随机采样2不热衷于精确度3不热衷与寻找因果关系2习惯用来决策的信息必须是少量而精确的实际数据量变大数据处理速度...

《大数据时代》读后感

大数据时代读后感大数据时代下的变革学号20xx1300008姓名严国立班级12级4班这两年大数据这个词突然变得很火不仅出现在阿里巴巴谷歌等互联网公司的战略规划中同时在我国国务院和其他国家的政府报告中多次提及无疑...

大数据时代读后感(全)

大数据时代读后感大数据时代是由英国作者维克托麦尔舍恩伯格等所著由胜杨燕和周涛翻译这本书主要描述的是大数据时代到临人们生活工作与思维各方面所遇到的重大变革本书作者舍恩伯格在大数据领域是最受人尊敬的权威发言人之一他...

大数据读后感

假设你要测量一个葡萄园的温度但是整个葡萄园只有一个温度测量仪那你就必须确保这个测量仪是精确的而且能够一直工作反过来如果每100棵葡萄树就有一个测量仪有些测试的数据可能会是错误的可能会更加混乱但众多的读数合起来就...

大数据读后感

大数据读后感这个暑假我看了大数据这本书颇有感想大数据一书通过讲述美国半个多世纪信息开放技术创新的历史以别开生面的经典案例奥巴设前所未有的开放政府的雄心公共财政透明的曲折背后的隐情全民医改法案的波澜统一身份证...

大数据读后感

大数据读后感沂源四中田玉才有人说生活像一团乱麻剪不断理还乱我说生活像一团乱码尽管云山雾罩惝恍迷离最后却总会拨云见日雨过天晴维克托迈尔舍恩伯格就把这团乱码叫做大数据在他的这本书里试图给出的就是拨开云雾见青天的玄机...

《大数据》读后感

大数据读后感荆家镇中心学校荆超在数字信息时代数据和空气一样遍布生活对于有些人来说数据无意义而对于有些人来说数据即真相读完大数据我才意识到这并不是一本枯燥无味的书籍透过全书一个立体的美国及美国人民的思想呈现在我们...

涂子沛的《大数据》读后感

读涂子沛的大数据有感沂源三中韩云祥涂子沛的大数据从民主和国家战略的层面介绍了大数据的影响力全书通篇没有晦涩难懂的专业术语作者用平实的语言形象生动的讲明白了数据开放技术创新和社会进步之间的关系环环相扣鞭辟入里引人...

涂子沛《大数据》读后感

涂子沛大数据读后感博山区双语学校翟俊杰用了几个月的时间大数据一书总算是慢慢地看完了拿到这本书真的是一无所知硬着头皮去读的为了完成任务去读可是阅读越觉得这是一本有趣的书籍通过政治经济的博弈对数据进行了生动的描述简...

大数据读后感(43篇)