大数据读后感吕文德

时间:2024.4.8

《大数据时代》读后感

松崮完小 吕文德

首先,本书大体上都是在讲美国政府在各社会团体不断“争取”权利、三权分立制度的制衡下,一步步将信息公开的历程。以及数据对美国政治所产生的影响,美国政府如何保护公民隐私等等。其实真正涉及到企业如何变得更加“智能”,唯有第四章讲得非常详细。先来看一下完整的商务智能流程:1、通过各种来源的关系型数据库,使用ELT(提取、转换、加载)工具,对来自不同系统的数据以统一格式进行清洗、转换、集成进入到数据仓库。2、锁定目标数据后进行联机分析。通过不同的分析角度进行多维分析,这样用户可以随时创建自己需要的报表,开发人员只要在后台为用户创建构建多维的数据立方体模型,用户就可以直接在前端的各个维度之间进行切换,从不同的维度对数据进行分析。从而获得更加全面的、动态的的分析结果。3、进行数据挖掘。就是从海量数据中,挖掘出具有价值的数据。通过对数据的挖掘其一、可以发现数据的历史规律,对过去进行总结。其二、可以根据数据对未来进行预测。企业可以根据预测对未来行情趋势做出预判,并作出相关决策。4、数据可视化,我想任何人看到一推数据,就会感到很头疼。当然也很不直观,到底企业的各项指标相比往年是好是坏去做对比也会很麻烦。使用各种图表、三维地图、动态模拟以及相关的动画技术是原本枯燥乏味的数据,变得生动起来。数据可视化把数据以更加直观的形态展现出来,使人们对相关数据做到一目了然。5、通过上面几步我们就把原先毫无价值的数据,变成了信息,最后演变为知识。

本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。

引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是20xx年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与20xx年、20xx年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。此外,我联想到原淘宝董事

长马云通过大量数据分析得出20xx年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用, Farecast公司是一个成功的典型范例。该公司由奥伦·埃齐奥尼创办,利用机票的销售数据来预测未来的机票价格,旨在帮助用户在购买机票方面做出预测,并对机票价格走势预测的可信度标示出来供消费者查考。Farecast系统利用近十万亿条价格记录预测的准确度达75%,使得使用Farecast票价预测工具购买机票的旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。

也正是由于我们进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。

文中提出的一个观点是,预测是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行预测、矫正。只是进入了大数据时代人们掌握的数据爆炸性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。

关于不是随机样本而是整体数据中。作者指出了随机取样是小数据时代用最少的数据获取最大价值的做法。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义。乔布斯成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。同样,从事跨境汇款业务的Xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。

其次,我们微动天下应该考虑的:1、是否有必要建立数据仓库?当然我这个问题我也在线上向IBM数据仓库的人员询问过。要考虑的有两个因素:其一、数据量的级别,其二、对数据挖掘的程度。一、数据量。采集器实时都对新闻、论坛、博客、微博在进行采集,当然如果说一年的数据量不算大的话,亦或者宁波本地的数据量也没那么大的话。公司假设几年后、几十年后业务量增大了,做到了浙江省乃至全国的时候。那个时候的数据量我想应该是非常的庞大了。二、对数据挖掘的程度,当然有关公司涉及的更多。不过有时候那些公司做得仅仅是

从采集的数据那里通过筛选,将相关信息发送给相关的客户。个人觉得这个价值应该被放大,通过对相关数据的挖掘对过去的规律进行总结,对未来的趋势做出预测。如固特异轮胎,根据往年的数据总结出某款轮胎某地以及在哪个时间段销量最大,然后第二年可以根据这个数据,制造商可以提前对该型号轮胎进行大量备货以备不时之需。通过挖掘在特定的时间段,哪几种商品捆绑销售会得到更好的销量等等。当然数据仓库是面向主题的数据集合,用于支持管理中的决策制定。个人觉得对公司领导层做出正确决策有很大的指导作用。2、公司应该加大数据挖掘能力。公司在招聘往里面招聘的所谓数据分析师,只不过是用来数据监测的。真正意义上面的数据分析师很是匮乏。现在客户大多希望的是能够给本企业决策有指导性意义的报告、或者建议。这就需要我们通过数据挖掘预测出未来趋势,即预测性分析。这样无论在产品推广,以及在本品牌忠诚度上都会有一定的保障。

3、是否能通过联机分析处理将数据从各个角度、不同纬度展现出来。例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析。4、数据可视化设计上需要强化。相关系统是直接给客户进行操作使用的,但我们所生成报告里面的统计图、走势图还不能很直观的展现给客户。这个对于客户体验来说是非常致命的,因为一旦不能直观的体现数据所呈现出来的状态,客户就不能对其决策做出准确的判断。进一步导致客户对我们忠诚度的降低。

作者同时也指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视精确性的优劣。作者特别举了谷歌翻译成功的例子。谷歌翻译之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(其语库来自于未经过滤的网页内容,会包含一些不完整的句子、拼写错误、语法错误以及其他各种错误)

在不是因果关系,而是相关关系的篇章中。作者指出在大数据时代往往知道是什么要比知道为什么来的更实在。作者列举了林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案

例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。建立在相关关系分析法基础上的预测是大数据的核心。Aviva保险公司利用几百种生活方式的数据,如爱好、长浏览网页等间接的预测出哪些人更可能患高血压、糖尿病和抑郁症。UPS国家快递公司通过使用预测性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了大数据在预测方面的优势。

这些例子都证明了大数据蕴藏着巨大的商业价值。根据提供价值的不同来源,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。比如说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的公司。皮特.华登,Jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片来为人们推荐下一次旅行目的地。对于某些公司来说,数据和技能并不是成功的关键。挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。

大数据成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。当然公司要根据自己的情况进行调整。大数据向小数据时代的赢家以及那些线下大公司(如沃尔玛、联邦快递、宝洁公司、雀巢公司、波音公司)提出了挑战。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着技术的发展,西方世界在大数据技术的优势将会慢慢消失。对于大公司而言,好消息是大数据技术可以加剧优胜劣汰。一旦公司掌握了大数据,它不但可能超过对手还可能遥遥领先。

大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的

大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来的机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交网站,购物网站等都掌握了用户的大量的数据信息。在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。


第二篇:《大数据时代》读后感


《大数据时代》读后感

———大数据时代下的变革

学号:20121300008 姓名:严国立 班级:12级4班 这两年,大数据这个词突然变得很火,不仅出现在阿里巴巴、谷歌等互联网公司的战略规划中,同时在我国国务院和其他国家的政府报告中多次提及,无疑成为当今互联网世界中的新宠儿。我对大数据一直好奇已久,阅读了很多资料仍不得其解,直到读完《大数据时代》才有了粗略的认识。

《大数据时代》是由英国作者维克托麦尔·舍恩伯格等所著,由胜杨燕和周涛翻译。作者是研究大数据这方面的大师,译者也翻译得很有水平。本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点,第一,不是随机样本,而是所有数据,这里要求数据要更多。第二,不是精确性,而是混杂性,这里要求数据更杂。第三,不是因果关系,而是相关关系,这里要求数据要更好。第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。

我侧重于从第一部分中的这三个观点谈谈自己的看法,这三个观点可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到

整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。

第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像Candide那样精确地翻译每一句话,它谷歌翻译之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。

第三个观点,不是因果性,而是相关性,这是这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题。

作者在书中把大数据说的很厉害,在最后一部分分析大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。用麦克纳马拉的例子来说明对数据

过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。

大数据给人类社会的方方面面带来了巨大的变革,这是社会发展的潮流,不可逆转,我们只有顺应这种潮流,在思想上和技能上做好准备才能成为时代的弄潮儿。对于一家公司或一个国家,要从根本上改变思维和观念,尽早适应这种潮流。

更多相关推荐:
《大数据》读后感

大数据读后感佘洁婕读完大数据我才意识到这并不是一本枯燥无味的书籍作者运用案例和讲故事的方式把美国数据开放收集使用背后的立法故事公民故事技术故事商业故事娓娓道来引人入胜令我大开眼界我在想大数据概念对于教育来说会产...

大数据 读后感

从徐子沛的大数据中得到的感悟数据对于我们现代社社会来说已经是再熟悉不过了大量化Volume多样化Variety快速化Velocity和大价值Value这四个V就是大数据的基本特征每天我们都不得不和数据打交道比如...

《大数据时代》读书笔记-20xx0203

大数据意味着什么大数据时代读书笔记自英国人维克托迈克舍恩伯格ViktorMayerSchonberger20xx年写了一本叫大数据时代生活工作和思维的大变革的互联网专著大数据一夜之间成为全球互联网领域的核心关键...

大数据时代读书笔记

大数据时代读书笔记一引论1大数据时代的三个转变1可以分析更多的数据处理和某个现象相关的所有数据而不是随机采样2不热衷于精确度3不热衷与寻找因果关系2习惯用来决策的信息必须是少量而精确的实际数据量变大数据处理速度...

大数据读后感

大数据读后感沂源四中田玉才有人说生活像一团乱麻剪不断理还乱我说生活像一团乱码尽管云山雾罩惝恍迷离最后却总会拨云见日雨过天晴维克托迈尔舍恩伯格就把这团乱码叫做大数据在他的这本书里试图给出的就是拨开云雾见青天的玄机...

大数据时代读后感(全)

大数据时代读后感大数据时代是由英国作者维克托麦尔舍恩伯格等所著由胜杨燕和周涛翻译这本书主要描述的是大数据时代到临人们生活工作与思维各方面所遇到的重大变革本书作者舍恩伯格在大数据领域是最受人尊敬的权威发言人之一他...

大数据读后感

假设你要测量一个葡萄园的温度但是整个葡萄园只有一个温度测量仪那你就必须确保这个测量仪是精确的而且能够一直工作反过来如果每100棵葡萄树就有一个测量仪有些测试的数据可能会是错误的可能会更加混乱但众多的读数合起来就...

《大数据》读后感

读大数据后有感美国有句谚语叫除了上帝任何人都必须用数据来说话毫无疑问我们正处在一个真正的大数据时代数据作为新一轮信息战的主角将创造无限商机既便利又危及着每个人的生活著名学者涂子沛的大数据以信息化为背景讲述作为一...

大数据读后感

感于大数据崮山裕禄学校白海我原以为大数据会是一本理论书籍读下去才发现该书很像西方的教科书运用案例和讲故事的方式把美国数据开放收集使用背后的立法故事公民故事技术故事商业故事娓娓道来引人入胜令我大开眼界而更让我惊讶...

大数据时代读后感第一部分

大数据时代读后感大数据时代是由英国作者维克托麦尔舍恩伯格等所著胜杨燕和周涛翻译这本书主要描述的是大数据时代到临人们生活工作与思维的所遇到的重大变革本书作者舍恩伯格在大数据领域是最受人尊敬的权威发言人之一他二十多...

大数据时代读后感

大数据时代读后感看完大数据时代生活工作与思维的大变革颇为感慨这世界变化真的快农业化工业化信息化时代的相继经历使得世界天翻地覆我们不再热衷于寻找因果关系而应该寻找事物之间的相关关系这个命题是我读这本书最大的感触个...

大数据时代读后感

大数据时代读后感无处不在的大数据各种云计算谷歌的神通亚马逊的推送天涯人肉微博万能等等我们掌握了新的工具也获取了以前从未有过的各种信息大数据拉近了我们与现实的距离地球村变成了地球屋仿佛所有人所有事物都触手可及而这...

大数据读后感(43篇)