大数据读后感

时间:2024.3.31

假设你要测量一个葡萄园的温度,但是整个葡萄园只有一个温度测量仪,那你就必须确保 这个测量仪是精确的而且能够一直工作。反过来,如果每100棵葡萄树就有一个测量仪,有些测试的数据可能会是错误的,可能会更加混乱,但众多的读数合起来就可以提供一个更加准确的结果。因为这里面包含了更多的数据,而它不仅能抵消掉错误数据造成的影响,还能提供更多的额外价值。

现在想想增加读数频率的这个事情。如果每隔一分钟就测量一下温度,我们至少还能够保 证测量结果是按照时间有序排列的。如果变成每分钟测量十次甚至百次的话,不仅读数可能出错,连时间先后都可能搞混掉。试想,如果信息在网络中流动,那么一条记录很可能在传输过程中被延迟,在其到达的时候已经没有意义了,甚至干脆在奔涌的信息洪流中彻底迷失。虽然我们得到的信息不再那么准确,但收集到的数量庞大的信息让我们放弃严格精确的选择变得更为划算。在第一个例子里,我们为了获得更广泛的数据而牺牲了精确性,也因此看到了很多如若不然无法被关注到的细节。在第二个例子里,我们为了高频率而放弃了精确性,结果观察到了一些本可能被错过的变化。虽然如果我们能够下足够多的工夫,这些错误是可以避免的,但在很多情况下,与致力于避免错误相比,对错误的包容会带给我们更多好处。(小微金融创新,也可借鉴此思想,然后做好对数据收集与存储的支撑成为首要完成的事务,然后是对数据的正确运用是重点)

我们可以在大量数据对计算机其他领域进步的重要性上看到类似的变化。我们都知道,如 摩尔定律所预测的,过去一段时间里计算机的数据处理能力得到了很大的提高。摩尔定律认 为,每块芯片上晶体管的数量每两年就会翻一倍。这使得电脑运行更快速了,存储空间更大 了。大家没有意识到的是,驱动各类系统的算法也进步了——美国总统科技顾问委员会的报告显示,在很多领域这些算法带来的进步还要胜过芯片的进步。然而,社会从“大数据”中所能得到的,并非来自运行更快的芯片或更好的算法,而是更多的数据。(数据本身的价值,及数据的价值的体现)

容忍错误带来的是更多数据吞吐(大数据),容忍风险带来的大量业务的涌现(小微金融) 大量业务的涌现带来的收益需要大于其风险带来的损失,最好办法就是从他处大量收集这些数据,并容忍这些数据存在错误,再基于大数据分析(同业数据收集,依托互联网中搜索等进行收集,阿里可以根据淘宝进行收集)

一致性 多样性

Hadoop的输出结果没有关系型数据库输出结果那么精确,它不能用于卫星发射、开具银行 账户明细这种精确度要求很高的任务。但是对于不要求极端精确的任务,它就比其他系统运行得快很多,比如说把顾客分群,然后分别进行不同的营销活动。 信用卡公司VISA使用Hadoop,能够将处理两年内730亿单交易所需的时间,从一个月缩减 至仅仅13分钟。这样大规模处理时间上的缩减足以变革商业了。也许Hadoop不适合正规记账,但是当可以允许少量错误的时候它就非常实用。

ZestFinance,一个由谷歌前任首席信息官道格拉斯·梅里尔创立的公司,用自己的经验再次 验证了“宽容错误会给我们带来更多价值”这一观点。这家公司帮助决策者判断是否应该向某些拥有不良信用记录的人提供小额短期贷款。传统的信用评分机制关注少量突出的事件,比如一次还款的延迟,而ZestFinance则分析了大量不那么突出的事件。20xx年,让ZestFinance引以为豪的就是,它的贷款拖欠率比行业平均水平要低三分之一左右。唯一的

得胜之道还是拥抱混杂。

梅里尔说:“有趣的是,对我们而言,基本没有任何一个人的信息是齐备的,事实上,总有 大量的数据缺失。”由ZestFinance创建的用来记录客户信息的矩阵是难以想象得稀疏,里面充满了数据的空洞,但ZestFinance在这些支离破碎的数据中如鱼得水。举个例子,有10%的客户属性信息显示“已经死亡”,但是依然可以从他们身上收回贷款。梅里尔一脸坏笑地说:“显然,没有人会企盼僵尸复活并且主动还贷。但是我们的数据显示,放贷给僵尸是一项不错的生意。”

所以有时候,通过代理取得数据信息比自己去操作烦琐的程序要便宜得多。同时还有另一 个征信机构出售“支付能力指数”和“可支配支出指数”,这些指数是用来预测一个人的支付能力的。

数据化

必须收集所有信息(包括被否掉的信息和被忽略的信息),所有跟行业接触的客户的信息,甚至没有需求的客户信息。所以可以分四步来走,第一步所有达成交易客户的全面信息(*只要能收集到能接触到的),第二步收集所有跟公司有接触的客户的全面信息,第三步收集跟整个行业有接触的客户的全面信息,第四步所有跟客户相关的人或法人的全面信息,第五步所有人的全面信息。

一切给冯·安这位家里经营糖果厂的危地马拉人带来了相当高的知名度,使他能够在取得 博士学位后进入卡内基梅隆大学工作,教授计算机科学;也使他在27岁时获得了50万美元的麦克阿瑟基金会“天才奖”。但是,当他意识到每天有这么多人要浪费10秒钟的时间输入这堆恼人的字母,而随后大量的信息被随意地丢弃时,他并没有感到自己很聪明。

于是,他开始寻找能使人的计算能力得到更有效利用的方法。他想到了一个继任者,恰如 其分地将其命名为ReCaptcha。和原有随机字母输入不同,人们需要从计算机光学字符识别程序无法识别的文本扫描项目中读出两个单词并输入。其中一个单词其他用户也识别过,从而可以从该用户的输入中判断注册者是人;另一个单词则是有待辨识和解疑的新词。为了保证准确度,系统会将同一个模糊单词发给五个不同的人,直到他们都输入正确后才确定这个单词是对的。在这里,数据的主要用途是证明用户是人,但它也有第二个目的:破译数字化文本中不清楚的单词。ReCaptcha的作用得到了认可,20xx年谷歌收购了冯·安的公司,并将这一技术用于图书扫描项目。

我们所处的时代之所以与众不同,是因为数据的收集不再存在固有的局限性。技术已经发 展到一定程度,大量信息可以被廉价地捕捉和记录。数据经常会得到被动地收集,人们无须投入太多精力甚至不需要认识这些数据。而且,由于存储成本的大幅下降,保存数据比丢弃数据更加容易。这使得以较低成本获得更多数据的可能性比以往任何时候都大。

大数据创新可以有两个方向:

1、更适合于已有大量数据在手的进一步数据价值挖掘。

2、或打造向大数据收集方向靠拢的模式,建立一种好的收集机制。

数据创新1:数据的再利用

数据创新2:重组数据

数据创新3:可扩展数据 :可扩展数据

数据创新4:数据的折旧值

数据创新5:数据废气

数据创新6:开放数据

这两家公司的不同做法很能说明问题。微软只看到了拼写检查作为文字处理这一个目的的 价值,而谷歌却理解了其更深层次的价值。不仅利用错别字开发了世界上最好、最新式的拼写检查器来提高搜索质量,而且将其应用于许多其他服务中,如搜索的“自动完成”功能、Gmail、谷歌文档甚至翻译系统。

容错,包容能带来新的价值

一位谷歌的员工说:“我们喜欢从大的‘噪音’数据集中吸取教训。”

很多企业都开始设计他们的系统,以这种方式收集和使用信息。在Facebook的早期,数据 科学家们研究了数据废气的丰富信息,发现人们会采取某种行动(如回帖、点击图标等)的最重要的预测指标就是他们看到了周围的朋友也在这么做。紧接着,Facebook重新设计了它的系统,使每个用户的活动变得可见并广播出去,这为网站的良性循环做出了新的贡献。逐渐地,这个想法从互联网行业传播至可以收集用户反馈的任何公司。

数据本身、技能与思维

数据来源,信用卡 匿名信息

手/网游公司。。。

大数据只是科技发展的一个阶段,人类卓越的才华才是人类最大的优势(相比较于机器),是我们行进道路上可能用到或可以说必定会用到工具,工具就需要擅用的才华与技巧。 如果存在超越或近似于人类才华的能力,那它就具备人类同样的智慧。


第二篇:《大数据时代》


《大数据时代》读后感

——张亚超

《大数据时代》指出,大数据带来的信息风暴正在变革我们的生活、工作和思维。大数据开启了一次重大的时代转型,书中用三个部分给我们讲述了大数据时代的思维变革、商业变革和管理变革。作者明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之的是相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这是对人类的认知和与世界交流的方式提出了全新的挑战。大数据已经成为了新发明和新服务的源泉,而更多的改变已经开始。

以前,一旦完成了目标达到想要的结果之后,数据就会被认为已经没有用处了。而如今,大量的数据已经成为了一种商业资本,可以创造新的经济利益。事实上,数据能被巧妙地用来激发新产品和新型服务。半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且信息的增长速度也在加快。创造出了“大数据”这个概念。如今,这个概念几乎应用到了所有人类领域中。因为互联网公司可以收集大量有价值的数据,所以互联网公司就顺理成章地成为最新处理技术领头的实践者。它们甚至超过了很多有几十年经验的线下公司,成为新技术的领衔使用者。大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。但是这仅仅只是一个开始,大数据时代对我们的生活、工作、与世界交流的方式都提出了挑战。

大数据开启了一次重大的时代转型。真正的革命并不在于分析数据的机器,而在于数据本身和我们如何运用数据。20xx年,人类第一次破译人体基因密码的时候,辛苦工作了十年才完成了三十亿对碱基对的排序。大约十年之后,世界范围内的基因仪每15分钟就可以完成同样的工作。互联网公司更是要被数据淹没了。谷歌公司每天要处理超过24拍字节的数据,这意味着其每天的数据处理量是美国国家图书馆所有纸质出版物所含数据量的上千倍。从科学研究到医疗保险,从银行业到互联网,各个不同的领域都在讲述着一个类似的故事,那就是爆发式增长的数据量。大数据的科学价值和社会价值正是体现在这里。一方面,对大数据的掌握程度可以转化为经济价值的来源。另一方面,大数据时代已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。这项技术终将会改变我们所居住的星球的许多东西。

大数据的核心代表着我们分析信息时的三个转变。这些转变将改变我们理解和组建社会的方法。第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理

和某个特别现象相关的所有数据,而不再依赖于随机采样。第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。第三个改变就是,我们放弃对因果关系的渴求,取而代之的是相关关系。大数据给社会带来的益处将是多方面的。如抑制全球变暖、消除疾病、提高执政能力和发展经济的一个有力武器。但是大数据时代也向我们提出了挑战,我们需要做好充足的准备迎接大数据技术给我们的机构和自身带来的改变。大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。过去不可计量、存储、分析和共享的很多东西都被数据化了,大数据我们理解世界打开了一扇新的大门。

更多相关推荐:
《大数据》读后感

大数据读后感佘洁婕读完大数据我才意识到这并不是一本枯燥无味的书籍作者运用案例和讲故事的方式把美国数据开放收集使用背后的立法故事公民故事技术故事商业故事娓娓道来引人入胜令我大开眼界我在想大数据概念对于教育来说会产...

大数据 读后感

从徐子沛的大数据中得到的感悟数据对于我们现代社社会来说已经是再熟悉不过了大量化Volume多样化Variety快速化Velocity和大价值Value这四个V就是大数据的基本特征每天我们都不得不和数据打交道比如...

《大数据时代》读书笔记-20xx0203

大数据意味着什么大数据时代读书笔记自英国人维克托迈克舍恩伯格ViktorMayerSchonberger20xx年写了一本叫大数据时代生活工作和思维的大变革的互联网专著大数据一夜之间成为全球互联网领域的核心关键...

大数据时代读书笔记

大数据时代读书笔记一引论1大数据时代的三个转变1可以分析更多的数据处理和某个现象相关的所有数据而不是随机采样2不热衷于精确度3不热衷与寻找因果关系2习惯用来决策的信息必须是少量而精确的实际数据量变大数据处理速度...

大数据读后感

大数据读后感沂源四中田玉才有人说生活像一团乱麻剪不断理还乱我说生活像一团乱码尽管云山雾罩惝恍迷离最后却总会拨云见日雨过天晴维克托迈尔舍恩伯格就把这团乱码叫做大数据在他的这本书里试图给出的就是拨开云雾见青天的玄机...

《大数据时代》读后感

大数据时代读后感大数据时代下的变革学号20xx1300008姓名严国立班级12级4班这两年大数据这个词突然变得很火不仅出现在阿里巴巴谷歌等互联网公司的战略规划中同时在我国国务院和其他国家的政府报告中多次提及无疑...

大数据时代读后感(全)

大数据时代读后感大数据时代是由英国作者维克托麦尔舍恩伯格等所著由胜杨燕和周涛翻译这本书主要描述的是大数据时代到临人们生活工作与思维各方面所遇到的重大变革本书作者舍恩伯格在大数据领域是最受人尊敬的权威发言人之一他...

大数据读后感

大数据读后感我阖上这部书闭上眼睛我思路在飞驰我要在看完这部书的瞬间找到一个词说明我此刻最真实的感受哦我找到了这个词就是机遇我们常为一生错过各种机遇而扼腕叹息甚至我们的国家也是如此大数据就是这样一个尚没有错过的重...

大数据读后感

大数据读后感这个暑假我看了大数据这本书颇有感想大数据一书通过讲述美国半个多世纪信息开放技术创新的历史以别开生面的经典案例奥巴设前所未有的开放政府的雄心公共财政透明的曲折背后的隐情全民医改法案的波澜统一身份证...

《大数据》读后感

大数据读后感荆家镇中心学校荆超在数字信息时代数据和空气一样遍布生活对于有些人来说数据无意义而对于有些人来说数据即真相读完大数据我才意识到这并不是一本枯燥无味的书籍透过全书一个立体的美国及美国人民的思想呈现在我们...

涂子沛的《大数据》读后感

读涂子沛的大数据有感沂源三中韩云祥涂子沛的大数据从民主和国家战略的层面介绍了大数据的影响力全书通篇没有晦涩难懂的专业术语作者用平实的语言形象生动的讲明白了数据开放技术创新和社会进步之间的关系环环相扣鞭辟入里引人...

涂子沛《大数据》读后感

涂子沛大数据读后感博山区双语学校翟俊杰用了几个月的时间大数据一书总算是慢慢地看完了拿到这本书真的是一无所知硬着头皮去读的为了完成任务去读可是阅读越觉得这是一本有趣的书籍通过政治经济的博弈对数据进行了生动的描述简...

大数据读后感(43篇)