《大数据》读后感
荆家镇中心学校 荆超
在数字信息时代,数据和空气一样遍布生活,对于有些人来说,数据无意义,而对于有些人来说,数据,即真相。读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。透过全书,一个立体的美国及美国人民的思想呈现在我们面前——美国人民执著于个人隐私的保护,却又不遗余力地推动着政府信息的透明与公开。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。 我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。
在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。
第二篇:涂子沛的《大数据》读后感-总经办李戈丁20xx1225
涂子沛的《大数据》读后感
总经办 李戈丁
20xx年12月25日
目录
一、 我的收获
二、 我的疑惑
三、 本书评分及评论分析
四、 其他优秀大数据书籍推荐
正文
一、 我的收获
客观的说,我着重看了第四章和尾声,其他内容粗略快速阅读,梳理了一下我的收获:
(一) 初步了解了美国大数据在公民社会层面的发展,即美国政府信息公开的编年史。
我梳理了一下美国数据信息发展的重大事件时间轴,如下
19xx年 美国公民自由联盟成立
19xx年 美联社主编库伯提出“知情权” p17
19xx年《人民的知情权》 p19
19xx年《信息自由法》约翰·摩斯 p20
19xx年 国第一次制定了统一的出院病人最小数据集
19xx年《信息自由法修正案》 p25
19xx年《阳光政府法》 p25
20xx年 国防部“万维信息触角”计划,反恐
20xx年 成立国家可视化分析中心
20xx年《电子信息自由法》p29
20xx年《开放政府法》
20xx年 奥巴马启动“大数据发展研究计划”(2亿美元的国家安全计划)
(二) 发现了中国在信息公开工作上与美国的差距
1、民治政府与专制政府
美国第三任总统托马斯·杰弗逊说:“信息之于民主,就如货币之于经济。” 美国人普遍认为,公共事务,就是大家的事。人们有权利知道这些事。如果没有知情权,即使在一个民主制度下,人们所能做的也不过仅仅就是投票改选它们的国王而已。只有拥有信息自由,人们才能真正拥有对公共事务的发言权。
中国缺乏的不是可供收集的数据,也不是收集数据的手段,而是收集数据的意识。中国人数据意识的淡薄,由来已久,甚至可以成为称之为国民性的一部分。中国的落后,根源之一正式缺乏以数据为基础的精确管理,而未来中国的进步,也有赖于建立这种精确的管理体系。民主的本质就是参与和妥协。管理者的专制管理,就是在人民有独立思考能力时,枪打出头鸟,而后安抚、管制甚至压制其余人。
2、数据社会发展
起步晚:美国19xx年通过《信息自由法》,中国20xx年前后才制定了《政府信息公开条例》且实施情况不理想。
各方面制约力量不成熟:没有人愿意主动公开。美国花了十年才出台《信息自由法》且颁布后政府消极应对。所以信息公开不仅要有民间的诉求,还需要新闻界以及司法力量对政府的监督,在中国,还差火候。
(三) 现实与理想
1、现实:中国在信息公开和大数据方面,落后美国100年。
2、理想:我们一定会进步,这种进步,应该以全世界的文明为基础。只有在一个自由、平等的社会里,每一个人的创造力才能真正迸发出来。创新,才是一个国家和设计持续发展的真正动力。这是作者写本书的初衷,也是他的“中国梦”。
(四) 案例分析
大数据的热潮并未有消褪迹象,相反,包括航空、金融、电商、政府、电信、电力甚至F1赛车等各个行业的企业都在纷纷掘金大数据。可以看出,在推动大
数据企业应用方面,真正看到大数据潜在商业价值的企业比大数据技术厂商还要着急。例如IT经理网曾经报道过沃尔玛大数据实验室直接参与到大数据工具的开发和开源工作中。但是在国内,虽然管理学界和财经媒体对大数据推崇备至,认为大数据是信息技术改变商业世界的杀手应用,但是关于大数据中国企业的成功案例的报道却出奇地少。
1、 案例:苹果收集用户数据
1)案例背景:
20xx年7月11日,央视在《新闻直播间》节目里报道称,只要在苹果手机上使用软件(即使未经授权使用地理位置权限),用户使用软件的时间地点都会被记录下来。此种获取信息的方式与软件使用同步,并且比手机基站、WIFI等定位精度更高。专家表示,根据手机定位服务显示信息可完整分析个人行迹,用户动态会完全公开。而谷歌、苹果等公司也曾因擅自搜集用户信息屡次惹上官司。
节目中,记者对包括社交软件、办公软件、炒股软件、娱乐软件等在内的十一款进行测试。其中有5款软件出现了位置权限的申请,但都已经关闭。剩下的六款软件则并未出现位置权限申请。通过操作发现,当使用软件时,对应位置文件夹中会出现软件的使用情况,包括使用时间、使用位置的经纬度等。该文件夹虽然显示加密,但并不需要任何解密措施就可以打开。这些定位信息完全与软件的使用同步,相对于手机基站、WIFI定位,该种定位方式精准度更高。
记者通过走访北京、青岛等城市,对60位苹果手机用户进行随机采访,被采访者中知道苹果手机有该功能的人仅5人,超过90%用户对苹果手机该功能并不知情。而采访苹果手机专卖店工作人员时,工作人员也表示对该功能并不熟悉。“不了解苹果手机这项功能的正面作用,负面作用要大于正面作用。”该工作人员说道。
那么位置权限所显示的用户信息到底会造成怎样的影响呢?中国人民公安大学网络安全保卫学院院长马丁就根据该苹果手机中的位置信息准确的分析出了手机用户的行为轨迹。马丁表示:“苹果手机中的定位功能可以显示手机用户经常活动的地点,活动的时间、活动的频率,会把一个人完整的行为轨迹进行比较详实的分析,是公开性的,没有任何秘密。”
央视报道称iPhone会记录用户地理信息,包括三个问题:1、用户常去地点,
iPhone上可以查看过去一段时间内这部手机到过的地点及次数;2、即使关掉常去地点选项,第三方应用依旧会记录用户位置信息;3、iPhone用户在路过Wi-Fi热点范围时,会记录该Wi-Fi热点地理信息。并且,这些位置信息都会被回传至苹果公司总部服务器。
DCCI互联网数据中心报告当中的一组数据显示,66.9%的智能手机移动应用(APP)在抓取用户隐私数据,其中通话记录、短信记录、通讯录是隐私信息泄露的三个高危地带。报告称高达34.5%的移动应用有“隐私越轨”行为,即在与APP本身功能毫不相干的情况下,获取智能手机用户的敏感个人信息。
2)历史相关:
20xx年美国国安局绝密级电子监听计划“棱镜计划”。苹果公司:“我们从未听说过PRISM。我们不对任何政府机构提供对我们服务器的直接访问,并且任何对客户数据提出请求的政府机构都必须得到法庭的核准。
20xx年,两位美国技术人员发现,iphone会在隐蔽的情况下,持续收集用户位置信息并且保存。《华尔街日报》调查后发现,即便用户关闭手机的定位功能,也不能阻止这种情况发生。“除了地理位置,通过App Store和其他途径,苹果还掌握了用户年龄、地址、信用卡、行为规律、消费倾向等许多信息,这些信息的商业价值巨大”,安全分析师说。
20xx年7月26日消息,据外媒报道,苹果公司日前首次承认,通过此前未公开的技术,苹果员工可以从iPhone手机提取用户个人深层数据,包括短信信息、联系人列表以及照片等。苹果否认为情报机构创作任何“后门”。
20xx年6月17日 ,苹果承认美国索取用户数据 半年涉及1万个账户。 20xx年5月9日,苹果网站上披露的最新信息显示,美国执法部门可以通过正规渠道获取该公司数百万用户的信息。
20xx年8月30日,据《华尔街日报》网站报道,苹果已经向开发者发出警告——严令开发者不要将他们从利用苹果公司健康软件平台所打造的应用中收集的用户个人数据共享给广告商。
3)作用:
分析用户对苹果手机的使用习惯,分析用户到底需要什么APP
用户健康数据可以用作实时跟踪、记录报警、诊断、院外随访以及治疗建议
各行业潜在消费者的位置、规模和个人信息
妥协国家安全部门保护国家安全,监视、破案
2、案例:支付宝十年账单大数据
1)案例背景:
12月8号,支付宝发布十年对账单,同时也公布了各省市20xx年(截至20xx年10月31日)的最新支付情况。毫无意外地,在网络空间引发了一波晒单潮,伴随着的是一片真假难辨的忏悔声,“我是不是买过一套房,忘拿合同了?”“我是不是看过一台车?怎么没看到影子?”“支付宝我和你什么仇什么怨啊,要逼我剁手?”
2)支付宝与大数据:
支付宝能拿一个10年账单,后面的支撑就是大数据。马云曾说,阿里最值钱的是数据,“我们是通过卖东西收集数据,数据是阿里最值钱的财富。”现在每个晚上约有八千万人在浏览阿里巴巴的网页,但却不买任何东西,阿里其实也不在乎,因为有流量就会有数据。马云在今年年初说,以控制为出发点的IT时代正在走向以激活生产力为目的的 DT(datatechnology)数据时代,进入11月份,他在公司内部讲话中的最新说法是,“未来几年内,要把一切业务数据化,一切数据业务化。”
美国麦肯锡全球研究院早在20xx年就发布了题为《大数据:下一个创新、竞争和生产力的前沿》的研究报告,提出“大数据时代已经到来”,数据正成为与物质资产和人力资本相提并论的重要生产要素,大数据的使用将成为未来提高竞争力的关键要素。麦肯锡指出,大数据对人类经济社会发展影响巨大,归纳起来主要有三个方面:一是能够推动实现巨大经济效益。据测算,大数据将使美国零售业净利润增长达到60%,使制造业产品开发、组装成本下降50%;二是能够推动增强社会管理水平;三是能够推动提高安全保障能力。
大数据的收集分析还能指引未来的方向。支付宝10年账单还有一个东西,就是预测你未来10年的财富。当然,预测都不可能是十分精准的,但它能通过数据加工分析去预测,这也是一个未来发展的方向。也就是说,大数据可以让你很方便地总结过去,也可以让你预测未来,这是很恐怖的。 支付宝方面也承认预测未来这个功能“不太严肃”,更多地是对个人信用和理财能力、消费能力的
一个有趣和直观的评估,这个对十年后财富值的预测看似游戏,却也是人们观察“大数据”和“信用”价值的小小开端。
马云说:互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了。
3、 案例《农夫山泉用大数据卖矿泉水》
上海城乡结合部九亭镇新华都超市的一个角落,农夫山泉的矿泉水堆头静静地摆放在这里。来自农夫山泉的业务员每天例行公事地来到这个点,拍摄10张 照片:水怎么摆放、位置有什么变化、高度如何??这样的点每个业务员一天要跑15个,按照规定,下班之前150张照片就被传回了杭州总部。每个业务员,每 天会产生的数据量在10M,这似乎并不是个大数字。
但农夫山泉全国有10000个业务员,这样每天的数据就是100G,每月为3TB。当这些图片如雪片般进入农夫山泉在杭州的机房时,这家公司的CIO胡健就会有这么一种感觉:守着一座金山,却不知道从哪里挖下第一锹。
胡健想知道的问题包括:怎样摆放水堆更能促进销售?什么年龄的消费者在水堆前停留更久,他们一次购买的量多大?气温的变化让购买行为发生了哪些改变?竞争对手的新包装对销售产生了怎样的影响?不少问题目前也可以回答,但它们更多是基于经验,而不是基于数据。
有了强大的数据分析能力做支持后,农夫山泉近年以30%-40%的年增长率,在饮用水方面快速超越了原先的三甲:娃哈哈、乐百氏和可口可乐。根据国家统 计局公布的数据,饮用水领域的市场份额,农夫山泉、康师傅、娃哈哈、可口可乐的冰露,分别为34.8%、16.1%、14.3%、4.7%,农夫山泉几乎 是另外三家之和。对于胡健来说,下一步他希望那些业务员搜集来的图像、视频资料可以被利用起来。
4、 案例:啤酒与尿布
5、 案例:数据新闻让英国撤军
6、 意案例:料之外:胸部最大的是西部妹子
7、 案例:QQ圈子把前女友推荐给未婚妻
8、 案例:好巧网预知哪个酒店更适合你
9、 案例:大数据与乔布斯癌症治疗
10、 案例:奥巴马大选连任成功
11、 案例:超市预知高中生顾客怀孕
12、 案例:Google成功预测冬季流感
13、 案例:大数据成功预测奥斯卡21项大奖
最后建议大家看一下央视的纪录片《互联网时代》,先对互联网概念有所了解。
二、 我的疑惑
1、 商业数据比重太小只在第四章出现,占13%。
第四章“商业智能的前世今生”p85-p111,全书p15-p362,占全书比重的13%。 这本书取名《大数据》有些取巧。现在大家所谈的大数据是诞生于电信、金融、互联网等商业企业的现象,而本书关注点在美国政府的信息公开的历程以及数据对美国政治治理的影响。如果从全书的篇幅来看,全书正文十章,算上前言、尾声等共十四章,只有第四章讲商业智能的部分内容和我们现在通常意义下所关注的大数据的内容相一致,占全书篇幅不足10%。其他部分讲美国的信息公开的历程,虽然讲得很细,但是离国内的读者还有点儿远,尤其是和政治与法律相关的内容只能让我们羡慕嫉妒恨。
如果这本书取名《信息公开与美国政治》会更贴切一些。
2、内容冗长、不接地气、无法指导工作
刚开始还有抱着很大希望看这本书能带给什么实际有效东西,虽然里面介绍了大数据的一些情况,但是仅仅是介绍而已; 并没有包含很实际东西,整本书看完,都是讲介绍大数据的一些情况,仅仅是“介绍”; 介绍完之后就没有什么实际的东西了,给人感觉很冗长,篇幅主要是讲了大数据在美国的发展,作为一本拓展眼界的书还可以,但是却不是序言中说的那么好; 建议作者还是做点实际的工作吧,仅仅是“介绍”,并没有什么实际作用的。
3、看完之后,你明白什么是大数据了吗?
专业名词按发展历程排列:数据仓库、联机分析(多维分析)、数据挖掘(描述性分析、预测性分析)、数据可视化。
我个人理解的大数据在操作层面应是:将信息数据化,然后在第一维度(时间、年代等)、第二维度(地点、地区等)和第三维度(种类、人群等)上收集数据,建立三维模型图,然后通过一定的计算机算法挖掘数据背后的现象和规律,并对未来趋势进行预测。
三、 本书得分及评论分析
1、豆瓣读书得分及评论
1)平台特点
豆瓣读书不是附属于哪个著名的门户网站旗下,其内容结构与运营方式也与门户网读书频道有很大差异。豆瓣成立于20xx年3月,创立者杨勃在美国呆了将近10年,一直喜欢看非主流的读物,豆瓣的创立源自于杨勃的一个简单的想法,就是“想知道有多少人在和自己看同样的书。”豆瓣的成立目的就是实现兴趣相同者之间的阅读分享与互动,在这个过程中,再帮助大家去发现更多自己不知道但是有价值的东西。因此,豆瓣在建立过程中,新书推介是一项任务,另一任务是帮助读者寻找兴趣相同者,建立起以书为介质,以人为中心的交流互动。这种以人为中心的交流互动组的建立,是对传统门户互联网读书频道以书为中心来进行交流互动的一种突破。因此,豆瓣不仅是一个读书网站、一个“图书馆”,还是一个读者俱乐部,一个以书会友的虚拟社区。它的商业属性比较淡,所以用户和书评的真实性较高。
2)本书的得分情况及分析
引擎搜“大数据”中第一位,豆瓣评分7.6,共1808人评价,书评77篇,读书笔记215篇。其中前十个书评中,5篇说文不对题表示失望,3篇内容在评论美国政务,1篇提炼知识点,1篇点赞(作者为 许倬云,史学大家、匹兹堡大学历史系荣誉讲座教授)。其中1000字以上的书评仅有2篇,其中1篇在评论中美政务,另1篇在批判作者挂羊头卖狗肉。
2、当当网读书得分及评论
1)平台特点
当当网是国内领先的B2C网上商城,成立于19xx年11月,以图书零售起家,已发展成为领先的在线零售商:中国最大图书零售商、高速增长的百货业务和第三方招商平台。20xx年12月8日纽约上市。
在图书品类,当当网占据了线上市场份额的50%以上,同时占据全国图书零售市场份额的三分之一。当当网的图书订单转化率高达25%,远远高于行业平均的7%,这意味着每四个人浏览当当网,就会产生一个订单。能做到图书零售第一,当当的杀手锏有许多,比如全品种上架、退货率最低、给出版社回款最快,也正是依靠这些优势,出版社给当当的进货折扣也最低,当当也因此有价格竞争优势。
2)本书的得分情况及分析 引擎搜“大数据”中第一位,商品评论12287条,商品问答9条,收藏人气8851。在“当当管理榜”排名第14位。
稍后和其他有关大数据的著作进行对比分析。
3、亚马逊读书得分及评论
1)平台特点
亚马逊中国是全球最大的电子商务公司亚马逊在中国的网站。
亚马逊公司是在19xx年7月16日由杰夫·贝佐斯([1] Jeff Bezos)成立的,一开始叫Cadabra。性质是基本的网络书店。然而具有远见的贝佐斯看到了网络的潜力和特色,当实体的大型书店提供20万本书时,网络书店能够提供比20万本书更多的选择给读者。
2)本书的得分情况及分析
引擎搜“大数据”中第二位(第一位为舍恩伯格的《大数据时代》),商品评论225条。
稍后和其他有关大数据的著作进行对比分析。
四、与《大数据时代》一书的数据对比分析。
在当当网中搜索“大数据”得到以下书籍:《大数据时代》、《大数据营销》、《大数据思维与决策》、《大数据云图》、《决战大数据》、《大数据变革》等,其中第一和第二位的为《大数据时代》和本书,其他书籍销售量非常小,不在此作为比较。
红色为在对比数据下相对领先的部分。由此可见,作为第一本大数据的阅读书籍,《大数据时代》更具优势。