数据收集和数据存储技术的快速进步使得各组织机构可以积累海量数据。然而,提取有用的信息已经成为巨大的挑战。通常,由于数据量太大,无法使用传统的数据分析丁具和技术处理它们。有时,即使数据集相对较小,但由于数据本身具有一些非传统特点,也不能使用传统的方法处理。在另外一些情况下,面临的问题不能使用已有的数据分析技术来解决。这样,就需要开发新的方法。
数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。数据挖掘为探査和分析新的数据类型以及用新方法分析旧有数据类型提供了令人振奋的机会。本章,我们概述数据挖掘,并列举本书所涵盖的关键主题。
数据挖掘技术可以用来支持广泛的商务智能应用,如顾客分析、定向营销、工作流管理、商店分布和欺诈检测等。数据挖掘还能帮助零售商回答一些重要的商务问题,如“谁是最有价值的顾客? ”“什么产品可以交叉销售或提升销售? ”“公司明年的收入前景如何? ”这些问题催生了一种新的数据分析技术。
医学、科学与工程医学、科学与工程技术界的研究者正在快速积累大量数据,这些数据对获得有价值的新发现至关重要。例如,为了更深入地理解地球的气候系统,NASA己经部署了一系列的地球轨道卫星,不停地收集地表、海洋和大气的全球观测数据。然而,由于这些数据的规模和时空特性,传统的方法常常不适合分析这些数据集。数据挖掘开发的技术可以帮助地球科学家回答如下问题:“千旱和飓风等生态系统扰动的频度和强度与全球变暖之间有何联系?”“海洋表面温度对地表降水量和温度有何影响?”“如何准确地预测一个地区的生长季节的开始和结束?”
什么是数据挖掘
数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探査大型数据库,发现先前未知的有用模式。数据挖掘还可以预测未来观测结果,例如,预测一位新的顾客是否会在一家百货公司消费100美元以上。
并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎査找特定的Web页面,则是信息检索领域的任务。虽然这些任务非常重要,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,人们也在利用数据挖掘技术增强信息检索系统
的能力。
数据挖掘与知识发现
数据挖掘是数据库中知识发现(knowledge discovery in database, KDD)不可缺少的一部分, 而KDD是将未加工的数据转换为有用信息的整个过程。该过程包括一系列转换步骤,从数据的预处理到数据挖掘结果的后处理。输入数据可以以各种形式存储(平展文件、电子数据表或关系表),并且可以驻留在集中的数据存储库中,或分布在多个站点上。数据预处理(preprocessing)的目的是将未加工的输入数据转换成适合分析的形式。数据预处理涉及的步骤包括融合来自多个数据源的数据,清洗数据以消除噪声和重复的观测值,选择与当前数据挖掘任务相关的记录和特征。由于收集和存储数据的 方式多种多样,数据预处理可能是整个知识发现过程中最费力、最耗时的步骤。
“结束循环”(dosing the loop)通常指将数据挖掘结果集成到决策支持系统的过程。
第二篇:自然科学导论_读书报告选题参考
1. 读书报告只能手写,不能打印,字数约2000字。若认定是抄袭,以0分记。
2. 15周统一上交给当时的任课教师,过期不收。
3. 原则上参考下列题目(可以修改)。个别同学有自己的想法,可以和老师交流。
1) 用一些事例谈自然科学与社会、人文、艺术等科学的关系。
2) 结合中外古代天文学的发展,谈谈对“杞人忧天”的看法。
3) 从科学发展史的角度谈思想自由对学术发展的重要性。
4) 谈个人对外星文明的看法。
5) 用事例谈关于伪科学的问题
6) 结合电磁理论的建立、电磁波的预言与发现过程中,谈谈你对科学理论的“实践——理论——再实践——再理论”的螺旋式循环形成规律的认识。
7) 结合电磁波技术对人类文明进步的促进作用及电磁波的危害,谈谈你对“科学技术都是一把又刃剑”的认识。
8) 结合“电磁波理论的创立开启了现代物理学乃至现代科学技术的大门”这一重要结论,谈谈你对加强基础科学研究的重要性的认识。
9) 结合物理学在经济、金融中的就用实例,谈谈开展交叉学科研究的意义与认识。
10) 从现代物理学的两大支柱理论——狭义相对论与量子理论——的创立发展过程,谈谈你对经济社会科学理论的
完善得到什么启示。
11) 谈谈对今年诺贝尔物理奖的感想
12) 为什么说牛顿是一位伟人
13) 为什么说爱因斯坦是一个伟人
14) 谈谈人类对宇宙的认识历程
15) 谈谈人类对时空的认识历程
16) 调查宁波市的环境状况
17) 谈谈适合宁波市开发使用的新能源
18) 空间的奥秘——从基本粒子到宇宙
19) 以照明设备的发展讨论自然科学在生活中的作用
20) 谈谈人们对于原子认识的过程
21) 试讨论自组织理论的主要思想。
22) 试依据耗散结构理论讨论复杂性的涌现。
23) 试依据分型理论讨论不规则结构的测量问题。
24) 十一据热力学第二定律讨论自然过程演化的方向性问题
25) 试讨论温度在自然环境中的决定性影响。
26) 举例说明纳米技术在军事、技术上的应用
27) 对比纳米技术在超导领域的应用
28) 简述纳米技术的研究发展进程
29) 气候变化对中国的影响
30) 气候变化中的挑战与机遇
31) “全球变暖”阴谋论的探讨
32) 人类活动对气候变化的影响
33) 简述气候数值模拟