选题报告
一、课题名称:
大数据时代的数据挖掘
二、选题动因: 大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
但是,要实现这一切,离不开数据挖掘。
数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
在大数据时代,存在大量的信息需要去处理,而如何高效地利用这些大量的信息,并从中发掘对自身有用的信息,更是现在所迫切需要的。
三、主要内容:
1. 大数据时代的发展与形成、以及其中所蕴含的价值。
2. 数据挖掘的四个发展阶段(电子邮件阶段、信息发布阶段、电子商务阶段、全程电子商
务阶段)。
3. 数据挖掘的实际应用案例分析。
4. 数据挖掘的基本分析方法和步骤。
5. 现阶段的数据挖掘工具。
6. 数据挖掘的前景、及方向研究。
7. 数据挖掘过程中的隐私保护和法律问题。
四、研究的技术路线:
1. 背景研究:大数据时代与数据挖掘理论背景,以及现实需求分析,了解国内外相关领域
的研究现状。
2. 目的和意义:分析该课题的研究是要解决什么问题,有什么实际意义和应用价值。
3. 成员分工。
4. 初步调查:通过文献搜集、市场调查等方式进行相关信息的搜集和整理。
…… …… 余下全文