齐鲁工业大学实验预习报告 课程名称:数据分析与数据挖掘指导老师:张丽实验日期:
院(系):信息学院专业班级:物联网13-2 实验地点:机电A 508 学生姓名:黄培菲学号:201303041045同组人:
实验项目名称:MATLAB综合实验
一、实验目的和要求:熟悉MATLAB的工作环境,学会使用MATLAB。
二、实验原理:
三、实验方法与步骤:
1、启动MATLAB,熟悉MATLAB的桌面。
2、在命令窗口执行命令以完成以下运算,观察workspace的变化,记录运算结果。
1)在MATLAB中建立矩阵??573??,并将其赋予变量a,
?491?
?535??242?????2、计算矩阵?374?和?679?之和并赋值给c
??798????836??
3、角度x=[30 45 60],求x的正弦、余弦,并在同一个窗口中绘制sin(x)和cos(x)
4)写一个函数,实现求数组中所有数值的平均值的功能。
5)读入“chapter12_wine”,绘制第二列到第七列,第4行到第10行数据的条形图(bar),修改标题为“葡萄酒参数比较”,x轴修改为name数据中具体的葡萄酒名称。并保存该图片为png格式。
四、实验数据记录表格
五、预习遇到的问题
第二篇:数据挖掘大作业结果分析报告
数据仓库期末作业 - 数据挖掘分析报告
某药店常用药品信息数据挖掘解决方案
作 者 刘金龙
学 院 计算机信息管理学院
专 业 计算机科学与技术
年 级 2011
学 号 112103209
某药房常用药品价格、产地的数据挖掘解决方案
一、 提出问题
1、单位基本情况及相关业务流程介绍;
对于药店,储存大量的常用药品是必不可少的工作,随之而来的对药品的数据信息管理和储存成为了令人头疼的问题,在接到货源后,工作人员需要统计药品产地和价格的信息,为以后的货源供给地,用合理的价格出售药物,是至关重要的工作。
2、单位存在的问题。
由于货物种类、名称众多,在短时间内分析好相关数据几乎不可能,大量的数据,依靠人力或是非数据统计软件进行统计工作,事倍功半。严重影响药店的正常进货,出售药品的工作。
二、 分析问题
1、对该单位存在的问题进行分析;
由以上问题可见,利用数据挖掘进行相关数据的统计和整理工作,简单、省时、有效。
2、解决问题的可能途径和方法。
利用SQL SEVER 导入数据,再提取统计分析结果,很快会得到想要的数据分析结果。
三、 利用数据挖掘技术解决问题
1、设计数据挖掘算法;
决策树;
数据关联;
神经元算法;
2、对挖掘结果进行深入解释和分析
由此图可以看见在不不同的产地,由于地理因素和特产药品的原因,在药品相关的植物盛产区,进货比较便宜。
此图可以分析出,不同的消费人群对于同类的药品的购买需求,对于同样的功能的药,药存储不同价格的种类,以满足广大消费者的需求。
此图可以分析以前的销售结果,哪类、什么价格的更受消费者欢迎,方便以后进货。
四、 总结
通过自己的实践,对数据挖掘有了新的认识。简单来说,数据挖掘是基于“归纳”的思路,从大量的数据中(因为是基于归纳的思路,因此数据量的大小很大程度上决定了数据挖掘结果的鲁棒性)寻找规律,为决策提供证据。从这种角度上来说,数据挖掘可能并不适合进行科学研究,因为从本质上来说,数据挖掘这个技术是不能证明因果的,以一个最典型的例子来说,例如数据挖掘技术可以发现啤酒销量和尿布之间的关系,但是显然这两者之间紧密相关的关系可能在理论层面并没有多大的意义。不过,仅以此来否定数据挖掘的意义,显然就是对数据挖掘这项技术价值加大的抹杀,显然,数据挖掘这项技术从设计出现之初,就不是为了指导或支持理论研究的,它的重要意义在于,它在应用领域体现出了极大地优越性。一下是我参阅资料总结的设计数据挖掘的步骤:
① 理解数据和数据的来源
② 获取相关知识与技术
③ 整合与检查数据
④ 去除错误或不一致的数据。
⑤假设数据模型。
⑥ 实际数据挖掘工作(data mining)。
⑦ 测试和验证挖掘结果(testing and verfication)。 ⑧ 解释和应用(interpretation and use)。
由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化、数据格式转换、变量整合,以及数据表的链接。可见,在进行数据挖掘技术的分析之前,还有许多准备工作要完成。