图书馆对学生学业成效贡献的大数据分析平台构论文

时间:2023.8.6

  高校图书馆因拥有丰富的数字资源和良好的学习环境,成为学校师生学习和休闲的重要场所.学生作为高校图书馆服务对象主体之一,其学业和高校图书馆所提供的服务必然存在一定的关系,因此图书馆对学生学业成效贡献研究是指导高校图书馆投入产出的重要组成部分

  大数据技术作为一种新兴的海量数据分析工具越来越受到各行各业的重视.互联网企业Google及Facebook之所以取得令人瞩目的成绩,其核心的本质就是其公司记录和分析了用户的行为大数据,从而精确掌握用户行为并形成预判.

  由此可见,大数据技术对于海量、高速发展的数据具有很好的分析和管理能力,它被用来研究图书馆用户行为的“大数据”是最佳选择,研究成果可以为高校图书馆服务决策提供客观的依据,具有重要理论研究意义和实际应用价值.

  1大数据技术

  大数据技术是一系列收集、存储、管理、处理、分析、共享和可视化技术的集合.大数据的关键技术有很多,如借鉴生物界的进化规律演化的随机化搜索方法已被人们广泛应用于组合优化、机器学习、信号处理、自适应控制等领域;再如分布式技术包含分布式文件系统、分布式数据库、分布式计算框架等,其已经全面运用于各类大数据应用中.大数据价值的完整体现则需要多种技术的协同,总的来说可以归纳为以下几种:

  (1)分布式技术.最典型的是Apache基金会的Hadoop大数据分布式处理软件框架,主要延续了Google分布式文件系统GFS的开源思想、分布式计算框架MapReduce和分布式数据库BigTable的实现机理,开发了自有的产品--HDFS分布式文件系统、MapReduce分布式编程框架和HBase分布式数据库.

  (2)大数据预处理技术.大数据的一个重要特点是多样性,这就意味着数据来源极其广泛、数据类型极为繁杂,这种复杂的数据环境给大数据处理带来了极大的挑战.所以在分析大数据前,首先必须对海量数据源进行预处理,以保证数据质量及可信性.

  大数据挖掘技术.数据挖掘是整个大数据处理流程的核心,因为大数据的价值产生于挖掘过程.数据挖掘就是从大量的、不完全的、有噪声的、模糊的、P逭机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程.大数据挖掘的算法众多,其中(1)以分类算法、聚类挖掘算法、关联挖掘算法、序列挖掘算法最为主流.

  2围书馆大数据分析面临的问题及数据构成

  2.1图书馆大数据分析面临的问题

  大数据时代的图书馆读者行为大数据具有数据海量、类型复杂、处理速度快和价值密度低的特点,要对这些大数据进行统一的存储与分析,对图书馆来说有着极大的挑战性.以下是3个亟待解决问题:⑴数据的存储能九学生在图书馆的所有行为活动都将产生数据,数据量已由TB级升至PB级,而且还在源源不断地增加,数据量的增长速度已远远大于存储能力的增长速度.(2)数据类型复杂繁多.学生对图书馆的利用行为数据不仅仅是简单的二维表格式存储的结构化数据,还有以文本、图片、XML文档、JSON文档、日志文件和音频/视频等半结构化和非结构化数据,关系型数据库已经无法有效管理这些数据.(3)数据处理的实时性.大数据时代强调的是数据处理的及时有效,图书馆要求大数据分析平台可以快速地获取、存储和分析学生的行为数据,为图书馆提供快速的决策支持.

  面对上述问题,传统数据分析工具已不再适合,而Hadoop大数据分布式存储与计算框架能很好地解决了这些问题,因此基于Hadoop建立统一的图书馆大数据存储和分析平台变得尤为迫切.

  2.2图书馆大数据的构成分析

  针对目前宁波大学在校的本科学生,将其对图书馆利用行为和学业成效相关数据(2010?2014年)作为此次实验的数据源.经过分析,确定数据源由学生个人信息、学生学业相关数据及图书馆利用行为数据三部分组成,数据类型包括结构化的二维表数据和非结构化的日志数据,数据总量共计6108万条记录.其中,学生学业相关完整数据有120万条记录;图书馆利用行为数据包括从图书馆门禁系统(357万)、阅览室座位管理系统(320万)、图书借阅系统(247万)、数字资源访问日志(5064万)等途径获取学生的图书馆服务数据共计5988万条记录,为图书馆服务对学生学业成效贡献研究提供基础的大数据参考样本.

  从上述统计来看,实验涉及到的数据量级已在十亿字节以上,而且还在随着时间的推移成线性增长,因此定期将相关系统中每天生成的数据导入Hadoop大数据平台成为必然的选择.目前此次实验数据的收集整理工作已经基本完成,初步拟定大数据主题分析的内容见表1.

图书馆对学生学业成效贡献的大数据分析平台构论文

  高校大学生学业成效主要由学业成绩、奖励情况和科研能力三部分组成.学业成绩主要是学生的在校的各类专业课和选修课的考试成绩积点分,奖励情况是在校期间参加社团活动、校级活动等获得的奖励或荣誉称号,科研能力是指参与科研项目或发表论文等.

  图书馆利用行为此内容,并综合已有的相关研究关注的内容,再结合宁波大学的实际情况,考虑选取以下几方面:(1)X寸纸质馆藏的利用,包括入馆记录(室内阅读情况)和借阅记录等;(2)对阅览室的利用,包括入室记录和在馆时间(座位管理系统记录情况)等;(3)数字资源的利用,包括数据库检索次数和全文下载次数等;(4)其他,如对网络的利用等.

  上述是高校图书馆服务对学生学业成效贡献研究中主题分析的相关内容,但在实际的分析建模过程中,可以进行适当的取舍或增加.

  3图书馆成效贡献的大数据分析平台构建

  3.1图书馆大数据分析平台的总体架构

  基于Hadoop的图书馆大数据分析平台主要分为两层一大数据预处理层和主题模型构建层,自下往上每层都为上层提供服务.整体的架构设计如图1所示.

  3.2图书馆大数据预处理方案的设计

  图书馆大数据预处理层主要是利用Hadoop集群在存储和计算能力的优越性,并结合大数据预处理技术,来对学生图书馆活动及学业数据进行预处理?具体的设计方案流程如图2所示.

  整个方案采用分层设计思想,底层是Hadoop分布式平台层.目前实验采用10台Linux操作系统的普通服务器机子,并分别在每台机器上安装JDK、SSH、Hadoop和Hbase,搭建Hadoop完全分布式运行环境.整个集群规划为:NameNode:10.22.102.46,DataNode1~DataNode9:10.22.102.47?10.22.102.55.HDFS是分布式计算的存储基础,主要用于存储学生图书馆利用行为和学业成效相关源数据氣其采用Master/Slave结构,集群包括1个NameNode和多个DataNodes,NameNode负责整个集群的任务调度分配,DataNode则是存储实际的数据?MapReduce过程是把从HDFS中待处理的学生图书馆利用行为和学业成效相关源数据集分解成M个小数据集进行并行Map操作,输出中间态键值对<众,value〉,然后根据众值进行Group操作,形成新的小数据组集<々,list(value)>,最后将这些小数据组集分割成R个集合,进行Reduce操作后存储到分布式数据库中.Hbase是个基于列存储的分布式数据库,数据行有3种基本类型:行关键字、时间戳和列,行关键字是数据表的唯一标示.海量的学生图书馆利用行为和学业成效相关数据通过MapReduce计算后,可以A:值作为行关键字进行分布式存储,实现海量数据的存储与管理功能.

  在Hadoop层之上,则为相应的大数据预处理模块,可以透明地调用Hadoop底层的计算和存储能力,包括数据清理、变换、集成及归一化4个子模块.数据清理是删除那些不符合要求的记录.数据集成是将来自不同应用系统中的数据源合并到一起,形成一致的数据存储.数据转换是将学生学业相关数据和图书馆相关应用系统中的数据用一定的格式来表示,以方便后期做关联挖掘.归一化处理是把数据值控制在一定的范围内,保证程序运行时收敛加快.最终将处理好的数据通过接口或其他方式输出.

  3.2图书馆服务对学生学业成效贡献的主题模型

  构建思路

  图书馆服务对学生学业成效贡献的主题建模主要是利用大数据挖掘算法对相关数据进行深入分析挖掘,精确发现数据之间的关联关系,构建相应的主题分析模型.具体的分析挖掘过程如下:首先选择合适的聚类算法将学生群体和图书馆服务资源数据按照一定的规则分割成不同的集合,分析不同集合表现出的特征;其次利用关联规则挖掘算法对主题分析的内容进行关联挖掘,分析各项数据之间存在的关系;最后采用决策树分类算法做一些预测性主题分析?

  最终拟定图书馆服务与学生学业成效的主题模型主要从以下几个主题分析方向进行构建:

  (1)各学院在某学年/学期学生整体学业成效情况分别与对图书馆利用行为(学院平均进出阅览室时长、借阅次数、数字资源利用)的相关性分析.

  (2)各专业在某学年/学期不同班级间学业成效分布情况与对图书馆利用行为(班级平均进出阅览室时长、借阅次数、数字资源利用)的相关性分析.

  (3)相同专业学业成效相差较大的个人与对图书馆利用行为(个人进出阅览室时长、借阅次数、数字资源利用)的相关性分析.

  (4)图书馆不同的资源服务(纸质馆藏、阅览室利用、数字资源等)对学生学业成效贡献的比重进行分析.

  此外,在上述主题分析中分别加入控制因素(性别、生源地以及高考成绩),分析它们与学生学业成效的相关性,建立相应的主题关联模型,达到指导服务决策与优化资源配置的目的,最终更好的为用户提供服务资源.

  4结语

  高校图书馆对学生学业成效贡献的研究,以学生作为研究主体,以学生的学业成效作为关注目标,提出基于Hadoop开源平台与大数据技术进行分析与主题建模,探索学生对于图书馆的利用与其学业成效之间的关系.在整个主题模型构建过程中,将一些控制因素加入到图书馆与学业成效的关联分析中,根据分析结果可以反过来指导完善图书馆服务对学生学业成效贡献主题模型的构建,从而更全面地对高校图书馆资源与服务在帮助学生提高学业成效方面的作用进行考察.最终的研究成果可指导图书馆进一步将服务嵌入到学生学习的每一个细节处,并以此为依据提升图书馆服务的质量与水平.


第二篇:图书馆与学生社团联合共建校园文化论文


  一、图书馆为社团活动提供资料和数据信息

  社团作为学生自愿组成的团体,在具体活动过程中往往需要资料和数据的支持,而图书馆则成为了书刊资料和数据信息的最佳收集地。在图书馆中,具有最丰富、最全面、最新的理论知识,这为科技型社团、学术性社团的发展提供了莫大的支持。在实际工作过程中,图书馆应当充分发挥自身作为资料和数据库的特点,主动根据社团的需要收集期刊、书籍和网络资源,服务于社团的同时,也提高了图书馆资源的利用效率。如,为“摄影协会”成员提供各种摄影相关书籍;为“天文爱好者协会”提供天文相关知识的书籍和数据等。

  二、图书馆为社团活动提供场地

  学生社团若要发展,就必须要不定期的开展相关活动。活动的开展,必然涉及到资金、场地等方面的问题。图书馆的场地面积充足,人流量大,可以为学生的社团活动提供较为理想的场地。因此,选择图书馆作为社团活动的场地,能够达到较好的前期宣传效果,也可以大大提高学生的活动参与度,促使社团活动圆满成功。因此,若社团在开展活动时遇到场地不足等问题,可以积极寻求图书馆的帮助,同时,图书馆作为构建校园文化的重要机构之一,也应该积极支持社团的活动,在条件允许的情况下,为社团活动在场地等方面提供便利。比如,图书馆可以为电脑爱好者协会提供微机房等场地,也可以在宽敞的图书馆大厅开展书法展、摄影展、油画展等,还可以为诗歌爱好者协会提供诗歌创作的场地等。

  三、公益性社团服务于图书馆

  所谓的公益性社团指的是爱心服务型的社团,他们通过自身的无偿服务为他人提供便捷。在高校中,公益服务性社团主要包括了青年志愿者等。高校图书馆作为校园文化的重要组成部分,其运转不仅需要图书馆全体员工的大力支持,同时也需要青年志愿者的热情帮助。在日常工作中,青年志愿者可以积极加入到图书馆的管理中,帮助图书馆整理书架、打扫卫生等等,这不仅为社团活动提供了机会,也为图书馆的正常运行提供了服务。另外,公益性社团还可以从其他角度为图书馆的读者提供更加便捷的服务,比如,公益服务社团可以为图书馆读者提供笔和纸张的服务,以便于读者在检索图书以后方便记录和查找。也可以将一些热门书目的信息检索好后,放在图书馆的检索电脑旁,这样读者可以减少排队检索的时间。四、创建以图书馆为服务主体的社团目前,大多数高校都创建了图书馆自己的社团,团员由爱好读书,热衷于图书管理事业的学生构成,他们积极参与到高校图书馆的管理工作中,并负责与其他社团联系,联合举办活动,或是自助开展读书相关的社团活动,如读书月、书刊捐赠等。另外,他们还积极宣传图书馆,为图书馆提供服务,积极参与到校园文化构建的活动中。促进高校图书馆的发展,也为高校校园文化的发展做出了贡献。五、图书馆与社团联合开展文化活动随着社会和时代的发展,图书馆已经一改以往以“藏”为主的管理模式,而是转而成为以“用”为主的模式,不断提高图书馆各项数据信息和藏书的使用效率已经成为了图书馆管理的主要工作。但是,由于受到各方面因素的影响,高校图书馆部分藏书信息资源的使用效率一直处于较低的状态,如何改变这种现状,成为许多高校图书馆管理所面临的难题。例如,英文类的书刊在图书馆的使用中,使用率就一直处于偏低状态。这种现状与时下火热的英语辅导、英语讲座等显得格格不入。面对这种现状,高校图书馆应当主动出击,积极与学校的外语协会联系,形成联盟,共同举办种类多样的活动,积极提高图书馆中相关资料、书籍的使用效率。图书馆联合社团开展形式多样的活动,不仅是为了提高图书馆资料的使用效率,也不仅是对社团活动的支持,更是为校园文化的建设贡献力量。

  四、结语

  终上所述,高校图书馆联合学生社团构建校园文化,不仅能够促进学校社团的发展,还能够高校图书馆能够更具活力,这对构建和谐校园文化和提高高校学生身心素质都具有积极意义。因此,高校图书馆与学生社团应当在更广阔的领域开展合作,积极促进校园文化蓬勃发展。以上观点为笔者拙见,不足之处望相关专家学者指教,同时也希望本文能够达到抛砖引玉的作用,吸引更多专家学者深入到该领域的研究中。

更多相关推荐:
毕业论文总结 毕业致词 精选8篇

范文一:毕业论文的写作锻炼了我收集和整合信息的能力,从着手准备论题到实地调查再到整个论文的完成,凝聚着无数人对我的关怀和帮助,没有他们的支持和鼓励,我是不会这么顺利完成的。首先要特别感谢我的导师陶玉凤副教授,在…

汉语言文学专业毕业论文、调查报告写作要求

汉语言文学专业毕业论文撰写要求详细说明一、毕业论文的总体要求1、毕业论文的写作是“中央广播电视大学人才培养模式改革与开放教育试点”汉语言文学专业本科的教学环节之一,是整个教学活动的有机组成部分,是实施专业教学计…

矿山机电论文

论文选题说明及写作的初步设想一、选题思路:进入新的纪元以来,随着人类经济的迅猛发展以及科学知识的进步,我国的煤矿行业也进入了一个迅速发展的轨迹,各种新的技术运用到了煤矿行业的发展当中,尤其是矿山机电的发展更是迈…

课程论文个人小结

个人小结大学上到现在,做过了无数大大小小的论文,有学年论文,课程论文等,从未有过现在这样的完成论文的感触。做论文过程中的辛苦与难熬,完成后的喜悦和轻松,都化作最终的成果流露在字里行间。第一次以如此规模的团队做一…

渔政管理论文

浅谈渔业养殖预防污染的对策论文摘要渔业养殖是渔民致富的途径之一,而地方经济的发展忽视了环境保护,渔业污染事故侵害了渔民的权利、制约了养殖业的发展。从渔业污染事故调查入手,结合本地现状,提出了防止污染的探索性建议…

会计专业社会实践论文

今年的暑假与往年不同,今年暑假虽然没有往年那样自由,舒适,往年在假期几乎全部时间都是上上网,看看电视,过着无忧无虑的生活。热了有空调,困了就躺下休息,而今年则恰好相反,大部分时间都是在工作,而且很辛苦,但是我觉…

寒假社会实践论文-饮食店做服务员

寒假社会实践论文内容摘要:寒暑假给了我们大学生去社会做实践活动的机会,而现在的大学也鼓励学生利用寒暑假去参加社会实践,以拓宽学生的知识面、增加就业经验和提高社会阅历。为了锻炼一下自己,这寒假我去了一家饮食店做了…

电子商务网络安全论文

电子商务网络安全摘要:介绍了电子商务技术的发展,网络交易安全是电子商务发展的核心和关键问题,目前主要采用的电子商务安全防伪技术有:数据加密技术;认证技术;和安全认证协议。关键词:电子商务计算机网络安全措施商务交…

广播电视安全播出论文

广播电视安全播出浅析摘要:安全播出是广播电视技术工作的重中之重,也是值班人员的主要任务。是节目质量的保障关键词:安全播出电视技术广播电视系统是一个多方位、系统化的技术系统。采、编、播是主要的主成部分,而播出系统…

万能毕业论文致谢范文

范文一:我历时将近两个月时间终于把这篇论文写完了,在这段充满奋斗的历程中,带给我的学生生涯无限的激情和收获。在论文的写作过程中遇到了无数的困难和障碍,都在同学和老师的帮助下度过了。在校图书馆查找资料的时候,图书…

毕业论文周记

光阴如梭,转眼间大学已经到了尾声,也该决定毕业论文的选题了,经过了慎重的考虑,我最终确定了毕业论文的选题——环境保护与税收政策研究。生存与发展是一个世纪性的主题,它贯穿于人类社会发展的全过程,而且也成为21世纪…

毕业论文心得写论文的一点感受

写论文的一点感受qingshaojun0823【畅谈学术论文,分享科研经验】重奖征文活动自开始到现在已经快半个月了,有很多的朋友都来献上了宝贵的经验,得到了其他虫友们的好评,自己活动一开始,区长就跟我们说,活动…

论文(519篇)