论文阅读报告

时间:2024.3.27

论文阅读报告

撰写人: 张胜 时间:10月9号

一、 标题

Parallel Spectral

Distributed Systems

二、 出处 Clustering in

IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE

三、 摘要

Spectral clustering algorithms have been shown to be more effective in finding clusters than some traditional algorithms, such as k-means. However, spectral clustering suffers from a scalability problem in both memory use and computational time when the size of a data set is large. To perform clustering on large data sets, we investigate two representative ways of approximating the dense similarity matrix. We compare one approach by sparsifying the matrix with another by the Nystrom method. We then pick the strategy of sparsifying the matrix via retaining nearest neighbors and investigate its parallelization. We parallelize both memory use and computation on distributed computers. Through an empirical study on a document data set of 193,844 instances and a photo data set。

四、 研究的问题

五、 研究的目标

六、 研究的方法

七、 文章结论

八、 备注

注:这部分主要是你对这篇文章的看法,哪些方面是值得借鉴的?哪些地方可能值得继续深入下去(改进)?


第二篇:论文阅读报告要求及范例


科技论文阅读报告要求:

1. 撰写科技论文阅读报告是对阅读的一个归纳和提炼,并针对这些问题提出自己的见解。

2. 中文撰写,1-3页,主要包括以下几点:

(1)论文要解决的问题是什么,该问题为什么重要?(Introduction和Motivation章节)

(2)论文提出了什么解决方案,效果如何?(Introduction,Design和Conclusion章节)

(3)论文提出该解决方案的动机是什么?(Introduction和Motivation章节 *重要)

(4)论文提出的解决方案有何不足之处?(Design和Performance及自己的见解 *重要)

(5)以前解决该问题有哪些方法,有何不足之处?(Related Work章节)

(6)针对该问题你是否有更好的解决方案?(自己的见解 *重要)

其中第(4)点和第(6)点是论文阅读报告的重点,需要通过阅读论文和分析提出自己对于该问题更加深入的理解和认识。

3.每个人阅读的论文不同,根据需要还可以参考阅读其他相关论文,相互之间可以讨论,但论文阅读报告的撰写必须个人独立完成,最后需要同时提交电子版和打印版。

4. 附录是一个论文阅读报告的范例,供大家参考。附件中另两篇论文介绍了如何有效地阅读一篇科技论文。

近三年的FAST会议论文可以从以下链接找到:

FAST’09: http://www.usenix.org/events/fast09/tech/

FAST’10: http://www.usenix.org/events/fast10/tech/

FAST’11: http://www.usenix.org/events/fast11/tech/

或者:ftp://218.193.53.74,用户名:stuwsz(密码为空)

注意:

每个人根据个人兴趣选择一篇论文下载并阅读,然后完成阅读报告。为了保证所有人的题目各不相同,大家确定文章后及时发邮件(suzhen@xmu.edu.cn)通知我,务必在邮件中写清楚姓名、学号以及文章题目,我会在FTP上将你的姓名标注在该文章上,其他人不得再选。如有多人选择同一篇文章,则根据邮件的先后顺序取舍。

《信息存储技术》论文阅读报告 范例

姓名:*** 学号:***********

A. 论文的基本信息:

Suzhen Wu, Hong Jiang, Dan Feng, Lei Tian, and Bo Mao. WorkOut: I/O Workload Outsourcing for

Boosting the RAID Reconstruction Performance. In Proceedings of the 7th USENIX Conference on File and Storage Technologies (FAST 20xx), San Francisco, CA, USA, February 24-27, 20xx, pp. 239-252.

B. 论文要解决的问题及其重要性?

在磁盘阵列中,当某个磁盘发生故障后,磁盘阵列需要在线恢复故障盘中的数据到备份磁盘中,这一过程称为磁盘阵列在线重建。论文要解决的主要问题就是如何提高磁盘阵列在线重建性能,同时优化重建过程中用户的响应性能。

由于在以磁盘阵列为基础的大规模存储系统中,磁盘数量是相当大的,最近的研究表明在大规模存储系统中磁盘故障发生的概率是非常高的。因此磁盘阵列的在线重建也是一个经常性发生的事件,并且磁盘阵列在线重建的性能直接关系到存储系统的可用性和可靠性,如何快速的恢复失效的数据块并最低化对用户性能的影响是一个非常重要的研究问题。

C. 论文提出了什么样的解决方案,效果如何?

针对磁盘阵列的在线重建问题,论文提出了WorkOut方法。WorkOut利用请求重定向技术将来自用户的写请求和热点读请求重定向到代理磁盘阵列中,从而可以减轻重建中磁盘阵列的负载,以加快重建过程。同时由于重定向到代理磁盘阵列的请求没有收到重建的影响,用户的性能也提高了。WorkOut主要包括5个模块:

? 用户接口模块(Administration Interface):为系统管理员配置WorkOut的参数而提高的用户接口;

? 热点数据识别模块(Popular Data Identifier):识别在线重建过程中用户的热点访问数据; ? 请求重定向模块(Request Redirector):处理重建过程中用户请求的定位,将这些请求按照WorkOut策略发送到对应的存储设备中;

? 回收模块(Reclaimer):当磁盘阵列重建完成后,从代理磁盘阵列中回收所有的被重定向的写数据到完成数据重建的磁盘阵列中;

? 代理设备空间管理模块(Surrogate Space Manager):对代理磁盘阵列中的空间进行管理,并控制被重定向的数据在代理磁盘阵列中的数据布局方式;

通过对WorkOut的原型系统的测试,对比现有的磁盘阵列重建算法如PR和PRO,WorkOut可以减少重建时间1.26到5.89倍,减少用户响应时间1.22到2.87倍。通过TPC-C的标准测试,WorkOut可以减少响应时间46.6%和36.9%,减少重建时间15%。同时,WorkOut还可以适用于磁盘阵列的同步、磁盘擦洗等其他后台任务。

D. 论文提出该解决方案的动机是什么?

论文提高该解决方案的主要动机有以下三个方面:(1)最近的大量研究表明大规模存储系统中磁盘发生故障远高于预期,使磁盘阵列在线重建变得尤为重要;(2)磁盘阵列重建过程中用户的I/O请求和磁盘阵列重建的I/O请求是相互影响的。随着用户请求的强度下降,磁盘阵列的重建性能相应提高了;(3)通过对用户负载的访问分析发现,用户的访问是存在局部性的,即某些热点数据是经常被访问的。基于以上三个现象,作者提出了利用请求重定向的技术来加快磁盘阵列在线重建的性能。

E. 该解决方案有何不足之处?

通过对该论文的阅读,发现该方法虽然可以有效地加快磁盘阵列在线冲击的性能,但是也有一些不足之处:(1)对代理磁盘阵列的性能有一定的影响。因为重定向到代理磁盘阵列的用户请求会占有代理磁盘阵列中的磁盘资源,从而降低代理磁盘阵列本身的用户性能。在论文的4.3节中有介绍,当代理磁盘阵列是活跃的时候,WorkOut对其性能有23.6%到43.9%的影响;

(2)WorkOut方法不能简单地应用于单个磁盘阵列中。在单个磁盘阵列中是没有其他磁盘阵列的,所以用户的请求就没有地方可以重定向了,因此WorkOut只适用于包含很多磁盘阵列组的大规模存储系统中。

F. 以前解决该问题的方法及不足之处?

以前解决磁盘阵列重建问题的方法主要分为两类:(1)通过优化磁盘阵列重建算法来加快重建速度,如DOR、PR和PRO等。(2)通过改变磁盘阵列数据布局和请求调度来加快磁盘阵列重建性能,如Parity Declustering和FARM等。

但是以上这些方法都局限于在单个磁盘阵列内部来加快磁盘阵列的重建性能,没有考虑对用户的I/O请求进行优化,同时也没有考虑大规模存储系统中多个磁盘阵列组之间的协作。 G. 进一步的优化方法或问题扩展?

通过阅读该论文发现提高磁盘阵列的在线重建性能是一个非常严峻的问题。认真分析后觉得可以从以下方面来进一步优化:(1)在大规模存储系统中,可以智能地选择一个负载比较轻的代理磁盘阵列来重定向用户请求,从而可以减轻对代理磁盘阵列性能的影响。如果代理磁盘阵列本身的负载比较重,此时重定向的用户请求会加剧代理磁盘阵列的负载,从而同时降低代理磁盘阵列的性能和重定向过去请求的响应延迟;(2)当前以Flash为存储介质的固态盘已日渐成熟,如果将磁盘阵列中的磁盘替换为固态盘,由于固态盘固有的不同属性,这些已有的磁盘阵列重建算法是否适用于固态盘阵列?或者对于固态盘阵列是否有新的数据重建方法?

更多相关推荐:
论文阅读报告

题目注意:1.阅读一篇论文时,要始终带着疑问去读,首先搞清楚为什么要读这篇论文,这篇论文能给我们提供哪些帮助,针对论文提出的解决方案或者原型系统,要多想一想它们是如何解决问题的。2.所有的论文在阅读完成后,都需…

论文读书报告模板

读书报告模板使用本模板撰写时请按照蓝色提示定稿后请删掉蓝色提示大标题字体14号宋体居中加粗标题应准确清楚简洁地概括全文25个字以内标题内不应出现缩写字张三作者姓名宋体105号居中学号12345678专业工科试验...

论文类读书报告格式

读书报告格式读书报告一般写法是先介绍书的内容,然后谈自己的看法。读书报告具体要求格式如下:1、报告统一用A4打印稿形式提交;为节约资源,要求正反两面打印。2、报告要有封皮,上面必须写明文章题目、任课老师、上课教…

怎样写学术论文和读书报告

怎样写学术论文和读书报告一怎样写学术论文二为什么要练习读书报告三读书报告的基本格式四读书报告的要求五读书建议一怎样写学术论文写学术论文不难难的是事先明白它的要求形成按学术规范从事研究的日常习惯学术规范的日常化学...

读书报告论文格式

论文标题论文副标题仿宋GB2312四号或TimesNewRoman四号作者姓名楷体GB2312四号温州大学某某学院浙江温州仿宋GB2312五号325035摘要楷体GB2312小五号或TimesNewRoman小...

毕业论文阅读报告

封面可以参考开题报告阅读报告根据课程设计安排翔实地阅读了与毕业设计任务密切相关文献经过这段时间的学习已经掌握了载荷谱及其编制方法的国内外研究现状技术难点和技术关键点1载荷谱的研究内容载荷谱是指飞行器工程车辆等在...

论文阅读报告

论文阅读报告题名网络借贷p2p平台的成长模型的研究内容概要一研究内容P2P网络借贷平台是P2P借贷与网络借贷相结合的金融服务网站P2P借贷是peertopeerlending的缩写即由具有资质的网站第三方公司作...

物联网论文读书报告

读物联网与物流信息有感我的毕业论文题目为为了深入了解物联网的在物流领域的应用情况我阅读了王喜富教授的物联网与物流信息化一书王喜富教授是中国快递协会会员物流技术杂志指导委员会委员主要研究方向中包含交通运输信息技术...

研究论文阅读报告模版

研究论文阅读报告姓名学号专业类别阅读论文JMudigondaPYalagandulaMAlFaresandJCMogulSPAINCOTSDataCenterEthernetforMultipathingove...

论文开题报告

华东师范大学网络教育学院专升本毕业论文开题报告

论文修改报告

福州大学研究生论文修改报告

论文报告书

本科学生毕业论文设计开题报告书题目姓名徐波学号094080144院系数学学院专业数学与应用数学指导教师职称学历刘薇20xx年11月25日云南师范大学教务处制填表说明1指导教师意见由指导教师填写2开题小组意见由开...

论文阅读报告(45篇)