1 检索系统概述
一个典型的3D模型检索系统由三个子模块构成,模型表示、用户需求的表示和匹配算法。检索效率决定于这三个子模块共同工作的性能。
(1) 模型表示
模型表示时,需考虑两个问题:一是尽可能简单地和查询要求相匹配;能正确表示用户需求。
(2) 用户需求的表示
这涉及到将用户的需求信息转换成能正确地表达用户查询意图和适合于匹配算法的形式。这将会遇到两个问题: 用户需求信息和用于查询的请求之间的不一致;查询必须表达成系统中匹配算法能够理解的形式。
(3) 匹配算法
从特征等级来看,CBIR可以分为三个层次:,primary, structural,semantic。
Columbia University. Webseek: Content-based image and video search and catalog
tool for the web. http://persia.ee.columbia.edu:8008/, February 2005
Penn State/Standford University. Simplicity: Semantics-sensitive integrated
matching for picture libraries. http://wang.ist.psu.edu/image/, February 2005
University of Geneva. The viper project.
http://viper. unige.ch/research/cbir.html, February 2005.
[36] School of Mathematical and University of St Andrews Computational Sciences.
More definitions for associated curves. http://www-groups.dcs.st-and.ac.uk/ history/
Curves/Definitions2.html, February 2005.
[37] University of Texas at Austin. Cires: Content based image retrieval system.
http://amazon.ece.utexas.edu/ qasim/research.htm, February 2005.
开发了一个系统,并在这个系统框架中研究了特征提取方法,距离测量,索引策略,学习算法和相关反馈等问题。具体包括以下方面:
1.选择表达模型视觉内容的最佳特征
2.为对应的特征选择相似性测量方法
3.设计多维索引策略:用聚类算法减少特征的维度
4.设计外部学习算法,该算法用相关反馈的方法提高系统性能
5.设计显示更新策略,
主要贡献:
1.提出并实现了两种应用相关反馈的检索策略
2.测试了不同的视觉特征和相似度测量方法的组合,寻找了一种最佳的符合人类视觉的特征和测量方法的组合
3.应用聚类实现了一种新的多维索引方法
4.提出一种新的聚类算法,并展示了应用相关反馈信息进行更新的策略
5.实现了系统框架
背景一章先介绍系统框架,每个系统组成部分介绍,设计系统需考虑的问题和每个问题可能的解决方案,提出本文要解决的问题。
1.1 High-dimensional pattern analysis in multimedia information retrieval and bioinformatics.pdf
介绍检索系统中机器学习方法的应用,特征选择和学习方法,以介绍方法为主,在检索系统中的应用为辅,比较适合本论文的思路。可鉴戒写法。
介绍:
基于学习的检索系统应关注的几个问题:维度高、训练数据少、
1.2 Improving high-dimensional indexing for content-based image retrieval.pdf
本文介绍了检索系统中相关问题的数学描述,多种特征提取方法和距离计算方法,总结了索引方法,并提出改进,广泛地对多种特征提取方法和距离计算方法以及索引方法进行了比较研究。聚类索引介绍?
1.3 Improving the performance of content-based image retrieval systems.pdf
1.4 Information retrieval and mining in high dimensional databases.pdf
生物学上DNA分子的结构分析就属于3D模型分析。下载工具箱www.cis.njit.edu/~discdb
基于内容的检索系统涉及到的问题:数据管理系统、模式识别、信息获取方面(相关反馈、查询处理、相似性判断)
基于内容的检索系统的结构
研究问题
多种检索方法中语义检索是最高级别的,要实现语义检索,通常有两种方式,一是通过人工标示,这种方法缺陷是工作量大和人工语义标示的不一致性;另一种方法是通过相关反馈的方法不断学习以实现语义标示,可以使用机器学习的方法。
检索系统中用分类方法实现语义分类,减少人工语义和特征表示之间的隔阂。用聚类方法实现高效索引,同时也可以实现语义分类的功能。
2 论文题目:
3D模型检索的相关技术研究
基于机器学习三维模型检索的一些相关技术研究
径向基神经网络在3D模型检索中的应用研究
随着计算机硬件尤其是图形扫描设备和图形处理硬件性价比的提高,以及几何造型软件的普及,越来越多的三维模型在各个领域中得到了广泛地应用。如工业产品的模型设计、虚拟现实、3D游戏和模拟仿真等。特别是在互联网上,有大量共享的三维模型。研究和开发三维模型搜索引擎帮助用户快速、准确地找到自己所需的三维模型,是一个迫切需要解决的问题。
以三维模型为代表的数字几何称为新一代媒体,在互联网的背景下,三维模型的应用提出了以模型内在特征为基础的三维模型检索问题,这是基于内容的二维图像检索的新发展。
提出基于关系的软构件分类方法。根据软构件刻面分类法的特点改进了自组织特征映射神经网络聚类算法,以克服原有的聚类结果与输入样本次序有关和网络结构需要预先确定的缺点。将改进后的聚类算法与刻面分类法相结合,在同一刻面下利用改进的SOM聚类算法对构件的描述信息进行分类,
第二篇:阅读总结
AA 语言重现:(以特殊关键词:人名,地名,时间,数词-数词有时以forty percent形式出项AB 语言重现:(关键词A在原文中以同义词B的形式出现,主要考单词量,凭理解定位)关系语言重现:(把定位对象从“词”上升到“句子”)利用因果关系
转折信号词:but, yet, however, whereas, in fact, conversely
让步信号词:前后的关系也是相反,though, while, albeit虽然, notwithstanding,despite
并列信号词:阅读中碰到复杂的大并列时,先看连词后面的内容,如果连词后面是动词,回上文
找并列的动词,如果是adj,就找adj性的词包括-ing/-ed分词。
比较信号词:分类比和对比,理解比较双方(和什么比),比较点(比较什么)及比较方向(结 类比-比较相同点:as?as, like,similar, parallel平行的类似的
对比-比较不同点:more than, unlike, on the other hand, in contrastwith
举例信号词:信号词前后的意思相同, for example, like, such as, 破折号,冒号因果信号词:大因果(表示原因和结果的陈分都是句子)
原因because, in that, as, since;结果so (that),therefore, thus,hence, as a
result, consequently, as a consequence 可以表示因果关系,看到前面要注意后面;看到后面注意前面
小因果(表示原因和结果的是动词词组或介词词组)题型:
单选题:(要把所有的答案都看好,有可能有两个接近的答案,不要看到一个大概对的,其余选项都不看了)
单选题如果是文章第一种题型,一般对应文章前半部分;是第三种题型,就对应 同义词替换的往往是正确选项,而照抄原文的往往是错的
做标题题时,回看第一段以及注意第一句。
当提干意思模糊,无法定位时,要注意被选项中的关键词
出现了绝对词的90%不是答案all, most, only, must, always, usually,greatly,
出现比较级的90%不是答案
多选题:(文章中的多项并列,时间空间顺序,因果关系,递进关系都是多选题的出题点 多选多的答案在原文上往往集中在一起;
与原文特别一致的选项要引起怀疑,可能是错的,正确的选项往往是原文的改summary填空题:(关系词-预测-定位词:关系词的并列、因果、转折等关系很重要) (注意原文和题干的同义词、正反意词互换)
判断题:(做判断题,一般同时定位两道题)
ture: AA 语言重现(用词,结构,含义等方面都与原文保持一致)-true
AB 语言重现:(用词,结构不同,但含义相同)- true 同意表达比较多 the finding suggest=there is evidence that...
题干是原文的归纳和总结 -true
eg.原文:Compare our admission inclusive fare and see how much you save. Cheapest isnot the best and
value for money is guaranteed. If you compare our bargain :Daybreak fares, beware--most of our
competitors do not offer an all inclusive fare. daybreak收费更高,服务更全false: 题干与原文意思相反,矛盾- false
题干与原文不明显的矛盾- false
eg.women have also less job security and fewer oportunities forpromotion.
High status jobs, even in industries which employ mostly women, tend tobe
filled by men.
题干偷换原文的概念:A+B+C=>A+B+D 题干把原文某一成分换成了毫不相干的一部分-false 原文为人们对与于某样事物的理论或感觉,题目则强调是客观事实或已被证明。原文强调是一种
“理论”或“感觉”feel及theory,题目强调是一种“事实”,常有fact及prove等词。
原文:But generally winter sports were felt to be too specialized. 修饰语在数量,范围,程度,频率等方面差别明显(要特别敏感这些用词变化)-false
原文中包含条件状语,如if、unless或if not也可能是用介词短语表示条件状语如in,with,but for或exept for。
题目中去掉了这些表示条件状语的成份- false
eg.原文:The Internet has often been criticized by the media as a hazardous tool in 原文提供了多种可能,而题干限制了一种,多伴随绝对词- false
A,B,C-only A/only B/only C (如果题干中没有only,答案应选true)
原文中说某个学科是要解决某些某些问题,但题目中说解决了很重要的问题。-not given:先判断Ture和false, 都不是就是not given
题干的内容原文没提到- not given
原文所说是不确定的内容,而题干却作出确定的结论或推理 ?=>A -notgiven
eg. ?is one of the largest in the world. 题:? is the largest - not given 原文是some,many,题干是most-not given
题目中涉及的范围小于原文涉及的范围,也就是更具体。原文涉及一个较大范围的范筹,而题目是一个具体概念。
也就是说,题目中涉及的范围比原文要小。
Eg.原文:Our computer club provides printer.题目:Our computer club provides color 原文是某人的目标、目的、想法、愿望、保证、发誓等,题目是事实。原文中常用aim(目的)、purpose(目的)、
promise(保证)、swear(发誓)及vow(发誓)等词。题目中用实意动词。 TIPS:
虽然原文有重现,题干内容却和原文无关-not given
一次记忆两道判断题回原文寻找
出现绝对词的判断提多选 false
原文没有比较,而题干作比较时或最高级- not given
如果题干时复合句,要特别注意里面的关系(分析因果关系等和原文是否一致) 题干和原文一个说比例关系,一个说数量关系- not given (eg. Majority,most,minority) 原文中总量的多与少,推不出题干中部分的多与少 -not given (A+B=10=>A=5- 原文讲假设(assumption), 推测(prediction),记录(record),题干说事实-not given
eg. Records show that 100 pagodas crumbled over the past 10 years.
one of the greatest film artists say 这是部好电影,不等于this is one of 原文中虚拟语气表假设,题目中现在完成时- not given
标题选择题:(50%的标题是对第一句话的同意改写,干扰选项的特点是:段落中未展开说明的细节。)
(主题句:第一句-第二句-最后一句-中间句)
(如果需要阅读整个段落,应重点阅读该段落中的重点词句 A. 反复出现的 TIPS:
注意转折、让步、对比结构中实际要表达的意思
注意文章与选项之间的同义词或原文反复强调的内容(有时选项的用词是原文重 定义型句子(This is?;This A is?)很可能是标题
注意原文和选项中包含的数字、比较、原因或结果关系
简答题:时间要写上AM,PM eg.8:00am; 数词和单位:$25million;
答案涉及数字的,一般要有简单的四则运算:eg. 原文:All major cities there havehigh car ownership, but well-
developed bus and rail systems are available, and overall public transport typicallyaccounts for between 20 and 30
percent of passenger-kilometers. 题目:What proportion of passenger kilometer isundertaken by private automobile in
句子填空题:按照填空内容,摘要也可分为三种:原文原词、从多个选项中选词和自己写词。原文原词的题目要求中常有
from the Reading Passage 的字样。若从原文选词,只能选原文中连续的几个词,不能改变它们的顺序
eg.原文为 advances in the technology,答案不可能是technology advances 若要求从原文选词,越是生词,越可能是答案 注意题目要求中是否有字数限制,如Use ONE OR TWO WORDS等
从选项中选词,要注意看题目要求是写答案本身,还是写选项前的代表字母。 从选项中选词,答案与原文的六大对应关系。
有时所需填空单词会在填空文章的后面出现
(1) 原文原词:与原文完全相同的词或短语;(2) 词性变化:原文为 选择的答案有两个比较可能,要好好比较原文中的内容。
图表填空题:(要注意所填内容的形式:大写、ing形式)
配对题:(配对题的选项可以复选)
因果关系配对题:要回原文找到对应的句子,注意AB重现 (一般按原文先后顺 正反比关系配对题:PR,NR,L/N,NI
从属配对题,作者、观点配对题:第一题往往对应文章的后几个观点,最后一题对应前面的)先做会做的简单的题,再回过头会做的题,特别是判断题。
原:?is popular in city and suburb.题:? is only popular in city.- false原:?is popular in city. 题:? is only popular in city.- not given
cent形式出项,生词为主)及比较方向(结果)