基于语义检索的中医偏方库的应用研究开题报告

时间:2024.4.13

本科生毕业设计(论文)开题报告

    目:高校毕业设计选题管理系统的设计

    系: 信息技术学院                    

    业: 计算机科学与技术                

    级: 2009级计算机科学与技术班       

    号:                      

学生姓名:                             

指导教师:                            

20##年 11月 28


第二篇:模糊本体在关系数据库系统语义检索中的研究


大连海事大学

硕士学位论文

模糊本体在关系数据库系统语义检索中的研究

姓名:姜甲涛

申请学位级别:硕士

专业:管理科学与工程

指导教师:翟军

20100601

中文摘要

摘要

新一代互联网语义Web的提出,人们开始越来越关注带有语义的网络信息,语义Web研究的目的就是使网络中的大部分信息都是带有语义的,是计算机能够理解和处理的,这样就更加便于人机之间的交互。随着语义Web技术的发展,促进了语义Web中语义信息检索技术的成熟,从而使关系数据库系统中的语义检索成为了数据库检索领域中重要的研究方向。

查询是数据库很重要的功能,普通的数据库查询操作主要是采用字符串匹配,但是随着系统需求的不断提高,这种简单匹配的查询已经不能够满足人们查询要求。在数据库中已经有越来越多带有语义信息的数据,客观世界的信息也有很多是不完全的、不清晰的、模糊的,然而这些信息又往往是很重要的。同时在数据库中同样也会存在这些有用的、带有模糊语义信息的数据,于是人们希望能有效的利用和管理这些信息,能够有效的对这些数据进行检索,数据库查询向模糊语义查询扩展便显得尤为重要。

数据库模糊语义查询的关键是如何对数据库中带有语义信息的数据进行处理,本文首先引进了模糊本体、语言变量模糊本体来定义带有语义信息数据的概念和概念之间的各种关系,并在数据库中引入语言变量这一新的数据类型以扩展数据库的模糊语义查询能力。然后,基于语言变量本体对数据库模糊查询语言SQLF进行了扩展,使SQLF能在更大程度上处理数据库的模糊语义查询。进而,构建了一个轻量级的颜色本体,给出了颜色本体的形式化定义,并给出了颜色语言变量本体的数学模型。最后,设计了服装领域数据库的模糊语义查询系统,在一定程度上实现了数据库的模糊语义查询。

关键词:模糊本体;语言变量模糊本体;语义检索;SQLF;关系数据库

英文摘要

Abstract

With

all

thesuggestionofthenewgenerationIntemetoftheSemantic

concern

Web,there

is

increasing

to

ofthesemantic

information.ThepurposeofSemanticWeb

researchismakethemostoftheonlineinformationwithsemanticswhichthe

computerCanunderstandandhandle.Sotheinteractionbetweenhumanandcompmer

Canbemucheasier.With

thedevelopmentofSemanticWeb,it

can

promotetheretrievalof

perfectionof

SemanticWebinformation

retrievaltechnologies,SO

semantic

therelationalDambasesystemshasbecomeanimportantresearchtopicinthefieldof

databaseretrieval.

Query

mainly

uses

is

veryimportantfunctionoftheDatabase.Commondatabasequery

string

matching.However,谢tll

no

theimprovementofsystemrequirements,

thissimplequerymatchingislongerabletomeetthe

demand.There

are

more

and

more

information、析tll

semanticinthedatabase.Thisinformationisverysignificant.

Meanwhile.thereare

ofand

usefulinformationwi廿1fuzzy

semantic.Peoplewanttomakeuse

astoretrievethesedataeasily.The

managethe

useful

information

effectively

SO

extensiontothefuzzysemanticqueryofDatabasequeryseemsparticularlyimportant.

The

semantic

variable

keyoftheDatabasefuzzysemanticquery

ishowtodeal、析t11thedata

witll

information.First,this

ontologyto

define

paperintroducesfuzzyontology

and

fuzzylinguistic

theconceptofdatawith

semantic

informationand

expandSQLF

theby

introduces

linguistic

variablewhichis

newdatatypeinDatabaseto

capacityofthefuzzy

畸linguistic

semanticqueryas

well.Second,thisarticleextends

withmorecomplexfuzzy

variableontology,SO

SQLFCandeal

semantic

query.Finally,thispaperdevelopscolorontology,givestheontologyandthemathmodeloffuzzy

formal

definitionof

fuzzy

linguisticvariableontology

anddesignsthe

semanticretrievalsystemforthefashiondatabase.

Key

Words.Fuzzyontology;Fuzzylinguisticvariableontology;Semanticretrieval;

SQLF;Relational

database

大连海事大学学位论文原创性声明和使用授权说明

原创性声明

本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果,撰写成博士/硕士学位论文::槿糊奎佳在差丕麴握庄亟竖捡塞生鲍廑旦研究::。除论文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体己经公开发表或未公开发表的成果。

本声明的法律责任由本人承担。

论文作者签名:善守{务

学位论文版权使用授权书力湃6月谚日

本学位论文作者及指导教师完全了解”大连海事大学研究生学位论文提交、版权使用管理办法”,同意大连海事大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。

本学位论文属于:保密口在——年解密后适用本授权书。

不保密口(请在以上方框内打“√’’)

…撇:善啼一名裙雪日期:动幻年6月28日

模糊本体在关系数据库系统语义检索中的研究

第一章绪论

1.1研究背景和意义

查询是数据库最基本的功能,也是数据库的一个很重要的功能。普通数据库查询操作主要是采用字符串匹配,但是随着应用程序需求的不断提高,这种简单的、单一的查询已经渐渐的不能够满足人们的需求。在数据库中已经有越来越多含有语义信息的数据,同时客观世界的信息有很多还是不完全的、不清晰的、模糊的,然而这些信息又往往是重要的、不可或缺的,在数据库中同样会存在这些有用的、带有模糊语义信息的数据。于是人们希望能有效的利用和管理这些信息,能够有效的对这些数据进行检索,数据库查询向语义查询扩展便显得尤为重要。随着新一代互联网语义Web概念的提出,我们知道语义Web研究的主要目的,就是扩展当前的WwW网络,使得网络上尽可能多的信息都是具有语义的,并且这些带有语义信息的数据是计算机能够处理的,这样就会便于人和计算机之间的合作和交互。而语义Web工作的研究重点就是研究如何把信息表示为计算机能够理解和处理的形式即信息是带有语义的。语义Web的创始人TimBemers.Lee给出了基于XML和RDF(S)的语义网中的层次结构,并在此层次结构之上给出基于语义表达的知识表示的本体概念和基于知识推理的逻辑推理规则,从而使得网络上带有语义的信息能够被计算机理解和处理。语义Web并不是独立的另一个Web,而是对当前Web的一个延伸和扩展,在语义Web中信息都有完好的定义,其中包括对语义部分的描述,这样就更利于人机之间的交互。将语义Web和当前Web进行结合的研究工作已近开展起来了,随着研究工作的深入,当机器有更强的能力去处理和“理解"它显示的数据时,人们将会看到很多语义Web的新功能。随着语义Web中的语义信息检索技术的逐步成熟,对数据库系统中的语义检索的研究工作就显得的很有意义,同时在数据库的实际应用中也很有意义。

1.2国内外研究现状

在90年代,许多研究者开始了与关系数据库系统语义检索相关的研究工作,如何新贵在文献【1心中提出了基于模糊数学理论的模糊匹配、语义关联的模糊检

第一章绪论

索。文献【3】3主要论述了模糊数据库中的数据匹配问题。文献【4】给出了语义贴近度的概念,在这个基础上将空值、经典值、模糊值统一起来,基于语义贴近度定义了一系列的函数依赖。早期的研究处于刚刚起步的阶段,期间的研究主要是从数学的方面,利用隶属度函数来探索性的研究数据之间的语义关联、模糊匹配等,研究的重点并不在关系数据库上。

随着研究的工作的逐步深入,关系数据库的语义检索引起了研究者们的关注,同时研究的重点开始转移到数据库方面,人们慢慢的开始研究数据库中的语义检索和模糊查询。文献【5】介绍了模糊关系数据库的设计实现和模糊关系数据中的模糊查询语言。文献【6】提出了查询扩展技术,其中就包括语义概念检索的扩展,语义概念查询扩展必须实现同义词扩展、语义蕴涵扩展、语义外延扩展和语义相关扩展。文献【71叙述了利用模糊语义距离来检索多媒体数据库中信息的原理和算法。文献f8】就引入了模糊数据库系统的概念,在普通关系数据库上扩展模糊层,以模糊数据模型为基础构建模糊数据字典,在此之上定义模糊数据库语言,从而实现数据库的模糊查询等功能。文酬9】以模糊集合理论为基础,对现有的SQL语言进行了扩展,在模糊查询中允许用户使用模糊关系运算符和模糊谓词,在处理查询结果时候构建隶属度函数来计算查询的匹配程度,使其能处理某些模糊的查询条件,并且在模糊查询中引入了权重的概念,用来表示查询中各个条件的相对重要程度。文献【10】在传统的关系数据库的基础上,提出了一种数据库,称之为主动模糊关系数据库。这种数据库不仅具有能处理模糊信息的优点,而且与传统数据库相比具有主动性的特点。这种数据库使得在很多实际应用中对模糊性的处理和主动性的需求得到了满足。

近期的研究工作开始采用本体技术,本体技术是随着语义Web的提出而诞生的新技术,应用在语义Web的语义表示层,本体具有良好的语义表达和推理能力,利用本体可以很好的表示数据库中带有语义的信息,与本体技术的结合是关系数据库系统语义检索的研究的新的方向。其中文献【ll】采用本体技术,引入一组扩展的SQL语句来完成基于本体的语义匹配,,提供系统定义表存储用OWL表示的本

模糊本体在关系数据库系统语义检索中的研究

体。使用户直接从SQL(使用语义操作)中引用本体数据,从而与其他操作相结合,实现关系数据库系统中支持基于本体的语义匹配查询。文酬12】描述了一种基于本体的关系数据库的语义检索,其中利用本体标注把本体和数据联系在一起,建立基于本体的语义索引。文献f131【14】【15】主要研究了基于本体的语义检索。这一时期的研究工作很好的与本体技术进行了结合,也使得关系数据库语义检索的研究达到了一个新的阶段。

随着模糊本体的概念的提出,人们开始在知识检索和语义网中的信息共享中结合模糊本体进行模糊语义检索的研究。其中文献【l6】主要介绍在关系数据库系统中利用模糊数据类型来存储本体。文献【17】【181引用模糊本体的概念,将模糊本体模型应用在智能交通系统中的知识检索和语义网中的知识共享。文献【l9】将模糊本体引入到语义信息检索中,能够提高语义信息检索中对模糊信息进行检索的查准率和查全率。文献【20】详细的介绍了语言变量及其“值’’的相关概念。文献【2l】【22】【23】【24】从模糊语言学的角度对人们生活中经常使用的模糊表达进行分析和研究。文献

【25】【261对模糊语言表达中的模糊限制语进行了分析和研究。文献旧在模糊语言的基础上,提出了模糊语言变量本体模型的定义和表示。

纵观目前的研究,在数据库中引进模糊数学方法,实现模糊查询,方法比较复杂,需要构建隶属度函数;模糊数据库系统目前也只是在一种理论的研究层次上,要构建模糊数据库系统实际应用起来还很困难,有很多工作要做;在数据库中引用本体技术,实现语义的扩展,但是没有关注模糊语义。可见对关系数据库系统的语义检索的研究仍然有许多工作需要去做,做进一步的研究也很有意义。1.3本文工作及论文结构

本文在本体理论和模糊本体的理论的基础上,结合语言变量模糊本体,在关系数据库的检索中引入语言变量数据类型,以实现关系数据库的模糊语义查询。论文的首先是对本体、模糊本体和语言变量本体的数学模型进行介绍,并通过一些实例对定义进行了解释。论文的核心部分是对颜色本体构建和定义,并在扩展

第一章绪论

SQLF查询语句中结合语言变量本体以实现关系数据库的模糊语义查询。论文的最后设计了服装领域数据库模糊语义查询系统。

本文的组织结构如下:

第一章绪论。分析了本文的研究背景和研究课题的意义,同时对国内外研究现状进行了叙述,并说明了本文的研究工作和论文结构。

第二章本体与模糊本体。包括核心本体、模糊本体、语言变量模糊本体的定义和数学模型。

第三章.颜色本体。针对服装领域构建了一个颜色本体,给出了颜色本体的数学模型定义和语言变量本体的描述。

第四章扩展SQLF查询语句。对SQLF的语法和语义进行了介绍,在SQLF的基础上结合语言变量本体继续进行扩展。

第五章服装领域数据库的模糊语义查询系统。针对服装管理领域的数据库设计一个模糊语义查询系统,包括系统的总体设计和模糊语义查询部分实例。第六章总结和展望。对本文工作的总结和未来工作的展望。

模糊本体在关系数据库系统语义检索中的研究

第二章本体与模糊本体

2.1本体的数学模型

哲学领域是这样定义本体的,本体就是自然界的本质和存在f28】【291。人工智能和网络研究人员为了满足自己的研究的需求已经开始采用本体的术语。目前对于本体的定义有很多种,那么本体究竟该如何定义呢?有很多人已经进行了探讨,其中最突出的、最引入关注的定义是“本体或本体论是概念的明确的规范化的说明"130]。概念是指世界上一些现象以及和这些现象相关的概念的抽象模型。明确的意思是指各种概念以及概念的约束都要有明确的定义。这个定义通常被扩展为三个附加条件:本体是共享概念模型的明确的、形式化的说明【3l】【32】。其中形式化是指本体涉及的事实应该是机器可读的(包括实例和自然语言)。共享的概念反映的是本体捕获的是共同认可的知识。即它不是个别的和单独的。共享不一定是全局的共享,而是被一个群体所接受,因此这个定义并没有解决本体的整合问题,本体的对齐仍然是必要的。最后,涉及一个领域内感兴趣的知识指的是领域本体并不是对整个世界的建模而是对与工作有关的部分特定领域的知识建模。

这些定义的共性是它们的高度概括性,但它们和精确的数学上的定义还差的很远,因为这个定义应该包括很多不同种类的本体,而不应该只是和一个特定的知识表示方法联系起来‘33】【341。因此,在研究结构方面大家必须要致力于一个特定的本体模型和一个准确、详细的定义。本节将给出德国卡尔斯鲁厄大学AIFB研究所的知识管理团队对于关键本体术语的定义【35】【361。

定义2.1(核心本体)核心本体是一个结构S:=(C,<c,R,13",<R),核心本体(coreontology)通常也称为模式(schema)。其中:

(1)C与R是两个不相交的集合,C中的每一个元素称为概念(concept),R中的每一个元素为关系(relations)。

(2)概念集C上的偏序关系<,,称为概念的层次结构(concepthierarchy)或分类体系(taxonomy)。

第二章本体与摸糊本体

(3)函数o:R—CxC,a(r)_<dom(r),ran(y)>,其中rER,dom(r)为定义域,ran(r)为值域。

(4)关系集R上的偏序关系<R,称为关系的层次结构(relation.hierarchy),若有1<R厂2,则是当且仅当dom(r1)<cdora(r2)_N.ran(r1)<cran(r2)。

(5)为了定义的方便,常用的数据类型如整型、字符串等,也认为是一种概念,即D={Integers,Strings,..…)cC。

另外,若cl<C2,则c1是子概念(下位概念,subconcept),c2是父概念(上位概念,superconcept)。若Cl<C2,同时没有满足条件的c3存在,则c1是直接子概念,C2是直接父概念。子关系和父关系之间的这种定义和概念的定义类似。

定义2.2(公理)设L是逻辑语言(如一阶逻辑或Horn逻辑)。一个核心本体的L公理系统定义是A声(AI,仪),其中:

(1)AI是集合,其中每一个元素是公理标识符(axiomidentifier)。

(2)0【:A1_三为映射,A:=0【(4,)中的元素为公理。

定义2.3(知识库)知识库定义为结构KB:=(C,R,,,Zc,k),其中:

(1)C与R的含义同上。

(2)I为实例(个体)的集合,i∈I为实例(instanceidemifiers,instances)。(3)函数lc:C—P(I)为概念的实例化,P(I)是I的幂集。

(4)k_P(,×,)为关系的实例化,Vr∈灭,k(r)c_lc(dora(r))×lc(ran(r))。作为概念的数据类型的具体值也称为它的实例,即Vc,。

定义2.4(字典,Lexicon)一个本体的字典为结构

Lex:=(Gc,GJR,G,,,_叽,rG,厂斫)

其中:

(1)Gc,GR,G,均为符号(sign)的集合,其中元素分别对应概念、关系、实例的符号(记号)。

(2),.畈,rG,,.斫均为二元关系,,.畈sGcxC,rG∈G只xR,refl至G,×1。

模糊本体在关系数据库系统语义检索中的研究

定义2.5(本体)一个本体是四元组(4-tuple)

O:=(S,A,KB,Lex)

其中:S为核心本体(模式),A为L公理系统,KB为知识库,Lex为字典。

目前人们正在致力于使用一种规则语言来扩展本体的模型,有了这种规则语言就可以表达更加复杂的公理。语义Web规则语言(SWRL)[371的提出为表达复杂的公理提供了可能性,并且在本体的定义中已经开始使用这种规则语言来描述公理系统。

下面的本体模型描述了汽车领域中汽车商人和他的货物以及和顾客之间可能存在的关系。

图2.1汽车本体例子

Fig.2.1Theexampleofcarontology

第二章本体与模糊本体

这个例子中包括6个概念:Object,Vehicle,Boat,Car,Speed,Owner,2个关系是Belongsto和HasSpeed,三个实例:Marc,PorscheKA一123和300km/h。在Object,Vehicle,Boat,Car之间有一种包含的关系,例如Vehicle是一个Object,而Boat是一个Vehicle。每一个Vehicle都Belongs

个额定Speed。一条实例的公理是Porsche

Speed是300to一个Owner,每一个Car都有一Marc有一个额定的KA-123Belongstokm/h。另外每一个Car至少有一个Owner被定义。

图2.1示例本体O车(S,A,103,Lex)的数学模型如下:

(1)S:=(C,<c,R,o,<尺)2({object,vehicle,owner,...),{(vehicle,object),(boat,vehicle)…),{belongsTo,hasSpeed},{belongsTo—.>(vehicle,owner),hasSpeed—->(car,speed)},{))。

(2)A={Vxcar(x)≥3ybelongsTo(x,y))。‘

(3)KB._(C,R,1,,c,k)2({object,vehicle,owner,...},{belongsTo,hasSpeed},{Marc,PorscheKAl23,300km/h},{owner—->{Marc},Car—->{PorscheKAl23},speed-->{300km/h}},{belongsTo--->{(PorscheKAl23,Marc)},hasSpeed-->{(PorscheKAl23,300km/h)})。

(4)Lex:=(Gc,GR,G,,,.吮,refR,峨),

Lex=({‘‘object’’,‘'vehicle"...)…{(‘‘object’’,object),(‘‘vehicle’’,vehicle)…)…)。

图2.1示例本体的OWL语言【38】【391描述,其中OWL是W3C给出的统一的本体描述语言:

<rdf:RDF

xmlns:auto一'http://www.aifb.tmi-karlsruhe.de/WBS/meh/aut01.owl’,>

<owl:Classrdfiabout=‘auto#vehicle’>

<rdfs:labelxml:lang=‘en’>vehicle</rdfs:label>

<rdfs:subClassOfrdfiresource=‘auto#object’/>

</owl:Class>

<owl:Classrdf:about=‘auto#car’>

<rdfs:labelxml:lang=‘en’>car</rdfs:label>.8.

模糊本体在关系数据库系统语义检索中的研究

<rdfs:subClassOfrdf:resource=‘auto#vehicle’/>

<rdfs:subClassOf>

<owl:Restriction>

<owl:onPropertyrdf:resource=‘auto#belongsTo’,>

<owl:minCardinality>l</owl:minCardinality>

</owl:Restriction>

</rdfs:subClassOf>

</owl:Class>

<owl:ObjectPropertyrdf:about=‘auto#belongsTo’>

<rdfs:labelxml:lang=‘en’>belongsto</rdfs:label>

<rdfs:domainrdf:resource=‘auto#vehicle’/>

<rdfs:rangerdf:resource=‘auto#owner’侈

</owl:ObjectProperty>

<auto:Ownerrdf:abour=‘auto#Marc’,>

<auto:Carrdf:abour=‘auto#PorscheKA.123’>

<rdfs:labelxml:lang=‘en’>PorscheKA一123</rdfs:label>

<auto:belongsTordf:resource=‘auto#Marc’份

<auto:hasSpeedrdf:resource---‘auto#300

</auto:Car>

</rdf:RDF>km/hV>

上面的本体定义是通过定义核心本体来定义本体的模型的,其中核心本体的定义是整个本体定义的关键部分。下面给出的是本体的另一种定义方式m】DH[42】

【43】,这种定义是对上面定义的一种扩充。

定义2.6(核心本体)本体是一个结构S:=(C,<c,R,6R,<R,A,西月,丁),其中:

(1)C与R是两个不相交的集合,C中的每一个元素称为概念(concept),R中的每一个元素为关系(relations)。A是属性的集合,T是数据类型的集合。

(2)概念集C上的偏序关系<c,称为概念的层次结构(concepthierarchy)或分类体系(taxonomy)。.9.

第二章本体与模糊本体

(3)函数a足:R—CxC,13尺(,-)=<dom(r),ran(r)>,其for∈R,dom(r)为定义域,ran(r)为值域。

(4)关系集R上的偏序关系<。,称为关系的层次结构(relationhierarchy),rl<Rr2当且仅当dom(r1)<cdom(r2)Nran(r1)<cran(r2)。

(5)函数13爿:彳--4CxT

(6)数据类型集合T:例如string,integer等。

图2.2地理本体例子

Fig.2.2TheexampleofGEontology

定义2.7(定义域和值域)对于一个关系二元关系r∈R,可以定义它的值域为range(r),定义定义域为dom(r)。

若cI<C2,Ncl是子概念(下位概念,subconcept),C2是父概念(上位概念,superconcept)。若C1<C2,同时没有满足条件[幂Jc3存在,则Cl是直接子概念,c2

模糊本体在关系数据库系统语义检索中的研究

是直接父概念。

下面对上图给出的地理本体的例子进行一定的说明,其中概念集C:={GE,NaturalGE,InhabitedGE,mountain,river,country,city,capital},其中GE表示的是

in,flowthrough,capital地理实体。关系集R:={located

{length(km),height(m)).of}。另外有两个属性彳:=

为了方便使用,人们通常把概念集和关系集叫做概念和关系。对于上图中的关系和属性可有如下的说明:

a(flow_through)=Cive厂,GE)

a(capitaLoJ)=(city,coldnlry)

aQocatedin)=亿fty,country)

a(1engthCon))=(river,integer)

a(height(m))=(mountain,integer)

Vx(country(x)一3ycapital—of(y,z)AVz(capital—of(z,x)jz=y))

Vx(capital(x)H3ycapital—of(x,Y)Acountry(y))

在定义了一个核心本体的基本元素之后,需要进一步定义一个公理系统。尽管不能直接关注某个特定的公理系统,但是却能给出一个公理系统的整体上的定义。

定义2.8(公理系统)设L是逻辑语言(如一阶逻辑或norn逻辑)。核心本体的L公理系统是A=_(A1,0【),其中:

(1)AI是集合,其中每一个元素是公理标识符(axiomidentifier)。

(2)仅:AI专三为映射,A:=ot(AI)中的元素为公理。

一个带有L公理系统的本体是一个有序对(O,S),其中O是一个本体,S是本体的公理系统。

这样一个公理系统明显的好处就是它是一个独立的、明确的知识表示的形式,公理描述可以翻译成多种不同的语言。这对于从独立于任何指示表现形式的靠直觉捕获知识的本体知识的获取是很重要的。定义2.9(字典,Lexicon)一个本体的字典为结构

第二章本体与模糊本体

Lex:=(Gc,GR,G,,refc,,.呱,,.斫)

其中:

(1)Gc,GR,q均为符号(sign)的集合,其中元素分别对应概念、关系、实例的符号(记号)。

(2)refc,refR,,斫均为二元关系,refc∈GcxC,refR∈G只×R,嘲∈G,×,。

定义2.10(知识库)知识库定义为结构KB:=(C,R,,,七,k),其中:

(1)C与R的含义同上。

(2)I为实例(个体)的集合,i∈I为实例。

(3)函数乇:C—P(,)为概念的实例化,P(I)是I的幂集。

(4)IR—P(IxI)为关系的实例化。

Vr∈R,k(r)c_lc(dom(r))xlc(ran(r)),作为概念的数据类型的具体值也称为它的实例,即VcI。

定义2.11(实例字典)一个知识库的KB:=(c,R,,,,c,k)的实例字典是一个有序对:

IL:(SI.砒)

有以下部分组成:

(1)集合SI,其中的元素叫做实例标签。

(2)关系RJ叫做实例的字典引用。

一个带字典的知识库是一个有序对:(KB,IL),其中KB是知识库,IL是实例字典。

2.2模糊本体的数学模型

虽然基于本体的语义信息检索在一定程度上提高了检索的准确性,但由于自然语言多具有不确定性和模糊性‘删【451。因此将模糊本体应用到语义信息检索中具有很大的意义,它能使机器能够更好的理解自然语言的模糊性,进行有效的模糊

模糊本体在关系数据库系统语义检索中的研究

语义信息检索。本体通过一组概念、属性和概念之间的关系来表示领域内的知识模型,通过引入模糊概念和模糊关系就能给出模糊本体的数学模型【46】【47】【48】。模糊本体的定义如下:

定义2.12模糊本体可以定义为下面的一个五元组

O:=(C,R,T,A,X)

其中:

(1)c是(模糊)概念的集合(或者是指类、个体、种类、类别等),例如:山脉、病人、细胞、糖尿病、肺炎、颈椎病等等。概念可以是基本概念,也可以是由其他概念所定义的概念。例如:“原核细胞是无核细胞”。我要注意概念定义中存在内在的含糊不清的部分,比如:“一座小山丘指的是至少比周围地面高出600米的地形(大不列颠山脉的高度是2000英尺也就是610米),这个比山脉高度要低。但是许多小山也会高出600米,因此小山通常上是指比较小的(在山脉的定义中可以有这样的说明:山脉通常要比小山丘更高、更险峻,但是也会有许多重叠的部分)”。

(2)R是(模糊)二元关系集合,例如:概念原核和概念细胞中间具有“apartof’’的关系、“一个很高的人是一个高的人’’。

(3)T是一个特殊的二元关系集,叫做概念分类(概念层次)。它将概念分为“子概念.父概念"的树形结构,大多数概念之间具有特殊的关系(例如:“酶是一种蛋白质”,“癌症是一种疾病")或者仅仅具有一种简单(部分)的关系(例如:丁(C-,C2),指的是C,是C:的一个子概念,就像“真核细胞是具有原核的细胞”)。

(4)A是一个无差别(模糊)联合关系集,它利用树形结构将概念联系起来。例如:

◆命名关系:描述概念的名字。

◆定位关系:描述概念的相对位置。

◆函数关系:描述概念的作用和功能。

(5)X是用适当的逻辑语言表示的本体公理集或规则集。例如:界定类的包含,等值,概念或实例的值的模糊约束。

第二章本体与模糊本体

字典是一种语言中的一系列单词,词汇表包括了每一个单词的一些用法。每一个单词或者词组都会定义在字典的词汇项。所以字典可以看做为将书面形式的单词转化为信息的一种索引。下面定义和模糊本体结构相关联的字典。

定义2.13模糊本体O:=(C,R,T,A,X)的字典是如下的一个四元组结构【49】:

L:=(F,LR,F,G)

其中:

(1)集合F是概念的词汇项;来源于(模糊)属性在不同背景下的取值。(2)集合r是(模糊)关系的词汇项,从概念C到另一个概念C,外加上一个取值在【0,1】的权重,用来表示关系的强度。

(3)F和G是两个关联函数(F:F_2candG:LR一2R),用来连接概念的词汇项三c和概念集合C,关系的词汇项厶和关系集R。

因为本体是一个领域的概念集,它不能预先假定包含一些特定的实例,因此就有了下面知识库的定义。

定义2.14模糊知识库是如下的二元组结构:

KB=(D,,)

其中:0:=(C,R,T,A,x)是一个模糊本体结构,I是与本体相联系的实例(个体)集。如:对象是概念的具体的表现,例如:“结合珠蛋白是概念蛋白质的一个实例’’,或者在“Carol患有糖尿病"中“Carol"是一个实例/个体,糖尿病是一个概念/类。下面通过一个模糊艺术本体【蛔例子来对定义进行进一步的理解。

艺术本体的概念和关系(参见定义2.12):

C={Cl,C2,C3,..…C24)

R={‘,吃,吃……r9}

T(C:,C1),T(C3,C。),..…丁(C6,C。),丁(C15,C16)

厂l(C4,C,),1(C。.C8),1(C,C9)厂2(C4,C10),吃(c4.C11),心(C4,C12)

模糊本体在关系数据库系统语义检索中的研究

吩(C4,C13)

■(C4,C。。),■(c13,C。。)

,5(C5,C15)

%(C4,C1,),吃(C4.C1。),%(C4,C1,),%(C5,Cl,),厂6(C5,Cl。),%(c5,C1,)

■(Cl,,C2。)

%(C5,C2。),%(C5.C22),厂8(C5,C:,)

,9(C23,C24)

艺术本体的字典(参见定义2.13):

F={artist,musician,singer,painter,sculptor,dancer,...,marbel,region)r={paints,uses,..…,creates,comes_from)

F(artist)={CI},F(musician)={C2),F(singer)={C3),F(painter)={C4,C13)…..,F(region)={C24}

丁(C2,C1)=话一a,丁(Ca,C1)=西一a……。T(C15,C16)=/s—a

G(paints)={1),G(uses)={r2,rs),G(creates)={,5>,..……..

G(comes—from)={吩)

在关系集中的关系可以用权重关联起来,权重表示关系的强度或语义量词。例如:“apainter(C4)paints(r1)mostly

waterstilllife(C9)"或者“heisprefersusing(吃)colors(Clo),有一个喜好的权重心:lo属于[0,1]”或“he

painter(C13),有权重w4:13”。influenced_by(r3)afamous

第二章本体与模糊本体

图2.3艺术本体

Fig.2.3Theontologyofart

musiciansingerpaintersculptordancer

object

图2.4F的图解说明Fig.2ATheillustratecityof亡

.16.

模糊本体在关系数据库系统语义检索中的研究

图2.5p的图解说明

Fig。2.5Theillustrateof口

2.3语言变量模糊本体

语言变量是指取值类型可以是语言值的一些变量【501,例如日常生活中使用到的温度,就可以取值为“高、低、适中’’等语言值。语言变量的概念是建立基于知识与规则的模糊系统的基础,因为语言值在一定意义上就是一个模糊集。在语义Web环境下,为了实现不同的模糊系统之间的知识共享与重用、集成与互操作,有必要对语言变量进行形式化表示。语言变量模糊本体是语言变量在语义Web中的明确的规范化说明,有利于模糊系统与语义Web的结合,使得语义Web更加方便地处理模糊信息刚【52】。同时在关系数据库中也z月-,匕&,4KEt好的表示带有语义信息的数据。

定义2.15(语言变量模糊本体)语言变量模糊本体是一个五元组:

OF={CaCF,R,F,U)

用于描述一个抽象概念c。与一组模糊概念CF,其中:

(1)c。是一个抽象概念,它的取值是模糊概念;(2)CF是模糊概念集,表示概念c。的所有可能的取值;

第二章本体与模糊本体

(3)R是C。上的二元关系集合,表示模糊概念间的语义关系;

(4)F是隶属度函数集合,它与模糊概念集C。是同构的;

(5)U为讨论的论域。

下面通过定义agei吾言变量本体来对定义2.15进行详细的说明:

(1)巳通常是领域本体中的一个概念,也可以是概念的属性,如ca=age。(2)CF中的模糊概念CF通常具有简单、基本的语义,表现为简单的词汇或词组,如模糊概念age的模糊概念集为CF={childhood,adolescent,young,adult,old,older,veryold,notold……},U爿0,100]。

(3)一类语义关系是集合性质的关系RS={不相交,包含,相交而不包含,互补),如“young'’与“oId”是不相交关系,“older'’与“old”是包含关系,“adolescent”与“young”是相交而不包含关系,“old”与“notold”是互补关系。另一类语义关系是序关系与等价关系RO={S,

old_<olderS_very≥,=),如childhood_<adolescent_<young_茎.adult<old等。CF与R一起组成一定的结构,如在序关系下,<CF,R>是一个偏序结构。

(4)f∈F为CF中一个模糊概念cP的隶属度函数,从计算的角度具有精确表示模糊概念语义的作用。由于F与CF之间具有同构关系,屿其表示的概念cF是完全等价的,因而F在一个模糊本体中是可选元素。

为了在各种模糊系统中大量使用的语言变量,并能方便地将语言变量转化为模糊本体,因此引入如下简单、实用的简单模糊本体的定义【5l】。

定义2.16(基本的模糊本体)基本的模糊本体是一个四元组OF=(Ca,CF,F,U),其中Ca、CF、F、U的含义同定义2.15,而模糊概念集CF满足::

(1)CF={CI,c2,c3,..…r。)为有限集。

(2)Cr中任何两个模糊概念间的关系只是“不相交”,且CF是完备的,即所有的模糊概念覆盖整个论域。换句话说就是C。是U的一个模糊划分。(3)CF上存在一个序关系S,且<CF,9为全序集,即所有的模糊概念组成

模糊本体在关系数据库系统语义检索中的研究

一个链c1§丕……编。

基本的模糊本体的一个例子是O--(c。=速度,CF={慢速,中速,快速),U=【0,200],其中存在序关系:“慢速”≤“中速”≤“快速”。

有了语言变量模糊本体的定义,下面简单的介绍一下语言变量本体的构建的基本过程,研究表明通过使用语言变量能够更大程度上实现数据库的模糊语义检索,从而语言变量也常应用在模糊系统中,语言变量模糊本体的构建过程如下【51】:

(1)从模糊系统中提取模糊语言变量,并将语言变量的命名规范化。

(2)分析出作为语言值的模糊概念,这些模糊概念要尽可能的完备。

(3)描述每个语言变量中的模糊概念(语言值)间的语义关系,并消除概念间的不一致与冗余现象。

(4)如果有必要的话,将上面的工作映射到隶属度函数空间。.(5)如有可能的话,化简语言变量模糊本体使其成为基本的模糊本体。

第三章颜色本体

第三章颜色本体

3.1颜色词汇介绍

人类的色彩感知用自然语言的表达和固定下来就是自认语言中的各类颜色词汇。人们很早就对人的色彩感知和颜色词产生了兴趣,古今中外,人类学家,语言学家对颜色词语进行了各类研究。其中主要包括自然语言基本颜色词语的数量和产生的顺序、颜色词语的语义学研究、颜色词的语义系统分析等等。

色彩感知与外部世界的联系问题早在古希腊时期就开始为西方学者所关注【531。19世纪中叶,西方学者和传教士开始注意到,古代语言与现代语言、现代欧洲各语言之间以及一些土著语言和欧洲语言中的颜色词在切分光谱的时候存在着引人注目的差别。到了20世纪,西方研究者们开始广泛的调查世界上不同语言在颜色词命名上的差别和特殊性,并进行了大规模的跨语言颜色词比较研究【541。与此同时,欧洲结构语义学也开始对颜色词词汇系统做语言学的描写。英国学者格莱斯顿最先提出并讨论了颜色词问题。他比较了古希腊的两部史诗作品《伊里亚特》和《奥德赛》中一些描述颜色的语句后发现,荷马时代的古希腊语只有很少几个抽象颜色词,它们的意义往往含混不清。他认为这是由于古希腊人的色觉器官有缺陷,他们的辨色能力不如现代人发达。格莱斯顿的发现和猜测很快引起了德国学者的注意,德国眼科专家马格乌斯首次利用色片进行了颜色感知的跨文化调查。此后人类学家和语言学家开始调查不同语言中的颜色词系统。

同样,颜色词的研究也引起了我国学者的注意。早在20世纪40年代,文学家胡朴安就曾对汉语上的古五个颜色字一白、赤、黄、黑、青的产生和发展做了分析和研究。到了20世纪80年代,研究汉语颜色词的论著开始多了起来,学者们开始从各个角度对颜色词的语义发展等进行研究。进入21世纪,汉语颜色词的研究又有了新的发展,出现了从多个角度对现代汉语颜色词进行系统研究的专著【551。其中《现代汉语颜色词语义分析》一书主要对现代汉语颜色词进行词汇语义分析,分析对象是经过归纳和整理的现代汉语颜色词的九类基本颜色词群1561。

模糊本体在关系数据库系统语义检索中的研究

3.2颜色本体模型

针对服装行业构建表示服装颜色的颜色本体,我们知道服装具有各种各样的颜色,颜色本身含有丰富的语义信息,而各种商场对所卖的衣服的颜色的描述可能会有差异,由于这个差异,对于顾客来说在选择衣服的时候就会有不小的麻烦,尤其是在目前流行的网上购物的时候,由于顾客不能看到自己要购买的衣服,所以对衣服颜色的描述对于顾客来说将会一个很重要的因素.同时对于厂家来说,由于服装的颜色种类太多,对商品库存的管理也很麻烦。于是本文通过参照《现代汉语颜色词语义分析》一书的分析构建一个小规模的轻量级的颜色本体,在颜色本体中,通过对各种颜色概念的语义分析,定义出各种颜色之间的关系.这样就便于顾客对服装颜色的选择。下图所示的是颜色本体中的部分概念和关系:

乌黑墨黑吉青油兽灰筹乜

人红绯红!—¨J——…一J一—一…——』一火红承n糟红m红艄Ⅱ嫩红妃色

图31颜色本体例子

Fk.3l1k“mpleofcolor0肋lo∥

这个例子包括了25个概念:颜色词红.红色,黄,蓝,绿,紫,大红,绯红,火红,粉红,黑,自,灰,乌黑。颜色本体中,九个基本的颜色词概念

第三章颜色本体

和概念“颜色词"之间是一种“PartOf"的关系,同时概念“红色”、和“红”又有“SynonymOf"的关系,每一个基本的颜色词汇又有许多子概念(这些概念将会在后面进行介绍),基本概念和子概念之间是一种“SubClassOf”的关系,例如“红”SubClassOf“颜色词"。此外九个颜色词也可以具有“彩色"和“非彩色’’的对立(不相交)关系,其中“红、黄、绿、蓝、紫、褐”是有彩色词,“黑、白、灰”是无彩色词。其语义对立关系可表示为:{红,黄,绿,蓝,紫,褐):{黑,白,灰,。下表显示的是概念“红”和概念“黄"的概念集。其余的概念集见附录一6

表3.1红的概念集

Tab.3.1Theconceptsetofred

序号

10词目词典释义红的颜色很红的颜色鲜红像火一样红比粉红略深而比较鲜艳的红色红和白合成的颜色血色比较鲜艳的红色浅红色淡红色红色大红绯红火红水红粉红血红朱红嫩红妃色

模糊本体在关系数据库系统语义检索中的研究

表3.2黄的概念集

Tab.3.2Theconceptsetofyellow

序号

7词目黄色鲜黄明黄亮黄澄黄黯黄昏黄词典释义黄的颜色鲜明的黄色纯正鲜亮的黄色鲜亮的黄色黄而清澈的颜色灰暗的黄色暗淡模糊的黄色

参照定义2.1核,tb本体的结构S:=(C,<c,R,G,<异),其中对。的定义稍有变动,定义巧=Rj2…,则图3.1所示的颜色本体的数学模型为:

(1)C=cluc2uc3uc4uc5uc6uc7UC8,c9……

q={颜色词)

c:={大红,绯红,火红,水红,粉红,血红,朱红,嫩红,妃色)

c,={红,黄,蓝,绿,紫,褐)

c。={黑,白,灰}

c,={乌黑,墨黑,玄青,油黑,灰黑色}

‰={红色)

c,={红)

c。={红,黄,蓝,绿,紫,褐,黑,白,灰)

c9={黑)

(2)<c={(大红,红),(火红,红),(粉红,红),(墨黑,黑),……)(3)R={PartOf,SynonymOf,dissjointwith,jointwith}

第三章颜色本体

(4)o=Ro2跚={PanOf_->(红,颜色词),Part

SynonymOf.->(黑,颜色词),Of-->(红色,红),dissjointwith-->(红,黑),joint诵tb->(大红,粉红),joint诚th__>(水红,粉红),……)

图3.1所示颜色本体的OWL语言描述:

<?xmlversion--'‘1.0”?>

<rdf:RDF

xmlns:xsp2“http://www.owl—ontologies.com/2005/08/07/xsp.owl#’’xmlns:rdf=-“http:llwww.w3.or∥1999/02/22-rdf-syntax-ns#”xmlns:xsd="http://www.w3.org/2001/XMLSchema#’’

xmlns:rdfs=“http:llwww.w3.org/2000/01/rdf-schema#’’

xmlns:owl=“http://www.w3.org/2002/07/owl#’’

<owl:Ontologyrdf:about=““胁

<0wl:Classrdf."ID=“颜色词’诊

<owl:Classrdf:ID=“红’,>

<rdfs:subClassOfrdfiresource一'http://www.、v3.org/2002/07/owl#Thing’’/><owl:equivalemClass>

<owl:Classrdf:about=“撑红色’诊

</owl:equivalentClass>

</owl:Class>

<0wl:Classrdf:ID=“黄’,/>

<owl:Classrdf:ID=“紫’修

<owl:ClassrdfilD=“水红’,>

<rdfs:subClassOf>

<owl:Classrdf.ID=“红”/>

</rdfs:subClassOf>

</owl:Class>

<owl:ClassrdfilD=“血红’'>

<rdfs:subClassOf>.24-

模糊本体在关系数据库系统语义检索中的研究

<owl:Classrdfiabout=“撑红”/>

</rdfs:subClassOf>

</owl:Class>

<owl:Classrdf.ID=“褐’’/>

<owl:ClassrdfilD=“乌黑’,>

<rdfs:subClassOf>

<owl:Classrdf.ID=“黑’,/>

</rdfs:subClassO/'>

</owl:Class>

<owl:ClassrdfilD=“大红’,>

<rdfs:subClassOf>

<owl:Classrdf.about=“存红”/>

</rdfs:subClassO/'>

</owl:Class>

<owl:Class

<owl:ClassrdfilD=“灰’诊rdfilD=“灰黑色’’>

<rdfs:subClassOf>.

<owl:Classrdfiabout=!‘撑黑’诊

</rdfs:subClassOf>

</owl:Class>

<owl:Class

<owl:Classrdf.ID=“白”/>rdfiabout=“撑黑’,>

<owl:disjointWith>

<owl:Classrdfiabout=“拌红’’/>

</owl:disjoimWith>

</owl:Class>

<owl:ClassrdfilD=“妃色’,>

<rdfs:subClassO侈.25.

第三章颜色本体

<owl:Classrdfiabout=“撑红’’胗

</rdfs:subClassOf>

</owl::Class>

<owl:Classrdf.ID=“嫩红’,>

<rdfs:subClassOf>

<owl:Classrdfiabout=“撑红”/>

</rdfs:subClassOf>

</owl:Class>

<owl:Classrdf:ID=“粉红’,>

<rdfs:subClassOp

<owl:Classrdf.-about="#红”胁

</rdfs:subClassOf>

</owl:Class>

<owl:Classrdf.ID=“绿’,/>

<owl:Classrdf.ID=“蓝”胁

<owl:Classrdf.ID=“油黑’,>

<rdfs:subClassOfrdfiresource=‘啤黑’’/>

</owl:Class>

<owl:Classrdfiabout=“拌黑‘‘>

<owl:disjoimWithrdfiresource=‘哗红‘‘胗

<rdfs:subClassOfrdfiresource=‘'http://www.w3.org/2002/07/owl#Thing’’侈</owl:Class>

<owl:Classrdfiabout=‘镥粉红‘‘>

<owl:jointWithrdfiresource="#水红‘‘今

<rdfs:subClassOfrdfiresource=“http://www.w3.org/2002/07/owl#Thing’,/></owl:Class>

<owl:Classrdf..ID=“玄青’,>

<rdfs:subClassOfrdfiresource=“拌黑’’/>.26.

模糊本体在关系数据库系统语义检索中的研究

</owl:Class>

<owl:ClassrdfiID=“绯红’,>

<rdfs:subClassOfrdfiresource=“释红’’/>

</owl:Class>

<owl:ClassrdfilD=“朱红’,>

<rdfs:subClassOfrdfiresource=“撑红”胁

</owl:Class>

<owl:Classrdf.ID型墨黑’,>

<rdfs:subClassOfrdfiresource=“j6}黑”胁

</owl:Class>

<0wl:ClassrdfilD=“火红’_,>

<rdfs:subClassOfrdfiresource=“群红’’/>

</owl:Class>

<owl:ObjectProperty

<rdfs:rangerdfilD='‘PartOf,>rdfiresource=“撑红’’,I>

<rdfs:domainrdfiresource=“撑颜色词’修

</owl:ObjectProperty>

q7rdf.RDF>

3.3颜色语言变量模糊本体

根据定义2.15给出的语言变量模糊本体结构OF={CaCF,R,F,U},则颜色语言变量本体的数学模型如下:

(1)c。={颜色)

(2)CF=cFlucF2ucF3u…..其中:

印。={红,黄,绿,蓝,紫,黑,白,灰,大红,粉红…..)

印:={大红,绯红,火红,水红,粉红,血红,朱红,嫩红,妃色)印,={乌黑,墨黑,玄青,油黑,灰黑色}……

(3)R=RluR2,其中:..27.

第三章颜色本体

集合性质的关系:R1={PaItof,disjointwith,SubclassOf,jointwith…….)序关系:R2={<,≥,=)

下面对颜色语言变量本体中的序关系进行详细的说明,在下文的服装数据库的模糊语义检索系统中将会使用到这里定义的序关系。

首先在颜色语言变量本体中有“红色=红’’、“黑色=黑’’等等值关系。

其次,亮度是颜色的一个很重要的参数,在服装领域常常通过亮度来区分各种颜色从而对服装进行分类、查询等管理操作。通过颜色的亮度值进行比较,在各个概念的取值集合中有如下的序关系:

◆“红”的取值集合中就具有这样的序关系:

“妃色<嫩红<朱红.<血红<粉红<水红<火红<绯红<大红’’。◆“黄”的取值集中具有序关系:

“昏黄<黯黄<澄黄<亮黄<明黄<鲜黄”。

◆“绿”的取值集中具有序关系:

“惨绿<水绿<海绿<碧绿<鲜绿<油绿<大绿”。

◆“蓝”的取值集中具有序关系:

“葱白<翠蓝<水蓝<天蓝<宝蓝"。

◆“紫”的取值集中具有序关系:

“雪青<鲜紫<水紫<大紫"。

◆“褐”的取值集中具有序关系:

“灰褐色<紫褐色<蓝褐色<绿褐色<红褐色<茶褐色’’。

◆“黑”的取值集中具有序关系:

“灰黑色<油黑<玄青<墨黑<乌黑”。

◆“白”的取值集中具有序关系:

“粉白<乳色<银白<雪白<鲜白<死白”。

◆“灰”的取值集中具有序关系:“灰白<银灰<乌灰色<土灰色<铁灰色"。

模糊本体在关系数据库系统语义检索中的研究

第四章扩展SQLF查询语句

4.1数据库模糊查询语言SQLF

导致对数据库管理系统功能进行扩展的一个重要的原因是为了更高程度的满足用户的需求而允许进行不精确的查询,由于没有一个通用的关系数据库语言能提供一个足够的框架去实现模糊查询,只有通过扩展现有的关系数据库语言的能力和使用非布尔逻辑解释以实现模糊查询的明确的表达。SEQUEL是第一个被提出的基于模糊集理论的关系数据库扩展语言,SEQUEL仅仅允许一些简单的模糊查询的表达(主要是投影一选择.连接的操作)。通过理论上的论证,人们认为SEQUEL的很多实现是合理的,在那个时候也成为了人们普遍知道的关系数据库语言。SQLF是一种更加完整的扩展关系数据库的查询语言,它可以实现更多模糊查询操作,像嵌套查询的扩展。SQLF是由法国雷恩大学的PatrickBosc博士和OlivierPivert博士在1995年提出的。在SQLF中有两个重要的观点一定要考虑到,其一是对于各种用在不同地方的查询扩展语言的不同观点的整合,尤其是基于模糊集理论操作的这些观点。其二是要明确在标准SQL语言中的等值操作在扩展的查询语言中是否依然能够使用1571。

在数据库领域,近年来人们不断的做出大量的工作去研究对现有的关系数据库中的描述所需要的信息的唯一方法的布尔逻辑进行替代。布尔逻辑有时候在信息的选择上和灵活多变的语义操作上显得有点太过于死板,不能灵活的满足人们的需要。所有研究工作都在致力于定义一种“灵活”的系统,在这样的系统中,我们不再是单单找出满足明确的准则的那些元组,而是去决定一个元组满足条件的范围,这样在所选择的元组中就存在等级的区分。人们提出的观点中很多已经得到了初步的执行,为了对这些观点中的不精确标准进行解释,一种方法是把这些不精确的标准转化成布尔形式,为每一个存在的元素计算出一个“距离”,用这样的方法去表示接受的范围。另一种方法是利用模糊集理论去计算模糊的查询条件。SQLF正是基于模糊集理论的扩展查询语言,其将模糊条件的查询用模糊集的操作来表示,得到的结果和前者的操作是一样的,且这样的操作比先前的方法

第四章扩展SQLF查询语句

更加的方便。因为先前的方法中存在的重大的缺陷:(1)原子水平上的不连续(因为对每一个原子谓词的满足和不满足要进行直接的区分),

(仅仅少量的连接器被允许使用),(2)表达能力的有限(4)排序的语义信息(3)区分规模有限,

让用户难以理解。SQLF正是通过使用更多的模糊连接器在很大程度上解决了这些缺吲571。

4.1.1SQLF语法

在SQL语句中,如果不使用嵌套查询而是使用多表连接查询语句块来实现投影.选择.连接类型的查询的操作的话,这样的语句块的格式如下t

select(attributes)from(relations)where(condition)

语句的作用是将满足需求条件的元组投影到指定的属性上。但是需要指出的是这种投影并不严密,因为普通的关系投影运算是允许重复元组存在的,除非使用指定的的关键字distinct。在扩展的查询语句SQLF中,基本的语句组成和标准SQL语句类似,但是在本质上有以下两点不同:首先是必须要有对查询结果进行调整的参数(有对结果多个需求的符号n,也有对结果有定量值(阈值)要求的符号t,或者两者都存在)。第二点是对查询条件的满足不再仅仅是严格的布尔逻辑‘5羽。新的查询语句的格式如下【591:

select[nltln,t](attributes)from(relations)where(fuzzycondition)

查询过程经过下面三个逻辑处理步骤返回一个模糊关系表t

(1)对参与查询的关系表的投影进行笛卡尔积操作

(2)应用模糊查询条件(产生一个模糊关系表)

(3)去掉不需要的属性(select语句中没有提到的属性),如果使用了distinct关键字,对于重复的元组取隶属度最高的那个元组。

举一个例子来说明,例如有如下的一个描述职员的表,描述职员的属性有正规的含义和扩展的含义,表的模式为EMP(#emp,e.name,salary,age,city),数据如下:

模糊本体在关系数据库系统语义检索中的研究

表4.1EMP表

Tab.4.1111eEM【Ptable

empe-namesalaryagecitV

10White140(0.4137(0.51Chicago

20Green200(0.9129(1)NewYork

30Smith160(0.5147(0.1)Chicago

有如下的查询:“findtheemployees(numberandname)fromChicagowhoarewell-paidandratheryoung”可以表示成如下的查询语句:

seleetemp,namefromEMPwherecity=‘Chicago’andsalary=‘well-paid’

andage=‘rather-young’:

假设上面表中括号中的值表示属性的值对应查询条件“well.paid”和“rather.young"的隶属度,则这个查询产生了一个模糊的二元关系表:

表4.2运算表

Tab.4.2Thecalculationtable

empe-nameMembershipdegree

10肋iteMin(1,0.4,0.5)=0.4

30SmithMin(1,0.5,0.1)=0.1

在SQLF查询语句表达式qbrelations相当于一系列普通的关系表,fuzzy

下面详细的描述这些模糊条件可能带来的不同的形式的操作。

SQLF模糊谓词

首先,这里有基本的谓词,每一个基本谓词都由基本域的一个子集上的一个资格函数来表示。而要考虑的是谓词P,利用资格函数将P应用到集合X的每一

P:X一[O,1】condition同时指模糊的条件和基本的布尔型条件,这些条件通过连接符进行连接。4.1.2个单一的元素上:

第四章扩展SQLF查询语句

然后依据运算将整个集合上的元素映射N[0,1】。在此基础上利用一元运算符就可以定义一些其他改进的谓词【5纠。如:

否定谓词可表示为:P,,otp(x)=1一印(x);

幂谓词操作:pmodp(x)=laP”(x)=(炉(x))”;

反义词(antonyms)谓词操作:bta。t(p)(x)=印(M-x)其中a11t(p)是定义在x∈[O,M】上的P的反义词。比如“small“和“large",或者“young”和“old”。

同时能够通过n元运算符操作来定义一些复合谓词,首先要考虑的是在模糊集交、合并运算中常用到的AND/OR,同时也要考虑到谓词作为参数的下面的这一类的折中运算操作:

算术平均:am(p”….P。)(z)=(Pl(X)+…..以(x))/刀,

几何平均jgm(p1,..…P。)(工)=(Pl(x)宰…。P。(x))l/n,

调和平均:hmc(pl,.…P。)(工)=n/(1/pl(x)+….+l/p。(x)),

加权平均:wm(p”….P。)(z)=WlPl(x)+IOtttt+w,p。(x),其中任意一个wJ都属于[0,1】,且所有的w』的加起来的和是1.

所有上面的这些运算在不同方面的应用都会有不同的效果,所以在实际运算中主要是它们的相互结合运算。

4.1.3SQLF模糊语义约束

在模糊查询情况下,扩展的查询语句块允许返回重复的元组,这些重复的元组在某些属性具有相同的值却有不同的隶属度。为了消除这些重复的元组,在标准SQL语言中使用关键字distinct。可能还有别的不同方式出现的重复元组,因此,需要假定在重复元组中将隶属度最大的元组保留。假设R是一个模糊关系(比如是由模糊查询返回的结果集),fc是一个模糊限制条件,考虑如下的查询:

selectAfromRwherefc该查询产生一个模糊关系I强属性A上的值a属于Rf的隶属度为:

模糊本体在关系数据库系统语义检索中的研究

IX盯(口)=supmin(pJR(x),“庙(x))

工∈Support(R)

andX.A=口

其中X.A表示元组在属性A上的投影。下面为了大家能看的更加清楚,我们假定在上面查询中出现的关系R是普通的关系而不是模糊关系,那么上面的表达式就可以表示为:

p可(a)=suppIc(x)

X∈Randx.A=a

4.1.4SQLF模糊语义连接

在SQLF中,一个多表连接的操作中允许使用模糊选择表达式,模糊连接和不完全模糊连接是普通关系的选择操作的一般化,结合不完全连接(不完全连接是指关系R和关系S在某些属性的投影上的链接),则模糊连接可表示为:

selectR.A,S.BfromR,Swherefcl(R)andfc2(s)andR.C0S.D

其中0是一个模糊连接操作符,关系对(a,b)属于结果集Rf的隶属度为:

p彤(口,b)=supmin(p归l(工),p肛2(y),po(x.C,Y.D))

and工.A=a(x,y)IX∈R

Y∈SandY.B=b

4.1.5SQLF嵌套查询语句

SQLF对SQL的嵌套查询进行了扩展,下面就以带in运算的嵌套查询为代表进行详细的说明。在SQL中,运算符in用在成员资格运算操作中。在SQLF中,一些不准确的信息可能会出现在以下不同层次的查询中:一方面,想知道一个元组是否属于这个模糊关系;另一方面,想去检查一个模糊成员隶属程度(在普通或模糊关系的范围内)159】。

在SQL中,给出一个包含in运算的查询的例子“findtheemployees

than35whoworkinayoungerdepartmentwhosebudgetishigherthan¥100000",该查询可以表示为:

selectempfromEmpwhereage<35anddepin

(selectdepfromDepwherebudget>100000);

第四章扩展SQLF查询语句

在SQLF中,由于每一个查询语句块都会产生一个模糊关系,所以为了将成员表达为模糊集就需要扩展i11运算符。模糊集运算理论使我们能够通过使用和当前所考虑的集合相关联的隶属度函数来决定一个元素属于一个特定类的程度。这一点正是说明了一个从模糊选择操作而得到的模糊关系集合可能会包含重复元组的存在【鲫。所以,可以用如下的方式定义in谓词:

p。(口,E)=sup(min(p.(口,6),pE(6)))

b∈Support(E)

其中a是一个元素,E是考虑集。这样的定义有一个好处就是能够保留SQL中一些合理有效的等值操作。例如下面的这个查询:”fredtheyoung

inaemployeeswhoworkhigh—budgetdepartment'’,可以表示为:

‘young’anddepinselectempfromEmpwhereage=

(select

也可以表示为多表连接操作:depfromDepwherebudget=‘high’);

selectempfromEmp,Depwhereage=‘young’andEmp.却=Dep.dep

andbudget=‘high’:

在后一种查询的形式下,一个employeee的划分层次的过程为:

min(p,。馏(PJ口,),supmin(ixh,gh(budget),p兰(d.dep,e.dep))

d∈Dep

在前面的查询中,如果SQ代表的是内部的查询,则有:

肛R。。(P)=min(肛恍(P),“。(P.Dep,SQ))

如果使用前面的谓词i11的定义取代肛。(P.Dep,跑)的话,就会发现两种形式的查询的结果是一样的。这就说明,如果fcl(R)(fc2(S))是应用在关系R(S)上的模糊条件,那么以下两种形式的操作结果是一样的。

(1)selectR.}fromRSwherefcl(R)andfc2(S)andR.A=S.B;

(2)select宰fromRwherefclandAinfselectBfromSwherere2):

依据对称性的原理,就可以得到notin的定义为:

模糊本体在关系数据库系统语义检索中的研究

p。讲。(口,E)=1一p加(口,E)

在上面的情况下,将一个多表连接查询转换成嵌套查询,就相当于是在查询中存在了一个等值连接的从句。而当连接从句是近似相等(≈,大约)操作的情况也同样值得人们去研究。出于这个目的,SQLF提供了表达这种通过计算一个集合中接近所考虑元素的元素的范围去测试一个成员和一个集合(模糊或者非模糊)的关系的查询的能力㈣。为此,定义了一个新的必须的运算符inf。

例如这样的查询:“find

about1000timestheirowntheemployeeswhoworkinadepartmentwhosebudgetissalary”能够通过多表连接查询表示为:

selectempfromEmp,DepwhereEmp.dep2

Dep.depandDep.budget--Emp.sal幸1000;

使用in嵌套查询可以表示为:

selectempfromEmpwheredepin

(selectdepfromDepwherebudget≈Emp.sal+1000):

而使用嵌套运算符inf可以将模糊成员表示成一个集合:

selectempfromEmpwheresal宰1000

inf(selectbudgetfromDepwheredep=Emp.dep);

这种所考虑元素和集合中的元素的相似的比较必须要通过隶属度的计算来确定,

因此对运算符inf的定义为:

Jpinf(口,E)=pinf(口,2sup。min(a(min(p。(口,6),p£(6))。【口,D),p£【6"

b∈Suppom(E)

如果能够把绝对的等值看着是相似运算符≈的一个特例的话,那么in运算符就可以看做是inf的一个特例。相似运算符的定义为:

p。(口,b)=min(x,y)/max(x,y)

通过对inf的定义我们也许能看出下面两种表达的是等价的:

(1)selectR.宰from&Swherefcl(R)andfc2(S)andR.A≈S.B;

(2)select宰fromRwherefclandAinf(selectBfromSwherefc2):更确切的说,这种等价是从下面的两个等价运算来保证的:

第四章扩展SQLF查询语句

(1)sup

Y∈Smin(pt(x?舢曰),p斥2(啦

、(2)b翼Supp血or呱t(虬Sf,∞帕p”;∈

其中Sf是内部查询的返回结果。运算符notint的定义和notin的定义类似,在这里就不进行详细的描述了。

4.2基于语言变量本体的SQLF扩展

总体来说,模糊查询包含专门的术语(原子谓词,修饰词,连接词,)和一些面向特定用户组(或者单一用户)有特殊含义的词汇。系统将会包括三个组成部分:第一,基本的操作,例如连接、否定、算术平均等,这些操作只被定义一次,在后来的使用就不用再定义【62】。第二,一般的操作,这种操作需要用户提供额外的参数(大多数情况下是修饰词,加权平均数等)。第三,用户自定义的部分:原子谓词像young、important、high等。对于young、important这些用户自定义的谓词,SQLF查询处理起来就很复杂,而且处理的能力也很有限,因为对这些谓词的定义是很复杂的工作。而语言变量本体对于这样含有语义信息的语言值则具有很好的管理能力,于是可以采取语言变量本体来定义和管理这些词汇,引入语言变量作为数据库中一种新的数据类型,然后在语言变量本体中定义这些语言变量值之间的各种关系。这样在数据库中的记录就可以使用语言值来表示语言变量属性的值,而SQLF是无法对这样的记录进行模糊查询处理的,因为SQLF只能处理常规的数值型数据。因此在SQLF中引入语言变量本体将会更大的扩充数据库的模糊语义检索的能力。

引入语言变量本体后的SQLF查询语句的基本语法格式和SQLF一样,只是在查询处理的条件限定上增加了对语言变量数据类型的处理和扩展,扩展后的SQLF基本语法格式是:

select【nltln,t】(attributes)from(relations)where(fuzzycondition)

模糊本体在关系数据库系统语义检索中的研究

查询处理经过三个过程:

(1)对参与查询的关系表的投影进行笛卡尔积操作;

(2)应用模糊查询条件,并对语言变量数据类型的查询结合模糊本体进行扩

展处理(产生一个模糊关系表);

(3)对查询返回的结果进行排序、调整返回结果的范围等处理。4.2.1单一语言变量值查询扩展

现在结合实际查询的实例来对扩展SQLF查询语句进行详细的说明,首先考虑数据是纯语言变量数值类型的情况,还是针对前面的职员表:EMP(#emp,e.name,salary,age,city),假设表中有如下记录,其中age属性的取值通过结合本文前面定义的age语言变量本体而引入了语言变量数据类型,基于语言变量本体中包含关系

的查询扩展处理为:

表4.3EMP表

Tab.4.3TheEⅣ口table

emp102030406070

e-name

salary140200160180130230

ageadultyoungoldyoungolderold

cityChicagoNewYork

White

GreenSmithJetJackFenli

Chicago

NewYorkBOston

Chicago

首先有查询:“fmdtheemployeeswhoseageisold’’,这种情况查询处理要结

合语言变量本体中的包含关系了,由定义2.15我们可知“old"和“older"具有包含关系,则查询语句为:

selectemp.agefromEmpwhereage=‘old’;

查询处理基于包含关系的的语义扩展SQLF语句为:

selectemp。agefromEmpwhereage=‘older’or

age=‘old’;

第四章扩展SQLF查询语句

查询处理后返回的结果如下所示:

表4.4查询结果

Tab.4.4Thequeryresults

empage

60older

30old

70old

再有查询:“findtheemployeeswhoseageis≤old”,因为不能对“age”列的语言变量值进行大小的比较,所以这种语义查询的处理就要使用语言变量本体中的序关系,结合定义2.15中Gage语言变量本体模型,我们可以得到序关系

“young_<adult_<old",当处理“_<old’’这个条件的时候,通过语言变量本体中定义的序关系,查询就可以找出比“old“要小的值,并通过序关系将查询返回的结果

查询的扩展SQLF语句为:

selectemp.agefromEmpwhereage=‘old’orage<‘old’;

查询处理基于序关系的的语义扩展SQLF语句为:

selectemp.agefromEmpwhereage=‘old’orage=‘adult’orage=

‘young’;本查询返回的结果如下表:排序显示。

模糊本体在关系数据库系统语义检索中的研究

表4.5查询结果

Tab.4.5Thequeryresultsemp2040103070

ageyoungyoungadultoldold

4.2.2混合类型的查询扩展

有了单一的语言变量值类型的查询之后,需要进一步考虑属性值即含有语言

变量类型也含有常规数值类型的混合类型的查询的扩展查询语句,假设查询处理的表中有如下数据:

表4.6EⅣ伊表

Tab.4.6

emp102030406070

e-name缪乃iteGreenSmithJetJackFenli

salary140200160180130230

TheEMP

tableage37youngold20adult47

cit),

Chicago

NewYork

Chicago

NewYorkBOstonChicago

有查询:“findtheemployeeswhoseageisyoung’’,这虽然是基本的查询,但

是由于处理的是混合类型的值,既有普通的数值型数据又有语言变量类型的值,所以处理的时候要结合定义2.15中的语言变量本体,通过使用语言变量本体中定义的论域U=【0,100],然后使用隶属度函数计算数值对于查询条件的隶属度,隶属度函数如下所示,所以扩展SQLF查询语句为:

selectemp,agefromEmpwhereage=‘young’:

第四章扩展SQLF查询语句

图4.1age的隶属度函数

Fig.4.1TheMembershipfunctionofage

扩展SQLF查询处理过程是这样的,当处理到常规的数值型数据的时候,就会按照SQLF的隶属度函数去计算相应的数值对于查询条件的隶属度,当处理到语言值的时候,就可以通过语言变量本体中的定义好的关系来直接进行比较。对数值型数据的隶属度的运算如下表:

表4.7运算表

Tab.4.7Thecalculationresults

emp

10

40

70age372047MembershipdegreeO0.7O综合数值型记录和语言变量值类型记录的处理结果,查询返回的结果是:

模糊本体在关系数据库系统语义检索中的研究

表4.8查询结果

Tab.4.8Thequeryresultsemp2040

ageyoung20

前面的查询都是针对单一列的查询,那么扩展SQLF查询对于多个列的查询又是如何处理的呢?仍以上面的职员表:EMP(#emp,e-name,salary,age,city)茭J例,在表中的salary属性中也引入语言变量,salary概念取值集ff-寸{low,normal,high),表中有如下记录:

表4.9EMP表

Tab.4.9

emp102030406070

e-nameⅥmiteGreenSmithJetJackFenli

salarylowhigh160normal130high

The

E~咿table

age37youngold20adult47

Cl“

Chicago

NewYork

Chicago

NewYorkBOston

Chicago

对于如下的查询:“findtheemployeeswhosesalaryishighandwhoseageis

young",扩展SQLF查询语句为:

selectemp,salary,agefromEmpwheresalary=‘high’

andage=‘young’;

查询处理的过程要进行模糊集的运算,运算过程参见SQLF模糊谓词一节的介绍,运算过程由下表所示:

第四章扩展SQLF查询语句

表4.10模糊集运算

Tab.4.10Thecalculateofthefuzzysets

emp

10

20

30

40

60

70MembershipdegreeMin(0,0)=0Min(1,1)=1Min(1,O)=0Min(0.5,0.7)=O.5Min(0.7,0.5)=0.5Min(1,O)=:o

如果查询返回运算结果在O.5以上的记录,则查询结果为:

表4.11结果集

Tab.4.11Theresultsets

emp

20

60

40salaryageyoungadult20hi曲130normal

-42-

模糊本体在戈系数据库系绩语义检索中的研究

第五章服装领域数据库的模糊语义查询系统

51系统总体设计

在日常生活中,人们都知道颜色是服装很重要的一个属性,通过颜色对各种服装进行管理也是服装信息管理领域经常使用到的,本文通过结合构建的颜色本体模型,设计一个针对服装的颜色属性的关系数据库模糊语义检索系统,系统的总体设计如r图所示。其中扩展的数据库引擎是用于存储、处理和保护数据的核心服务,主要包括创建用于存储数据的表和用于查看、管理和保护数据安全的数据对象(如索引、视图和存储过程)。服装信息数据库有包括各种服装信息(衬衫、裤子、夹克、帽了、鞋等)。

F培5】The._一图51系统总体殴计SystemDesign

下面是系统的数据库E.R图,其中服装实体包括各种服装信息(衬衫、裤子、央克、帽子、鞋等)。

第五章服装领域数据库的模糊语义查询系统

服装

匿sh愀!

name

SeX

?jacket

n锄e

SeX

table

”hat渊e71

’tr;s£fsta‘b‘le月

,《

幻shoe

r6

table!

■…删ei

name

SeX

n锄e

Sex

n锄e

SeX

n啪e

SeX

pncecolor

pncecolorproduce._city

pnceprlcecolor

produce_city

pricecolor

pnce

color

producecity

colorproduce_city

produce_cityproduce_city

图5.2服装实体

Fig.5.2Theentityofclothes

图5.3E.R图

Fig.5.3

The

E-Rfigure

5.2模糊查询实现

在图5.1中,可以看出系统的核心部分就是颜色语言变量本体和关系数据库的

结合,系统对数值型数据进行语义查询的时候,采取SQLF的查询处理方式,当

模糊本体在关系数据库系统语义检索中的研究

对有语言变量类型的数据进行查询处理时候,就要使用到颜色语言变量本体中的定义和各种关系,通过关系比较查询出用户需要的数据。下图是颜色语言变量本体的可视化界面,用户可以查看颜色语言变量本体中的各个概念和概念的取值。

图5.4颜色本体概念集

Fig.5.4Theconceptsofthecoloromology

第五章服装领域数据库的模糊语义查询系统

语言变量本体蓐—L

固红(红色)

凸大红(很红的颤色)

函鲱红(鲜红)

函火红(像火一样的红)

凸水红(比粉红咯深而比较鲜艳的红色)

函粉红(红和白合成的颜色)

函血红(血色)

凸朱红(比较鲜艳的红色)

凸燎红(浅红色)

凸妃色(淡红色)

团黄(黄色)

卜|)鲜黄(鲜明的黄色)

}[)明黄(纯芷鲜亮的黄色)

卜函亮黄(鲜亮的黄色)

l0[)澄黄(黄而涪澈的颜色)

il卜国籍黄【灰暗的黄色)

}L函昏黄(暗淡梗糊的黄色)

扣口绿(绿色)

.-囱蓝(蓝色)

争口紫(紫色)l|

争四褐(渴色)

争固黑‘黑色)

f囝白(白色)

l}函死白(非常白的颤色)

|{~瓦鲜白f畦明的自声)圈国赫o‘。.。.。。.。_-_一§‰.____。。,。..‘.捌

图5.5颜色语言变量本体

Fig.5.5Thecolorontology

根据第三章定义的颜色本体模型,结合模糊集理论的基础,对数据库中的服装信息进行查询扩展,在普通查询的基础实现模糊语义查询,下面对查询处理结合部分实例进行说明。选定查询对象为服装数据库中衬衫信息表,其中在color属性中引入了语言变量数据类型,表的信息如下:shirt_table(name,sex,price,color,produce_city)

模糊本体在关系数据库系统语义检索中的研究

假设表中的数据记录如下:

…ln锄e’sex

1{衬衫男

2{衬衫女

3i衬衫男

4}衬衫男

5i衬衫男

6}衬衫文

7{衬衫女

8}衬衫文

9l衬衫男

10l衬衫男

11{衬衫女

12{衬衫男

13i衬衫男

14l衬衫男

15l衬衫女

16|衬衫男

"l衬衫男

18l衬衫女

19{衬衫男

20;衬衫男

21;衬衫女

22{衬衫男

231衬衫女

24i衬衫女{price100}color;produce—city红色上海200紫色北京50黄色北京120红上海120白色上海89粉红大连66火红北京88水红温州139红上海100粉红大连100白大连80大红上海160嫩红大连300绯红上海180大红北京150水红温州100妃色上海69绿色大连99黑色上海109红色大连106火红温州.『9碧绿青岛199大红广州99火红广州

图5.6衬衫信息表

Fig.5.6Theshirttable

首先来看查询一:

句是:“找出shirt—table中color是红色的记录’’,系统查询的语

select宰fromshirt—tablewherecolor=‘红色’;

可以看出这是一个简单模糊语义查询,因为普通的数据库查询只能处理精确的匹配,即只能找出和“红色”完全匹配的记录,普通关系数据库查询返回结果为:-47.

第五章服装领域数据库的模糊语义奇询系统

国5.7soL查询结果

Fig.57ThequeryresultsoftheSQL

但是对于扩展SQLF查询语句处理的时候就会结合前面定义的颜色本体,查询处理就会结合颜色本体中定义的概念之间的层次关系“SubClassOf'’,能够查询出和“红色”这个模糊概念中的所有于概念相匹配的记录,同时结合颜色本体中定义的概念之间的“SynonymOf”关系,查询出和“红色”同义概念“红”相匹配的记录。那么该查询经过系统处理后返回的结果为:

图5.8扩展sOLF查询结果

Fig58TheqtmryresultsoftheexpandSOLF从上面的查询结果中,可以看出系统在处理查询的时候,会结合颜色语言变

模糊本体在关系数据库系统语义检索中的研究

量本体中定义的概念之间的“序关系"来对查询返回的结果进行排序处理,返回的结果按照颜色本体中定义的序关系显示结果。

还是针对服装数据库中衬衫信息表shirt—table,假设表中有如下数据:

~、

l{I

垫翌!兰坚

;衬衫男2{衬衫女3{衬衫男4{衬衫男5|衬衫男6l衬衫女7{衬衫女8i衬衫文9;衬衫男lO}衬衫男11{衬衫女12l衬衫男13l衬衫男14{衬衫男151衬衫女16|衬衫男17}衬衫男18:衬衫女19l衬衫男20;衬衫男21;衬衫女22;衬衫男

。:旦三!曼宝

692005012012089788813910010080160300180150100699910929979

1212三:里三2盘曼曼。£垫Zi

绯红紫色黄色红白色粉红水红水红红粉红白大红嫩红绯红大红水红妃色绿色黑色红色绯红碧绿

大连北京北京上海上海大连上海温州上海大连大连上海大连上海北京温州上海大连上海大连上海青岛

三U衬衫女……199………。大红广州

图5.9衬衫信息表

Fig.5.9Theshin—table

查询二:语句为:

“查询颜色为大红,并且价格为high的衬衫的信息”,数据库查询

select木fromshirt—tablewherecolor=‘大红’and

price=‘lligh’:

查询对“price”的数值的处理,会采取SQLF中的模糊集运算的处理方法对

数据库中的记录进行处理,通过隶属度函数计算隶属度得到最终的结果,价格的隶属度函数和计算的过程如下所示:

.49.

第五章服装领域数据库的模糊语义查询系统

翻510价格的隶属度函数

Figr510TheMembershipfonetionofprice

表5I运算表

Tab51Thecalculationtable

colorMembershipdegree太红Min(1.a、卸大红Min(1.09瑚9大红199Min(1,I)--I

查询返回的结果是:

图511扩展SQLF查询结果

Fig511ThequeryresultsoftheexpandSQLF

模糊本体在关系数据库系统语义检索中的研究

查询三:“查询出颜色为火红的衬衫的信息”,查询的数据库语句为:

select’fromshirt_tabhiwherecolor=‘火红’:

从表中的数据中可以看出,记录中并没有颜色是“火红”的数据存在,那么普通查询的结果就是返回一个空集。但是对于模糊语义查询来说结果就不是空.因为查询处理会结合颜色语言变量本体中定义的概念之间的序关系,查询处理如果能找到和“火红”相匹配的记录,则显示出结果,如果查询处理拽不到和“火红”相匹配的记录时,就会通过颜色语言变量本体中的序关系查询出和“火红”最接近的概念“绯红”和。水红”相匹配的数据库记录,如果和“火红”最接近的概念的记录也不存在,那么就近回空。所有查询返回的结果集中依然是按照序关系排列的,该查询返回结果是:

图512扩展SQLF查询结果

Fig512ThequeryresultsoftheexpandSQLF

第五章服装领域数据库的模糊语义查询系统

综合上面查询的例子,我们可以通过查询实例的语句执行和查询结果来对SQL和扩展SQLF进行查询的比较,比较如下表所示。从表中的对比中可以看出SQLF和SQL相比,在一定程度上实现了数据库模糊语义查询。

表5.2SQL和SQLF的比较

Tab.5.2ThecontrastofSQLandSQLF

SQLFSQL

查询语句结果

红色

红色

selectcolorfromshirt——tablewhereselect

wherecolorfrom查询语句结果红色红shirt——table大红火红

粉红color=‘红色’;color=‘红色’;.

selectcolorfromshirt——tablewhere空集select

wherecolorfromshirt——table绯红水红color=‘火红’:color=‘火红’;

selectcolor,price

fromshirttablewhere

andprice=‘high’:不能color=‘大红’执行selectcolor,pricefromshirt—tablewherecolor=大红,199大红,180‘大红’andprice=‘high’;

模糊本体在关系数据库系统语义检索中的研究

第六章总结和展望

6.1总结

本文在国内外学者的研究成果基础上,通过结合本体理论和模糊本体理论,以及语言变量模糊本体理论,在关系数据库的检索中引入语言变量数据类型,以实现关系数据库的模糊语义查询。论文中对本体、模糊本体和语言变量本体的数学模型进行介绍,并通过一些实例对定义进行了解释。核心部分是对颜色本体构建和数学模型的定义,提取了九个基本颜色词,对每个基本颜色词分别给出了部分取值集合。论文定义了颜色语言变量本体并着重描述了颜色语言变量本体中的序关系,对数据库模糊查询语言SQLF进行了进一步的扩展,在SQLF中引入语言变量模糊本体,并在数据库中引入语言变量数据类型,通过SQLF和语言变量本体的结合以实现关系数据库的模糊语义查询。文章的最后设计了一个基于服装领域数据库的模糊查询系统,给出了系统的总体设计和数据库结构以及部分语义查询的实例。总体来说,扩展后的SQLF查询语句,通过引入语言变量和模糊本体的结合,在一定程度了实现了数据库的模糊语义查询,能够在更大程度上满足用户的查询需求。

6.2未来工作的展望

但是由于本体的构建是一项比较困难和复杂的工作,尤其是本体中概念的关系错综复杂,很难把所有的关系就定义出来,同时在领域内部寻求一个统一的标准也是一个比较困难的工作,所以本文的扩展后的SQLF查询语句仍然存在很多问题,在处理很多模糊语义查询需求的时候还会存在不足之处,例如对查询执行时间的考虑等,所以这种查询要应用到大规模的数据库检索中目前来说还很困难,在语言变量本体和隶属度的结合以及本体和数据库的结合方面还需要做进一步的研究工作。

参考文献

参考文献

[1]何新贵.模糊数据库中的语义距离及模糊视图.计算机学报,1989,10:757-764.[2]何新贵.模糊集间的语义关联度及其应用.软件学报,1994,5(6):19—24.

[3]殷荃.模糊数据库中的数据表示与数据匹配.计算机工程与应用,1997,5:7-9.

[4]刘惟一.基于语义贴近度的模糊数据依赖.计算机学报,1997,20(8):725—730.

[5]刘凤玉,曹玉斌.模糊关系数据库FRDBMS的设计与实现.计算机研究与展,1991,4:39-45.[6]黄名选,严小卫,张师超.查询扩展技术进展与展望.计算机应用于件,2007,24(11):1-4.[7]张李义.基于模糊语义距离的多媒体信息检索方法研究.情报学报,2003,22(2):131-135.[8]张志政.模糊关系数据库及应用研究.南京航空航天大学硕士学位论文,2003,3.

[9]陈逸菲.基于模糊理论的关系数据库查询技术研究.南京信息工程大学硕士学位论文,2005,5.

[10]周德文.关于主动模糊关系数据库研究.西南交通大学硕士学位论文,2003,3.

[11]张哲.关系数据库管理系统中支持基于本体的语义匹配.计算机与数学工程,2008,36(2):47—51.

[12]王珊,张俊,彭朝辉,战疆,杜小勇.基于本体的关系数据库语义检索.JournalFrontiersofComputerScienceandofTechnology,2007,1(1):59—78.

[13]郑杰,纪希禹.基于本体的语义检索模型.科技情报开发与经济,2007,17(25):119—121.[14]花开明,陈家训,杨洪山.基于本体与元数据的语义检索.计算机工程,2007,33(24):220—223.

[15]张晨,穆斌.在不同本体环境下的语义检索.合肥工业大学学报,2005.28(2):171—175.[16]CarlosD.Barranco,JesusR.Campana,Juan

OntologiesincludingFuzzyDatatypes

ConferenceonM.Medinaand0.Pons,OnStoring16thinRelationalDatabases,InProc.oftheIEEE.InternationalFuzzySystems.

[17]翟军,陈燕,沈立新.基于模糊本体的智能交通系统知识建模.大连海事大学学报,2008,34(2):91—94.

[18]JunZhai,YanChen,QinglianWang,andMiao

SharingonLv.FuzzyOntologyModelsUsingIntuitionisticFuzzySetforKnowledge

ofthe12thInternationalConferenceontheSemanticWeb.In:ProceedingsComputerSupportedCooperativeWorkinDesign.[19]郑晓霞,石磊.模糊本体在语义信息检索中的应用.黑龙江工程学院学报.2008,22(1):74-77..54.

模糊本体在关系数据库系统语义检索中的研究

[20]秦和平,邢宝妹,周佩琴.语言变量及其”值”的相关概念和符号使用字体探讨.编辑学报,2006.18(3):183—184.

[21]伍铁平.模糊语言学.北京:北京师范大学出版社,1987.

[22]伍铁平.模糊语言学综论.西南师范大学学报.1997年第6期:88—90.

[23]吴世雄,陈维振.中国模糊语言学:回顾和前瞻.外语教学与研究.2001.33(1):7—13.[24]吴世雄,陈维振.中国模糊语言学的理论研究述评.福建师范大学学报.2000年第2期:76—80.

[25]周佳颖.从模糊语言到模糊限制语.上海外国语大学硕士学位论文,2005,3.

[26]卢俊燕.语言交际中的模糊限制语的研究.西南师范大学外国语学院硕士学位论文,2002,4.

[27]翟军,李强,梁艺多.语言变量模糊本体的表示与构建.计算机与数字工程.2009,39(9):113—115.

[28]李善平,胡玉杰,郭鸣.本体论研究综述.计算机研究与发展,2006,41(7):2-4.[29]N

ConfonGuarino.Formalontologyandinformationsystems.In:Procofthe1stInt’1FormalOntologyinInformationSystems.Trento,Italy:IOSPress,1998.3—15.

thedesignofontologiesusedforknowledge[30]Gruber

sharingTR.TowardsprinciplesforInternationalJournalofHumanandComputerStudies,1995,43:907—928.

VR,FenselD.Knowledgeengineering:principlesand[313StuderR,Benjamins

methods.DataandKnowledgeEngineering,1998,25(122):161—197.

[32]杜小勇,李曼,王珊.本体学习研究综述.软件学报,2006,17(9):卜3.

[333G.Stumme,M.Ehrig,S.Handschuh,丸Hotho,A.Maedche,B.Motik,D.Oberle,C.Schmitz,S.Staab,L.Stojanovic,N.Stojanovic,R.Studer,Y.Sure,R.Voh,V.Zacharias.TheKarlsruheView

InstituteAIFB,2003.onOntologies.TechnicalReportUniversityofKarlsruhe,

[34]陆建江等.语义网原理与技术.北京:科学出版社,2007.

[35]MarcEhrig.OntologyA1ignmentBridgingtheSemanticGap.UniversityofKarlsruheGermany,Springer2007.

[36]邓志鸿,唐世渭,杨冬青.Ontology研究综述.北京大学学报,2007,38(5):2—5.[37]HorrocksandPatel—Schneider.http://www.duml.org/rules/proposal.

[38]胡鹤,刘大有,王生生.Web本体语言OWL.计算机工程.2006,30(12):卜3.

[39]6rigorisAntoniou著,陈小平等译.语义网基础教程.北京:机械工业出版社,2008...55-

参考文献

[40]PhilippCimiano.OntologyLearningandPopulationfromTextAlgorithms,

Applications.UniversityofKarlsruheGermany.2006Springer.Evaluationand

[41]黄茂军.地理本体的关键问题和应用研究.合肥:中国科技大学出版社,2006.

[42]张红.语义网中的本体推理及其应用研究.吉林大学硕士学位论文,2003.

[43]尹皎,郑军.Ontology在语义信息检索中的使用.农业图书情报刊,2006,18.

[44]王艳芬.基于本体技术的元搜索引擎系统的实现与研究.苏州大学硕士学位论文,2007.[45]奕艳,丁二玉,骆斌.基于Ontology的语义检索技术.计算机工程与应用,2005(28):156-159.

[46]ElieSanchez,TakahiroYamanoi.FuzzyOntologiesfor.theSemantic

Science,2006:691—699.

andWeb.LectureNotesinComputer[47]Jun

BasedZhai,YiduoLiang,YiYuFuzzyOntologyforJiataoJiang.SemanticInformationCommerce.RetrievalSOFTWARE,onElectronicJOURNALOF

2008,9(3):20—24.

[483JunZhai,YanCao,andYanChen.SemanticInformationRetrievalBasedonFuzzyOntologyforIntelligentTransportationSystems.2008IEEEInternationalConferenceonSystems,ManandCybernetics(SMC2008):2321—2326.

IQ(WIQ)”,[49]Zadeh

InvitedLA.“WebIntelligenceandFuzzyLogic—TheconceptofWebthe2003IEEE/WICInt.ConferenceontalkatWebIntelligence(WI2003),Halifax,Canada,availableat:www.comp.hkbu.edu.hk/IAT03/InvitedTalkl.html.

a[50]ZadehLA.TheConceptofLinguisticVariableandItsApplicationtoApproximate

Reasoning.InformationScience,1975,8(3):199—249.

[51]翟军,李剑锋,陈燕.基于语言变量的模糊本体模型.辽宁工程技术大学学报(自然科学版),2009,6:55—61.

[52]陈逸菲,叶小玲,张颖超.基于语言变量的关系数据库模糊查询.计算机工程,2009,35(9):28—30.

[53]杨永林.色彩语码研究一进化论与相对论之争.外语教学与研究,2000.3:200—203.[54]姚小平.基本颜色词理论述评.外语教学与研究,1988.1:35—44.

[55]叶军.含彩词语与色彩词语.山东大学学报,2001.3:46—53.

[56]李红印.现代汉语颜色词语义分析.北京:商务印书馆,2007.

[57]PatrickBosc,OlivierPivert.SQLF:ARelationalDatabaseLanguageforFuzzy.56.

模糊本体在关系数据库系统语义检索中的研究

Querying.IEEETransactionsonFuzzySystems,1995,3:P:卜19。

[58]石翌轶,郭秋华.基于关系数据库的语义查询方法.计算机工程,2008,34(14):55—57.[59]PatrickBosc,OlivierPivert.SubqueriesinSQLF,aFuzzyDatabaseQueryLanguage.

onIEEETransactionsFuzzySystems,1995,3:P:3636—3641.

[60]Claudia

aGonzdlez,MarleneGoncalves,LeonidTineo.ANewUpgradetoSOLf:TowardsWorkshoponStandardinFuzzyDatabases.20thInternationalDatabaseandExpertSystemsApplication,2009,35:441—446.

[613PatrickBosc,OlivierPivert.SQLfQUeryFunctionalityonTopofaRegularRelationalDatabaseManagementSystem.KnowledgeManagementinFuzzyDatabases,2000,P:17l一190.

[62]张娜,李宝敏.语义检索及其关键技术研究.计算机技术与发展,2006,11:22—25..57..

绿的概念集:

蓝的概念集:附录附录A颜色词汇概念集序号词目词典释义l绿色绿的颜色2大绿鲜艳的绿色3油绿有光泽的深绿色4鲜绿鲜明的绿色5碧绿青绿色6海绿深绿色7水绿浅绿色8惨绿浅淡

序号词目词典释义l蓝色蓝的颜色2宝蓝鲜亮的蓝色3天蓝像天空一样的蓝色4水蓝鲜蓝色5翠蓝青蓝色6葱白最浅的蓝色.58.

紫的概念集:褐的概念集:黑的概念集:模糊本体在关系数据库系统语义检索中的研究序号词目词典释义1紫色紫的颜色2大紫很紫的颜色3水紫鲜紫色4鲜紫鲜明的紫色5雪青浅紫色序号词目词典释义1褐色褐的颜色2茶褐色赤黄而略带黑的颜色3红褐色褐而红的颜色4绿褐色褐中带绿的颜色5蓝褐色褐中带蓝的颜色6紫褐色褐中带紫的颜色7灰褐色褐中带灰的颜色

序号词目词典释义1黑色黑的颜色2乌黑深黑3墨黑很黑的颜色4玄青深黑色5油黑黑而有光泽6灰黑色浅黑色..59—-

白的概念集:

灰的概念集:附录序号词目词典释义1白色白的颜色2死白非常白的颜色3鲜白鲜明的白色4雪白像雪一样的白色5银白白中略带银光的颜色6乳色乳白色7‘粉白浅白色

序号词目.词典释义

1灰色灰的颜色2铁灰色深灰色3土灰色灰土那样的颜色4乌灰色黑灰色5银灰浅灰而略带银光的颜色6灰白浅灰色.60.

攻读学位期间公开发表论文

攻读学位期间公开发表论文

1.JunZhai,JiataoJiang,YiYu,JianfengLi.Ontology-BasedIntergratedInformationPlatformforDigitalCity.2008.WiCOM4thInternationalConferenceonWirelessCommunications.NetworkingandMoblieComputing.Page(s):l-4.(EI检索)2.JunZhai,YiduoLiang,JiataoJiang,YiYu.Ontology—BasedInformationRetrievalforUniversityScientificResearchManagement.2008.WiCOM4thInternationalConferenceonWirelessCommunications,Networking

Jiang.UsingandMoblieComputing.Page(s):5—8.(EI检索)3.JunZhai,WeixinLuan,YiduoLiang,JiataoOntologytoRepresentFuzzy

onKnowledgeforFuzzySystems.2008.FSKDFifthInternationalConferenceFuzzy

SystemsandKnowledgeDiscovery.Page(s):673—677.(EI检索).61-

致谢

致谢

岁月如梭,两年的研究生生涯马上就要结束了,值此论文完成之际,衷心地向辛勤培育我的导师翟军副教授表示崇高的敬意和深深的谢意。读研期间,无论是生活上还是学业上,翟老师一直给予了我极大的关爱、帮助和鼓励,对于未来人生道路的规划,老师也给我提出了很多宝贵的建议,特别是撰写论文期间,老师更加关心备至,从论文的选题、构思到撰写及修改完成都自始至终得到了老师的启发、指导。特别是论文最后的修改阶段,翟老师很仔细的阅读我的论文并对论文中不合适的地方提出宝贵的意见。翟老师渊博的知识、高尚的人格、丰富的社会经验使学生受益匪浅,并永世难忘!

同时我还要感谢答辩委员会的各位老师,谢谢你们的指导和建议。我也诚挚地感谢我的同门及实验室里各位同学,与你们相识、相知,是我最大的幸福。

最后,我要感谢我的家人给与我精神上的支持和物质上的保障!家人的支持一直是我完成论文动力,论文的完成是对家人最大的回报

模糊本体在关系数据库系统语义检索中的研究

模糊本体在关系数据库系统语义检索中的研究

作者:

学位授予单位:姜甲涛大连海事大学

本文链接:.cn/Thesis_Y1696739.aspx

授权使用:中国科学技术大学(zgkxjsdx),授权号:065256e8-36e7-4879-8c82-9e6900ebefda

下载时间:20xx年1月12日

更多相关推荐:
本科论文开题报告的研究方法

调查法调查法是科学研究中最常用的方法之一。它是有目的、有计划、有系统地搜集有关研究对象现实状况或历史状况的材料的方法。调查方法是科学研究中常用的基本研究方法,它综合运用历史法、观察法等方法以及谈话、问卷、个案研…

开题报告中的研究内容和方法(仅供参考)

一要研究和解决的问题1收集必要的设计原始资料做好设计前的调查研究工作参考同类型设计的文字及图纸资料学习有关的国家法规及规范2确定建筑使用的材料和做法总体形状及各种尺寸3绘出平立剖总平面图详图写出施工说明并列出门...

开题报告中研究思路与研究方法的写法参考

开题报告中研究思路与研究方法的写法参考20xx0215195102分类毕业论文标签字号大中小订阅ltxmlnamespaceprefixquotvquotnsquoturnschemasmicrosoftcom...

毕业论文开题报告的研究方法

毕业论文开题报告的研究方法调查法调查法是科学研究中最常用的方法之一它是有目的有计划有系统地搜集有关研究对象现实状况或历史状况的材料的方法调查方法是科学研究中常用的基本研究方法它综合运用历史法观察法等方法以及谈话...

开题报告的研究方法有

开题报告的研究方法有调查法调查法是科学研究中最常用的方法之一它是有目的有计划有系统地搜集有关研究对象现实状况或历史状况的材料的方法调查方法是科学研究中常用的基本研究方法它综合运用历史法观察法等方法以及谈话问卷个...

课题开题报告与研究方案的报告范例

课题开题报告与研究方案的撰写方法第一部分一课题开题报告与研究方案的含义与作用开题报告就是当课题方向确定之后课题负责人在调查研究的基础上撰写的报请上级批准的选题计划它主要说明这个课题应该进行研究自己有条件进行研究...

常用研究设计(开题报告)的写法与研究设计

实证研究类论文研究设计开题报告内容要点一论文题目要求准确地反映所研究的主要变量及其关系对研究对象的范围有恰当的限定表述简洁二文献综述前人研究结果和分歧研究有哪些成果和进展在变量选取不足最后附上参考文献要求文献查...

课题开题报告与研究方案的撰写方法

课题开题报告与研究方案的撰写方法第一部分课题开题报告与研究方案的含义一开题报告与研究方案的含义一开题报告就是当课题方向确定之后课题负责人在调查研究的基础上撰写的报请上级批准的选题计划它主要说明这个课题应该进行研...

课题开题报告与研究方案的撰写方法

课题开题报告与研究方案的撰写方法第一部分一课题开题报告与研究方案的含义与作用开题报告就是当课题方向确定之后课题负责人在调查研究的基础上撰写的报请上级批准的选题计划它主要说明这个课题应该进行研究自己有条件进行研究...

课题开题报告与研究方案的撰写方法

课题开题报告与研究方案的撰写方法第一部分一课题开题报告与研究方案的含义与作用开题报告就是当课题方向确定之后课题负责人在调查研究的基础上撰写的报请上级批准的选题计划它主要说明这个课题应该进行研究自己有条件进行研究...

课题开题报告与研究方案的撰写方法

课题开题报告与研究方案的撰写方法第一部分一课题开题报告与研究方案的含义与作用开题报告就是当课题方向确定之后课题负责人在调查研究的基础上撰写的报请上级批准的选题计划它主要说明这个课题应该进行研究自己有条件进行研究...

开题报告中的研究方法~~~喜欢就拿去看看

调查法调查法是科学研究中最常用的方法之一它是有目的有计划有系统地搜集有关研究对象现实状况或历史状况的材料的方法调查方法是科学研究中常用的基本研究方法它综合运用历史法观察法等方法以及谈话问卷个案研究测验等科学方式...

开题报告中的研究方法(27篇)