信息计量学总结

时间:2024.4.14

信息计量学

   应用   利用信息计量学的基本原理和方法,可以测定学科的特性和信息源的分布,了解该学科的性质,分析和预测某一学科或技术领域的衍生和发展趋势。

利用信息计量数据,可以评价科学论文和科研成果的质量,度量科学研究的效率。

对科学研究进行评价,为进行科学的管理提供依据,为大学评价和科研评价提供有效的途径,等等。

网络信息”的计量,是网络化背景下信息计量和信息计量学科最具前景的应用领域和研究领域。

背景  社会实践需要是学科产生的根本动力    文献计量学和科学计量学的兴起    情报学的定量化发展趋势   众多研究者的努力

信息 信息是事物之间的差异(发现不同就是发现信息) 用以消除随机不定性的东西

信息计量的数据来源   科技图书 科技期刊 科技报告会议文献  专利文献 标准文献 学位论文 产品资料 技术档案 科技报纸  光盘数据  网络数据

目的: 引进“量”的概念和定量分析方法,进一步揭示信息单元的体系结构和数量变化规律,从理论上提高情报学及信息管理学科的科学性和精确性,促使这些学科向定量阶段发展;

同时,为改善信息情报系统提供定量依据,达到高效能的科学管理,使信息交流系统经常处于最佳运行状态,提供最优化的信息服务,以便更好地解决信息服务工作中的基本矛盾,克服“信息危机”,使信息管理工作更有效地为科学技术、经济和社会发展服务。

意义: 从理论上继续总结各种经验定律,使经验层次上的信息(情报)“工作”上升到理论层次上的信息(情报)“科学”,从而充实其理论的广度和深度,同时将各种经验定律在新的信息单元条件下进行检验和修正,探讨它新的适用性,从而大大提高情报学及信息管理学科的科学性,同时又能为实际工作提供理论指导。

信息计量学( Informetrics ):采用数学、统计学等各种定量方法,对社会化的信息交流过程中的信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计,以便揭示社会信息交流过程数量特征和内在规律的一门新兴学科 。

文献信息流:具有一系列主题特征的科学文献的集合。动态特性:科学文献随时间的延续而增长和老化的性质。文献信息增长规律、文献信息老化规律

静态特性:在一定时间内科学文献在空间的分布性质。布拉德福定律、齐普夫定律、洛特卡定律

“当前,已发表文章的增长、老化和离散规律,理所当然地被视为标志科学文献发展的最根本的规律。”([苏]米哈依洛夫)

布拉德福定律  

假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则各区的期刊数量满足下列关系:
               n1:n2:n3=1:a:a2          (a>1)

n1,n2 ,n3分别为“各个区的期刊数量”,显然n1+n2 +n3=N;

a为“布拉德福常数”(或称“比例系数”)。上述三个区分别称为:“核心区、相关区、外围区”

以期刊累积数量的对数(lgn)为横坐标,以相应的“相关论文”累积数量(R(n))为纵坐标作图

结论:“区域表示法”和“图像表示法”之间,存在着无法统一的矛盾。

文献为什么“离散”?

科学统一性原则:每一个科学学科都或多或少,或远或近地与其他任何一个学科相关联。因此,属于某学科的文献,不仅仅会出现在这个学科的专业期刊上,而且也时时可能出现在其他学科的期刊上。

文献为什么“集中”?

成功产生成功的原则(the success-breeds-success principle):一种期刊的文献量越大、质量越高,作者就越愿意将自己的文章刊登在这些期刊上,形成了一种“堆加效应” 。

布拉德福曲线中为什么会出现拐点?

饱和效应(saturation effect):期刊的载文量是有限的,随着文献累积量的增长,期刊载文量增加得越少,曲线上升得越慢。

洛特卡定律  从科学计量的角度,探讨科学家的著述规律及其与科技论文之间的数量关系。

首先,普赖斯确定了杰出科学家的定义,他认为所谓“杰出科学家”或“高产作者”应完成所有该专业论文总和的一半。同时他指出,“完成该专业论文总和一半的高产作者的人数在数量上等于该专业作者总数的平方根。”这就是著名的普赖斯定律。普赖斯在他的专著《小科学、大科学》中第一次提出这一定律:“科学家的总人数,大致是杰出科学家人数的平方。”

齐普夫定律  最省力原则”(the principle of least effort)是指 一个人在解决面临的问题时,将努力使他的劳动付出额减少到最低限度。在语言词汇的选取上,表现为选择他最熟悉最能表达自己意思的词汇。齐普夫把词汇的选择过程,归结为“力”的作用结果,即选择词汇时,由于“单一化的力”的作用,使我们总希望用熟悉的词汇去表达所有的概念,但是事物概念的多样性,产生“多样化的力”,总要求词义的专指性。“单一化的力”使词频增加,“多样化的力”使词种增加,这两种力的平衡,使词频等级呈双曲线关系。显然,齐普夫的解释是描述性的,并没有说明“力”是如何相互作用并取得平衡。目前,齐普夫的理论性论证至多仅有历史意义。

文献老化概念

前苏联情报A.N.米哈依诺夫的定义:科学文献随其年龄的增长,失去了作为科学情报源的价值,以及因此越来越少被科学家和专家们利用,老化的不仅是科学情报本身,而是包含这些情报的文献载体。

 所谓文献的“半衰期”,是指某学科(专业)现在尚在利用的全部文献中较新的一半是在多长一段时间内发表的。这与该学科一般文献失效所经历的时间大体相当。

称谓的“普赖斯指数”。就是在某一知识领域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指数,用以衡量文献的老化速度和程度。


“普赖斯指数”不同与“普莱斯定律”


英国的B.C.布鲁克斯(B.C.Brookes)引进期刊有益性的概念,用期刊的剩余有益性作为评价其老化的指标。某一年份某一期刊被用户所利用的文章数被称为期刊有益性。经过若干年后,期刊还保留的有益性——即剩余有益性,是期刊老化程度的一种量度。但采用期刊剩余有益性指标衡量老化程度时,只是对于满足一定类型和内容的情报需求的具体期刊来说才是适用的。

文献增长

指数增长

 d = ln2 / b ≈ 0.693 / b  (文献数量翻倍时间计算)

逻辑曲线

F(t)= k / (1+ae-kbt)         (k, a, b>0)

F(t):t年的文献累积量;

k:当t→∞时文献的累积量,即文献累积量之最大值;

a, b:条件参数

引文分析(共词分析)

“没有一篇科学论文是孤立存在的,它是被深嵌在整个学科的文献体系之中的。”([英]J.M.Ziman,1968)

“利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、专著、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。”

 影响因子 =某期刊前两年刊载的论文在当年的被引用次数

 除以   该期刊前两年刊载论文的总数。

概括的说耦合就是指两个或两个以上的实体相互依赖于对方的一个量度。

引文耦合

         当两篇文章同时引用一篇或多篇相同的文献时,这种现象称引文耦合,这两篇文献就具有耦合关系。

文献同被引

          两篇或多篇论文同时被后来的一篇或多篇论文所引证,则称这两篇论文具有同被引关系

区别:

引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被引证文献之间的关系。

引文耦合强度是固定不变的,同被引强度则随时有可能发生变化。

引文耦合形成的模型是静态结构模型,而同被引则是动态结构模型。

引文耦合是回溯性的,属于“回向引用”,而同被引则是展望性的,属于“前向引用”。

“同被引”比“引文耦合”更具有优越性


第二篇:化学计量学重点总结


一、英译汉(30分)

二、证明题(16分)

三、回答问题(54分)

1.正交试验设计

P63

正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。

例如,一个三因素三水平试验,各因素的水平之间全部可能组合有27种。全面进行试验可以分析各因素的效应,也可以选出最优水平组合。但全面试验包含的水平组合数数多,工作量大。在有些情况下无法完成。

若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。

正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。

如对于上述3因素3水平试验,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。

2.化学模式识别

化学模式识别(Chemical Pattern Recognition):是从化学量测量数据出发,进一步揭示物质的隐含性质,为化学家提供了十分有用的决策性信息。

根据实验得来的一批训练点,参照化学(或物理)模型或经验规律提出一批特征量;然后进行进一步特征抽取,以求得合适的特征量,张成模式空间或特征空间,必要时,对数据进行预处理。

预处理后,即可通过模式识别算法进行训练和分类,然后根据训练(或称学习)分类所得的判据,对未知样本进行判别(或称计算机预报)。

化学模式识别方法:

(1)有监督的模式识别方法(判别分析) 距离判别分析法:Fisher判别分析法、Beayes判别分析法、逐步判别分析法、线性学习机、K邻域判别法、势函数判别法、人工神经网络判别法等

(2)无监督的模式识别方法(聚类分析):

基于特征投影的降维显示方法(既可用于有监督的又可用于无监督的模式识别)。

主成分分析的投影显示法、SIMCA方法、基于偏最小二乘分解的特征投影法等。

(3)化学模式识别新方法

人工种经网络和一些基于全局最优算法的分类方法

3.置信度、置信区间及关系,如何选择等

P17、P19

4.化学计量学基本概念,主要研究内容

化学计量学的诞生是化学与分析化学信息化的产物。

定义一:化学计量学运用数学、统计学、计算机科学、以及其他相关学科的理论与方法,优化化学量测过程,并从化学量测数据中最大限度地获取有用的化学信息,可以说是一门化学量测的基础理论与方法学。

定义二:化学计量学是一门运用数学、统计学、计算机科学以及其他相关学科的理论与方法,优化化学量测过程,并从化学量测数据中最大限度地获取有用的化学信息的科学。

化学计量学是研究多变量化学体系的有力手段,为化学家提供了化学数据挖掘的工具。

从分析化学角度:

化学计量学的研究对象是化学量测的基础理论与方法学;是分析仪器智能化的理论与技术基础。

重要意义:

对发展分析化学基础理论、增强分析化学解决复杂实际问题的能力与促进分析仪器的智能化。

研究内容:

(1)采样理论:是指如何进行试样采集的数学统计理论。主要介绍常用的采样理论和方法,如固体物质的采样方法、动态过程的采样方法和质量检验的采样方法等。

(2)化学试验设计与优化方法:

目前统计学中最重要的三大试验设计体系:①因子试验设计、部分因子设计、半因子设计法、四分之一因子设计法;②正交试验设计、均匀试验设计③单纯形试验设计

优化方法:①应用数学中发展的优化算法,化学计量学中常用优化方法分局部优化算法和全局优化算法;②全局优化算法:随机寻优法.即模拟退火算法和遗传算法,伪蒙持卡罗法,即基于数论方法的序贯优化法。

(3)分析检测理论与信号处理方法:降低噪音、分辨重叠信号、消除干扰;分析信号的平滑方法、求导方法和变换方法;化学计量学研究重视的多变量处理的新方法之上,即基于傅里叶和小波变换的信号预处理方法。

(4)多元校正与多元分辨:包括单组分校正、多组分校正。多元校正与多元分辨主要研究的是复杂多组分体系的定性定量问题。

(5)化学模式识别(Chemical Pattern Recognition):是从化学量测量数据出发,进一步揭示物质的隐含性质,为化学家提供了十分有用的决策性信息。 

(6)定量构效关系:研究化学结构与化学物质的生物活性之间的关系,研究如何从物质的化学成分与结构来定量预测其化学特性;

(7)计算机数字模拟法(Computer Numerical Simulation)基于统计机理的Monte Carlo数字模拟法,基于微分方程数字解法的计算机模拟法,主要以可通用的微分方程数字解法。研究化学反应、化学量测过程中的误差规律和进行其他化学过程的机理研究一个很有效的辅助手段,亦属化学计量学研究的重要内容。

(8)人工智能与化学专家系统方法:化学量测及其数据解析中,如何将各类分析仪器量测所得的数据转化为有用化学信息;

传统上是依靠化学家、分析化学家运用其智能、专门知识、经验技巧及通过各类计算来完成的,能否设计计算机的专家系统,模拟化学家和分析化学家的脑力劳动。

5.正态分布及标准正态分布特点,概率密度函数

在分析化学中,当测量值无限多时,测量值一般符合正态分布.正态分布的概率密度函数式是

σ总体标准偏差:反映了测量值的分散程度;

μ总体平均值:反映了测量值的集中趋势。                       

正态分布记作:N(µ,s).

x=μ时 y值最大= ,表明集中趋势。

(1)曲线以x=μ这一直线为对称轴,说明正负误差出现概率相等。

(2)小误差出现的概率大,大误差出现的概率小,出现极大误差的概率极小。

(3)y随σ(精密度)变化。

以测量值 x为横坐标,曲线为  测量值的正态分布.

以随机误差x-μ为横坐标,曲线为随机误差的正态分布

 

令:

 

则:

这样的分布称为标准正态分布,它与σ的大小无关。  N(0,1)

(1)无论m和s值为多少,曲线和横坐标之间的总面积为1。

(2)即各种偏差的测定值出现的概率总和为1。

(3)测定值落在区间(a, b)的概率为曲线与a, b间所夹面积。

6.复杂多组分体系的定性定量问题

多元校正与多元分辨主要研究的是复杂多组分体系的定性定量问题。

构成现代分析化学基础理论研究的重要组成部分

在实际分析工作中所碰到的混合物体系,一般说来,不外乎以下三种情况:

① 白色分析体系:

定性组成已知某些混合体系;

分析目的只在于对各种物种(或物种的不同形态)进行定量分析。

如:已知药物片剂分析和某些已知有机反应的过程分析样本。

该体系的定性组成已完全清楚,除少数非线性和所谓“病态体系”外,多元校正均可给出令人满意的解析结果。

白色分析体系的多元校正算法:

直接校正、间接校正、通用标准加入法、人工神经网络(artificial neural networks,ANN)等

②黑色分析体系

对于分析试样毫无验前信息,有关其物种数,哪几种化学物种及其浓度皆不清楚;

分析化学的任务是首先确定其物种数;

进而解析出各纯物种的谱图(可以是光谱、波谱等),即先将其首先转化成为白色分析体系,然后进行定量分析。

分析化学中最难解析的一类体系,其像个黑匣子。

黑色分析体系的化学计量学方法:矩阵分辨法、张量分辨法

化学计量学家已研究出了不少尤其是对于色谱联用仪器所产生的矩阵数据,已发展了一系列解析新方法,可望解决黑色分析体系的快速定性定量分析问题。

③ “灰色”分析体系

已知某些待测物种存在于待分析的样本,但是否存在别的未知干扰却不清楚;

分析目的是在未知干扰的存在下,直接对感兴趣的待测物种进行定量分析。

定性组成只部分已知,介乎子“白色”与“黑色”分析体系之间

对于这类分析体系,只要可获得矩阵类型的数据,一般可望获得有物理意义的唯一解。

灰色分析体系的校正算法: 矢量校正方法和矩阵校正方法

经典分析化学:

依赖费时而麻烦的化学或物理方法来对很多复杂化学体系进行纯组分分离,即采用单变量校正方法进行定性定量分析;

现代分析化学

面对的则是各种将分析分离技术集于一体的高维仪器所产生的巨量分析信号,化学计量学发展的新型分析信号的多元校正与分辨方法来进行复杂多组分体系的定性定量解析,高维数据解析的化学计量学方法现已进入可用来解决分析化学中实际难题的程度,将这些方法用于复杂环境样本、中草药中单位药及复方分析等。

进行高维数据、特别是针对可产生三维数据的新型仪器的化学计量学算法的研究现仍是一个研究的热点。

多元校正与分辨是我国分析化学计量学研究的主要内容,取得了居于国际先进水平的成果。将化学计量学方法固化于新设计的分析仪器之中,以构建新型智能分析仪器,是一个值得继续研究的方向。

更多相关推荐:
计量总结

学习总结(收获)见附件:一、计量基础课本课程主要介绍的是计量的法律法规和计量专业实务主要内容为:1、计量法律法规:主要学习了计量法立法的宗旨,我国的计量法规体系与计量监督管理体制,计量法律责任,计量基准,计量标…

能源计量总结

20xx年能源计量工作总结为了加强能源计量工作,提高能源计量管理水平,落实国家《节能中长期专项规划》提出的节能目标,根据《计量法》、《节约能源法》和省、市局的文件通知要求,我公司从能源计量工作入手,认真组织实施…

计量总结

20xx年计量工作总结根据青藏铁路公司总工室总技【20xx】32号文件“关于做好20xx年计量工作总结的通知”,我段20xx年计量工作总结如下:一我段计量管理的情况1、我段计量校验与管理情况现阶段我段还不具备计…

阿 商务计量总结

商务计量工作之我见商务计量工作在国内外施工都起到了举足轻重的作用,计量工作完成的好坏,直接就会影响到该项目的盈亏与否。在国外施工时,商务计量工作的内容与国内还是有部分差异的,首先从名字的叫法上就有些不同,在国内…

德兴局推进诚信计量总结

德兴局“推进诚信计量,建设和谐城乡”工作总结一、扎实推进诚信计量工作,今年以来,德兴市质监局采取多项措施扎实开展“推进诚信计量、建设和谐城乡”主题活动,取得了明显成效。(一)深入宣传。为切实抓好此项工作,德兴市…

20xx计量所能源计量总结

20xx年能源计量工作总结所领导对能源计量工作非常重视,由于人员调整,任命罗辉副所长为能源计量服务队队长,带领服务队人员对辖区内重点能源消耗企业进行能源计量服务,为企业培训能源设备操作人员、能源计量管理人员21…

《电能计量》 总结

绪论1.电能计量装置定义:把电能表、与电能表配合使用的互感器以及互感器到电能表之间的二次回路连接线2.电能计量装置的作用:①测量发电机发电量、厂用电量、供电量②工农业用电部门用来加强经营管理,考核单位用电量③作…

计量检定员总结

总结本次学习了计量概述法制计量计量单位计量器具计量检定量值传递与溯源测量误差和数据处理等八个方面的内容这些内容及介绍了计量人员尤其是计量检定人员应该掌握的基础知识同时也介绍了当前计量工作中正在发展的一下心得概念...

计量认证工作总结

20xx20xx年计量认证工作总结塔城水环境监测分中心20xx年3月30日塔城水环境监测分中心20xx20xx年计量认证工作总结20xx20xx年塔城水环境监测工作在塔城水文水资源勘测局和新疆水环境监测中心的关...

计量经济学总结

20xx20xx学年第二学期合肥学院数理系实验报告课程名称计量经济学实验项目多元线性回归实验类别综合性设计性验证性专业班级数学与应用数学姓名陶磊学号120xx21006实验地点二期37412实验时间指导教师赵娟...

企业计量工作总结报告

企业计量工作总结计量是企业管理的重要基础工作计量管理贯穿到企业生产经营的整个过程直接为生产经营提供计量保证甘肃绿能瑞奇生物技术有限公司高度重视计理管理工作把计量作为企业管理的墓础是企业提升产品质量提高经济效益的...

计量中心 技术总结

营销部计量中心技术总结本次在计量中心的轮岗主要接触的是智能电能表的检定DDZY88型单相费控智能电能表采用当今最先进的电能表专用集成电路微处理器永久保存信息的不挥发性存贮器宽温液晶显示等技术和SMT工艺设计制造...

计量总结(60篇)