《人工智能技术在分析化学中的应用培训讲学.ppt》由会员分享,可在线阅读,更多相关《人工智能技术在分析化学中的应用培训讲学.ppt(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、人工智能技术在分析化学人工智能技术在分析化学中的应用中的应用智能的分类智能的分类n生物质能 BI Biological Intelligencen人工智能 AI Artificial Intelligencen计算智能CIComputational Intelligence NN-Neural Networks 神经网络 PR-Pattern Recognition模式识别生物智能n以脑为主体的神经系统,最基以脑为主体的神经系统,最基本单位是生物神经元。本单位是生物神经元。人类个体的智能是一种综合性能力人类个体的智能是一种综合性能力1 1)感知与认识事物、客观世界与自我的能力;)感知与认识事物
2、、客观世界与自我的能力;2 2)通过学习取得经验、积累知识的能力;)通过学习取得经验、积累知识的能力;3 3)理解知识、运用知识和运用经验分析问题和解决问题的能力;)理解知识、运用知识和运用经验分析问题和解决问题的能力;4 4)联想、推理、判断、决策的能力;)联想、推理、判断、决策的能力;5 5)运用语言进行抽象、概括的能力;)运用语言进行抽象、概括的能力;6 6)发现、发明、创造、创新的能力;)发现、发明、创造、创新的能力;7 7)实时地、迅速地、合理地应付复杂环境的能力;)实时地、迅速地、合理地应付复杂环境的能力;8 8)预测、洞察事物发展变化的能力。)预测、洞察事物发展变化的能力。智能是
3、相对的、发展的。离开特定时间说智能是困难的、没有意义的。智能是相对的、发展的。离开特定时间说智能是困难的、没有意义的。人工智能n人工智能是相对人的自然智能而言,即用人工的方法人工智能是相对人的自然智能而言,即用人工的方法和技术,研制智能机器或智能系统来模仿、延伸和扩和技术,研制智能机器或智能系统来模仿、延伸和扩展人的智能,实现智能行为和展人的智能,实现智能行为和“机器思维机器思维”解决需要人解决需要人类专家才能处理的问题。类专家才能处理的问题。n人工智能是人工制品人工智能是人工制品(artifact)(artifact)中所涉及的智能行为。中所涉及的智能行为。其中,智能行为包括:感知其中,智能
4、行为包括:感知(perception)(perception)、推理、推理(Reasoning)(Reasoning)、学习、学习(learning)(learning)、通信、通信(communicating)(communicating)和复杂环境下的动作行为和复杂环境下的动作行为(acting)(acting)。人工智能目标人工智能目标是人工智能目标是实现智能行为和实现智能行为和“机器思维机器思维”,解决需要人类专家才能处理的问题。解决需要人类专家才能处理的问题。1 1、研究像人一样工作的机器,甚至比人做得、研究像人一样工作的机器,甚至比人做得更好更好 2 2、能够理解机器、人或动物的智
5、能行为、能够理解机器、人或动物的智能行为 智能革命智能革命是指人的自然智能通过人工智能的模仿和扩展,实现社会生产的自动化和智能化,促进知识密集型经济的发展。2 人工智能的研究方法 人工智能经过发展,形成了许多学派。不人工智能经过发展,形成了许多学派。不同学派的研究方法、学术观点、研究重点有所同学派的研究方法、学术观点、研究重点有所不同。这里主要介绍认知学派、逻辑学派、行不同。这里主要介绍认知学派、逻辑学派、行为主义学派和连接主义学派。为主义学派和连接主义学派。2.1 认知学派认知学派(以以Simon,Minskey和和Newell等为代表等为代表)基本思想基本思想 从人的思维活动出发,利用计算
6、机进行宏观功能模从人的思维活动出发,利用计算机进行宏观功能模拟。基于物理符号系统假设,将任何信息加工系统看拟。基于物理符号系统假设,将任何信息加工系统看成是一个具体的物理系统。成是一个具体的物理系统。基本观点基本观点 物理系统表现智能行为的充要条件是该系统是一个物理系统表现智能行为的充要条件是该系统是一个物理符号系统。物理符号系统。主要工作主要工作 1)Newell的的Logic Theorist,模拟人证明数学定,模拟人证明数学定理的思维过程理的思维过程 2)GPS,模拟人的解题过程,模拟人的解题过程(拟定初步解题计划拟定初步解题计划利用公理、定理和规则,按规则实施解题过程利用公理、定理和规
7、则,按规则实施解题过程不断不断进行进行“目的目的手段手段“分析,修订解题计划。分析,修订解题计划。3)物理符号系统假设。符号是模式。物理符号系)物理符号系统假设。符号是模式。物理符号系统的基本任务和功能是辨认相同的符号和区别不同的统的基本任务和功能是辨认相同的符号和区别不同的符号。符号。2.2 逻辑学派逻辑学派(以(以McCarthy和和Nilsson等为代表等为代表)基本思想基本思想用逻辑来研究人工智能,用形式化的方法(统一的逻辑用逻辑来研究人工智能,用形式化的方法(统一的逻辑框架)描述客观世界。框架)描述客观世界。基本观点基本观点1)智能机器必须有关于自身环境的知识)智能机器必须有关于自身
8、环境的知识2)通用智能机器要能陈述性地表达关于自身环境的大部)通用智能机器要能陈述性地表达关于自身环境的大部分知识分知识3)通用智能机器表示陈述性知识的语言至少要有一阶逻)通用智能机器表示陈述性知识的语言至少要有一阶逻辑的能力辑的能力主要工作1)概念化知识表示)概念化知识表示2)模型论语义)模型论语义3)演绎推理)演绎推理4)非单调逻辑用于常识推理)非单调逻辑用于常识推理2.3 行为主义学派行为主义学派(以以Brooks为代表为代表)基本思想基本思想 以复杂的现实世界为背景,让人工智能理论先经受以复杂的现实世界为背景,让人工智能理论先经受解决实际问题的考验,并在这种考验中成长。智能只是解决实际
9、问题的考验,并在这种考验中成长。智能只是在与环境的交互作用中表现出来。在与环境的交互作用中表现出来。基本观点基本观点1)到现场去)到现场去2)物理实现)物理实现3)初级智能)初级智能 4)行为产生智能)行为产生智能主要工作主要工作1)无需知识表示的智能)无需知识表示的智能2)无需推理的智能)无需推理的智能3)机器虫)机器虫2.4 连接主义学派连接主义学派基本思想基本思想从脑的神经系统结构出发来研究脑的功能,研究大量简单的神从脑的神经系统结构出发来研究脑的功能,研究大量简单的神经元的集团信息处理能力及其动态行为,模拟和实现人的认识过程经元的集团信息处理能力及其动态行为,模拟和实现人的认识过程中的
10、感知觉过程、形象思维、分布式记忆和自学习自组织过程。中的感知觉过程、形象思维、分布式记忆和自学习自组织过程。基本观点基本观点1)神经网络以分布式方式存储信息)神经网络以分布式方式存储信息2)神经网络以并行方式处理信息)神经网络以并行方式处理信息3)神经网络具有自组织、自学习能力)神经网络具有自组织、自学习能力主要工作主要工作人工神经网络人工神经网络BNNBPRBIANNAPRAICNNCPRCI知知识识获获取取难难度度及及计计算算量量3 知识的获取过程知识的获取过程知识系统知识工程已成为人工智能应用最显著的特点。知识工程已成为人工智能应用最显著的特点。知识系统主要研究内容:知识系统主要研究内容
11、:1、专家系统、专家系统 知识库知识库+推理机推理机2、知识库系统、知识库系统将知识以一定的结构存入,进行知识管理,实现知识共享将知识以一定的结构存入,进行知识管理,实现知识共享3、智能决策系统、智能决策系统4、知识科学、知识科学人工智能n借助技术或理论手段,应用数学方法和数值逻辑。使借助技术或理论手段,应用数学方法和数值逻辑。使用计算机等工具,模拟、延伸或扩展人的智能。用计算机等工具,模拟、延伸或扩展人的智能。n专家系统是人工智能的一个重要分支在化学领域中主专家系统是人工智能的一个重要分支在化学领域中主要应用于以下几个方面:要应用于以下几个方面:n谱图解析和有机化合物结构的阐明n分离科学-G
12、C、HPLC、CE等方法分离条件的选择n试验方案的最优控制n工业生产流程控制n分子模拟设计-计算机辅助辅助合成路线方案的选择专家系统专家系统n是一个智能的计算机软件系统,该系统利用已知的知识进行演绎推理。n世界上第一个专家系统(DENDRAL)诞生于化学领域,应用MS、NMR解释有机化合物的结构。知识库(事实、直接推断)推 理 机解决模块用户接口计算智能n模糊系统理论n人工神经网络n进化计算(主要是遗传算法)人工神经网络Artificial Neural Networkn生物神经元 裸露的轴突末梢与其它神经细胞或效应器裸露的轴突末梢与其它神经细胞或效应器细胞构成突触联系。细胞构成突触联系。n生
13、物神经元网络n感觉神经元(传入神经元),与感受器相连n中间神经元n运动神经元(传出神经元),与效应起相连六个基本特征六个基本特征1)神经元及其联接神经元及其联接;2)神经元之间的联接强度决定信号传递的强弱;神经元之间的联接强度决定信号传递的强弱;3 3)神经元之间的联接强度是可以随训练改变的;)神经元之间的联接强度是可以随训练改变的;4 4)信信号号可可以以是是起起刺刺激激作作用用的的,也也可可以以是是起起抑抑制制作作用用的;的;5 5)一一个个神神经经元元接接受受的的信信号号的的累累积积效效果果决决定定该该神神经经元元的状态;的状态;6)6)每个神经元可以有一个每个神经元可以有一个“阈值阈值
14、”。人工神经网络人工神经网络(ArtificialNeuralNetworks,简记作,简记作ANN),),n是对人类大脑系统的一阶特性的一种描述。简单地讲,是对人类大脑系统的一阶特性的一种描述。简单地讲,它是一个它是一个数学模型数学模型,可以用,可以用电子线路电子线路来实现,也可以来实现,也可以用用计算机程序计算机程序来模拟,是人工智能研究的一种方法。来模拟,是人工智能研究的一种方法。作为作为5 5种能力综合表现形式的种能力综合表现形式的3 3种能力种能力n发现、发明、创造、创新的能力发现、发明、创造、创新的能力 n实时、迅速、合理地应付复杂环境的能力实时、迅速、合理地应付复杂环境的能力 n
15、预测、洞察事物发展、变化的能力预测、洞察事物发展、变化的能力 人工神经网络的提出人工神经网络的提出nNewellNewell和和SimonSimon假说假说 :一个物理系统表现智能一个物理系统表现智能行为的充要条件是它有一个物理符号系统行为的充要条件是它有一个物理符号系统.n概念:概念:物理符号系统需要有一组称为符号的实物理符号系统需要有一组称为符号的实体组成,它们都是物理模型,可以在另一类称体组成,它们都是物理模型,可以在另一类称为符号结构的实体中作为成分出现,以构成更为符号结构的实体中作为成分出现,以构成更高级别的系统高级别的系统.n困难:困难:n抽象抽象舍弃一些特性,同时保留一些特性舍弃
16、一些特性,同时保留一些特性n形形式式化化处处理理用用物物理理符符号号及及相相应应规规则则表表达达物理系统的存在和运行。物理系统的存在和运行。n局限:局限:n对全局性判断、模糊信息处理、多粒度的视对全局性判断、模糊信息处理、多粒度的视觉信息处理等是非常困难的。觉信息处理等是非常困难的。物理符号系统和人工神经网络系统的差别物理符号系统和人工神经网络系统的差别两种人工智能技术的比较两种人工智能技术的比较人工神经网络的特点人工神经网络的特点n信息的分布表示信息的分布表示n运算的全局并行和局部操作运算的全局并行和局部操作n处理的非线性处理的非线性 ANNANN学习(学习(LearningLearning
17、)能力)能力人工神经网络可以根据所在的环境去改变它的行为人工神经网络可以根据所在的环境去改变它的行为自相联的网络自相联的网络异异相相联联的的网网络络:它它在在接接受受样样本本集集合合A时时,可可以以抽抽取取集集合合A中中输输入入数数据据与与输输出出数数据据之之间间的的映映射射关关系系。“抽抽象象”功能。功能。不同的人工神经网络模型,有不同的学习不同的人工神经网络模型,有不同的学习/训练算法训练算法基本特征的自动提取基本特征的自动提取由由于于其其运运算算的的不不精精确确性性,表表现现成成“去去噪噪音音、容容残残缺缺”的的能能力力,利利用用这这种种不不精精确确性性,比比较较自自然然地地实实现现模模
18、式式的的自自动分类。动分类。普化(普化(Generalization)能力与抽象能力)能力与抽象能力 信息的分布存放信息的分布存放n信息的分布存提供容错功能信息的分布存提供容错功能n由于信息被分布存放在几乎整个网络中,所以,当其中的某由于信息被分布存放在几乎整个网络中,所以,当其中的某一个点或者某几个点被破坏时,信息仍然可以被存取。一个点或者某几个点被破坏时,信息仍然可以被存取。n系统在受到局部损伤时还可以正常工作。系统在受到局部损伤时还可以正常工作。n并不是说可以任意地对完成学习的网络进行修改。也并不是说可以任意地对完成学习的网络进行修改。也正是由于信息的分布存放,对一类网来说,当它完成正是
19、由于信息的分布存放,对一类网来说,当它完成学习后,如果再让它学习新的东西,这时就会破坏原学习后,如果再让它学习新的东西,这时就会破坏原来已学会的东西。来已学会的东西。适应性适应性(Applicability)问题问题n擅长两个方面:擅长两个方面:n对大量的数据进行分类,并且只有较少的几种情况;对大量的数据进行分类,并且只有较少的几种情况;n必须学习一个复杂的非线性映射。必须学习一个复杂的非线性映射。n目前应用:目前应用:n人们主要将其用于语音、视觉、知识处理、辅助决人们主要将其用于语音、视觉、知识处理、辅助决策等方面。策等方面。n在数据压缩、模式匹配、系统建模、模糊控制、求在数据压缩、模式匹配
20、、系统建模、模糊控制、求组合优化问题的最佳解的近似解(不是最佳近似解)组合优化问题的最佳解的近似解(不是最佳近似解)等方面也有较好的应用。等方面也有较好的应用。n神神经经元元是是构构成成神神经经网网络络的的最最基基本本单单元元(构件)。(构件)。n人工神经元模型应该具有生物神经元的人工神经元模型应该具有生物神经元的六个基本特性。六个基本特性。n人工神经元模拟生物神经元的人工神经元模拟生物神经元的一阶特性一阶特性。n输入:输入:X=(x1,x2,xn)n联接权:联接权:W=(w1,w2,wn)Tn网络输入:网络输入:net=xiwin向量形式:向量形式:net=XWxnwnx1w1x2w2net
21、=XW激活函数激活函数(ActivationFunction)n激激活活函函数数执执行行对对该该神神经经元元所所获获得得的的网网络络输输入入的的变变换换,也也可可以以称称为为激激励励函函数数、活化函数:活化函数:o=f(net)n1、线性函数(、线性函数(LinerFunction)f(net)=k*net+c netooc非线性斜面函数非线性斜面函数(RampFunction)ifnetf(net)=k*netif|net|0为一常数,被称为饱和值,为该神经为一常数,被称为饱和值,为该神经元的最大输出。元的最大输出。2、非线性斜面函数(、非线性斜面函数(RampFunction)-neto阈
22、值函数(阈值函数(ThresholdFunction)阶跃)阶跃函数函数ifnetf(net)=-ifnet、均为非负实数,均为非负实数,为阈值为阈值二值形式:二值形式:1ifnetf(net)=0ifnet双极形式:双极形式:1ifnetf(net)=-1ifnet 阈值函数(阈值函数(ThresholdFunction)阶跃函数)阶跃函数-onet04、S形函数形函数 压压 缩缩 函函 数数(Squashing Function)和和 逻逻 辑辑 斯斯 特特 函函 数数(LogisticFunction)。)。f(net)=a+b/(1+exp(-d*net)a,b,d为常数。它的饱和值为
23、为常数。它的饱和值为a和和a+b。最简单形式为:最简单形式为:f(net)=1/(1+exp(-d*net)函数的饱和值为函数的饱和值为0和和1。nS形函数有较好的增益控制形函数有较好的增益控制 4、S形函数形函数 a+bo(0,c)netac=a+b/2 人工神经元网络人工神经元网络T每个神经元均为多输入单输出的信息处理单元每个神经元均为多输入单输出的信息处理单元输入分兴奋性和抑制型两种输入分兴奋性和抑制型两种神经元有阈值特性神经元有阈值特性应用应用n构造了具有构造了具有3层节点的人工神经网络模型层节点的人工神经网络模型,将太湖将太湖2001年年512月月全湖共全湖共26个采样点的实测值作为
24、学习样本个采样点的实测值作为学习样本,一共有一共有268=208组组数据。从这些数据中分别随机抽取数据。从这些数据中分别随机抽取1/4的数据各的数据各52组作为检验样组作为检验样本和测试样本本和测试样本,其余的其余的104组组(占占50%)数据作为训练样本。每个数据作为训练样本。每个样本均含有样本均含有12个输入因子个输入因子,分别是风速、风向、水温、分别是风速、风向、水温、高锰酸钾指数、浊度、叶绿素、透明度、高锰酸钾指数、浊度、叶绿素、透明度、5。以浮游植物作为输出因子。用。以浮游植物作为输出因子。用2002年年8月的各点的浮游月的各点的浮游植物数据进行预测比较,植物数据进行预测比较,人工神
25、经网络模型n前向网络(I/O映射)感知器、BP、RBFn反馈网络(演化式好善性非线性动力系统)Hopfield网络、回归BP、Boltzman机等n自组织网络自适应共振网络、自组织特征映射网络多层前向多层前向BP网络的优点网络的优点网络实质上实现了一个从输入到输出的映射功能,而网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。数学理论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复杂的问题;这使得它特别适合于求解内部机制复杂的问题;网络能通过学习带正确答案的实例集自动提取网络能通过学习带正确答案的实例集自动提取“合理的合理
26、的”求解规则,即具有自学习能力;求解规则,即具有自学习能力;网络具有一定的推广、概括能力。网络具有一定的推广、概括能力。多层前向BP网络存在的问题BP算法的学习速度很慢,其原因主要有:算法的学习速度很慢,其原因主要有:a 由于由于BP算法本质上为梯度下降法,而它所要优化的目标函数又非常复杂,因此,必算法本质上为梯度下降法,而它所要优化的目标函数又非常复杂,因此,必然会出现然会出现“锯齿形现象锯齿形现象”,这使得,这使得BP算法低效;算法低效;b 存在麻痹现象,由于优化的目标函数很复杂,它必然会在神经元输出接近存在麻痹现象,由于优化的目标函数很复杂,它必然会在神经元输出接近0或或1的情的情况下,
27、出现一些平坦区,在这些区域内,权值误差改变很小,使训练过程几乎停顿;况下,出现一些平坦区,在这些区域内,权值误差改变很小,使训练过程几乎停顿;c 为了使网络执行为了使网络执行BP算法,不能用传统的一维搜索法求每次迭代的步长,而必须把步算法,不能用传统的一维搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这种方法将引起算法低效。长的更新规则预先赋予网络,这种方法将引起算法低效。网络训练失败的可能性较大,其原因有:网络训练失败的可能性较大,其原因有:a 从数学角度看,从数学角度看,BP算法为一种局部搜索的优化方法,但它要解决的问题为求解复杂算法为一种局部搜索的优化方法,但它要解决的问题
28、为求解复杂非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;b 网络的逼近、推广能力同学习样本的典型性密切相关,而从问题中选取典型样本实网络的逼近、推广能力同学习样本的典型性密切相关,而从问题中选取典型样本实例组成训练集是一个很困难的问题。例组成训练集是一个很困难的问题。难以解决应用问题的实例规模和网络规模间的矛盾。这涉及到网络容量的难以解决应用问题的实例规模和网络规模间的矛盾。这涉及到网络容量的可能性与可行性的关系问题,即学习复杂性问题;可能性与可行性的关系问题,即学习复杂性问题;网络结构的选择尚无一种统一而完
29、整的理论指导,一般只能由经验选定。网络结构的选择尚无一种统一而完整的理论指导,一般只能由经验选定。为此,有人称神经网络的结构选择为一种艺术。而网络的结构直接影响网络为此,有人称神经网络的结构选择为一种艺术。而网络的结构直接影响网络的逼近能力及推广性质。因此,应用中如何选择合适的网络结构是一个重要的逼近能力及推广性质。因此,应用中如何选择合适的网络结构是一个重要的问题;的问题;新加入的样本要影响已学习成功的网络,而且刻画每个输入样本的特征的新加入的样本要影响已学习成功的网络,而且刻画每个输入样本的特征的数目也必须相同;数目也必须相同;网络的预测能力(也称泛化能力、推广能力)与训练能力(也称逼近能
30、力网络的预测能力(也称泛化能力、推广能力)与训练能力(也称逼近能力、学习能力)的矛盾。一般情况下,训练能力差时,预测能力也差,并且一、学习能力)的矛盾。一般情况下,训练能力差时,预测能力也差,并且一定程度上,随训练能力地提高,预测能力也提高。但这种趋势有一个极限,定程度上,随训练能力地提高,预测能力也提高。但这种趋势有一个极限,当达到此极限时,随训练能力的提高,预测能力反而下降,即出现所谓当达到此极限时,随训练能力的提高,预测能力反而下降,即出现所谓“过过拟合拟合”现象。此时,网络学习了过多的样本细节,而不能反映样本内含的规现象。此时,网络学习了过多的样本细节,而不能反映样本内含的规律。律。人
31、工神经网络的学习方式n有导师n无导师n自监督分析化学信息获取手段 在信息社会中,InterNet是一颗最耀眼的明星。InterNet被称为万维网、国际互联网或因特网,是由美国ARPNet发展起来的,采用TCP/IP协议通讯,是世界上最大的开放性全球信息网络。http:/ 搜索引擎 搜索引擎网站的主要资源是它的索引数据库,而非它的网搜索引擎网站的主要资源是它的索引数据库,而非它的网页信息,因此它的主要功能就像图书馆的目录卡片一样,是为页信息,因此它的主要功能就像图书馆的目录卡片一样,是为人们搜索人们搜索Internet网上信息并提供获得所需信息的途径。搜索网上信息并提供获得所需信息的途径。搜索引
32、擎的索引数据库,以万维网资源为主,有的还包括电子邮件引擎的索引数据库,以万维网资源为主,有的还包括电子邮件地址、新闻论坛文章,地址、新闻论坛文章,FTP,gopher等网上资源。随着网络等网上资源。随着网络技术的飞速发展,技术的飞速发展,Internet数据信息库积累的数据和主题越越数据信息库积累的数据和主题越越多。怎样快速、高效、经济地查询某个主题的所有信息,就成多。怎样快速、高效、经济地查询某个主题的所有信息,就成了一个十分热门的课题。了一个十分热门的课题。化学化工宏站点化学化工宏站点 与搜索引擎一样,宏站点也可以起到查询信息的作用,对于特定学科或专题信息的查找,由于大都是一些著名大学的相
33、关院系建立,主题明确,组织得当,可信度高,在一定的程度上,它优于一般的大型搜索引擎。对于化学工作者来说,收集、知道一些与本专业有关的宏站点,是Internet上化学信息查询的一条捷径。因为宏站点大都用主题分类,仅仅简单地用浏览的方法就可得到所需的信息。每一个这样的宏站点都已链接到其它的化学宏站点上,所有的化学宏站点都极为相似,因此一旦找到一个这类优秀站点,就基本上没有必要再去找其它宏站点。中国科学院化工冶金研究所李晓霞等建立的中国科学院化工冶金研究所李晓霞等建立的CHIN(Chemical Information Network)它是中国科学院化工冶金研究所与联合国教科文组织UNESCO的合作
34、项目,是关于Internet重要化学信息资源的导航系统。ChIN有选择地对Internet重要的化学信息资源进行链接和介绍,力求使其反映Internet化学信息资源的概貌和最新发展动态。ChIN Web网页由重要化学信息资源链接组成的目录以及被链接资源的简介页组成。http:/ l 化学教学资源化学教学资源 http:/www.anachem.umu.se/eks/pointers.htm由瑞典乌墨纳大学Knut Irgum设计,这是一个非常好的宏站点,有课程、教学工具、软件、作者已加评注等。2Internet化学化学http:/acad.tnstate.edu/chemnet/chem.ht
35、ml由田纳西州立大学ThomasGardner设计,这也是个很好的宏站点。对可下载的软件、网络论坛、讨论组群、E-mail列表等给出评注。其它的大多数未给出评注。3 Martindales化学化学http:/www-sci.lib.uci.edu/HSG/GradChemistry.html#CHEMICALSJim Martindale.,对教程、物质安全数据、杂志、物理常数有评注。4 4 科学和数学教育的科学和数学教育的InternetInternet资源资源http:/www.inform.umd.edu:8080/UMS+State/UMD-Projects http:/www.inf
36、orm.umd.edu:8080/UMS+State/UMD-Projects MCTP/Technology/MCTP_WWW_ Bookmarks.HtmlMCTP/Technology/MCTP_WWW_ Bookmarks.Html由Maryland大学Tom OHaver设计,该站点涵盖自然科学所有学科。5 Sheffield ChemDex 索引索引http:/www.shef.ac.uk/chemistry/chemdex/由Sheffield 大学Mark Winter设计,最著名的化学宏站点之一,也是一个商业性站点,附有评注。6 WWW可视化学图书馆可视化学图书馆http:/
37、www.chem.ucla.edu/chempointers.html由California 大学的Max Kopelvich设计,很详细,有大学链接,非赢利链接,商业链接等。虚拟图书馆虚拟图书馆 是对INTERNET上的信息资源进行较为系统的组织、分类,在此基础上构建的一种WWW服务站点,此类站点大多能提供某一学科领域的多种资源,使用 WWW 软件设计的这种图形、文本交互式的用户友好的信息查询界面,用户无须精通计算机和网络知识就能熟练地使用浏览器,利用鼠标点击感兴趣的站点,服务器就会自动与有关资料所在的网点进行连接,并调出有关资料(或查询果)。化学虚拟图书馆主要站点化学虚拟图书馆主要站点 n
38、 http:/www.chem.rpi.edu/chemres.html(化学信息资源导航系统)该网站由美国印第安那大学 Gary Weggins 编制,是目前化学化工类信息资源中最为详细的一个网络导航指南,包括网络论坛、讨论组群、E-mail列表,评注出色 nhttp:/www.chem.ucla.edu/chempointers.html(化学信息虚拟图书馆)该 Web 端提供了大量的信息链接,指向INTERNET上那些有关化学研究最重要的信息资源,很详细,有大学链接,非赢利链接,商业链接等。8.2.2 电子论坛 n电子论坛(LISTSERVE)是INTERNET 上极受欢迎的一种信息交流
39、形式,除LISTSERVE外,我们还可见到它的其它名称,如邮件列表(Mailing list)、讨论组(Discussion Group)或电子公告牌(Springboard)等等。n电子论坛因其通过电子邮件来收发信息,也就是说用户可使用任何一种电子邮件系统来阅读新闻和其它信息,使用起来十分方便。虽然它在对信息的处理和控制上还有待进一步加强,但仍不失为目前最受化学工作者青睐的网络信息交流工具。8.2.3 主题指南 n在WWW中,人们已经编制了各种各样的主题指南,它是一种可供检索和查询的等级式主题目录,以超文本链接的方式将不同学科、专业、行业和区域的信息按照分类或主题目录的方式组织起来。n这些主
40、题目录一般在大类目下分成若干小类目,类目之间按照等级系统排列,然后将人工或巡视软件搜集或选择的网页主题连接起来,用户通过主题目录的指引,逐层浏览,直到找出有关的信息为止。最有名的主题指南 l英国图书馆员协会主题目录(英国图书馆员协会主题目录(BUBL)http:/www.bub1.bath.ac/uk/bubl/Tree.html它是由英国图书馆员编制的高质量的主题目录。该目录以国际十进制分类法和英文字母顺序两种方式组织学术机构或与学术有关的出版物,对从事学术研究的人员有根高的参考价值。2主题资源指南信息中心(主题资源指南信息中心(TheClearinghouseforSubject-Orie
41、ntedResourceGuides)http:/www.lib.umich.edu/chhome.html这是由美国密西根大学开发的项目,该主题目录适合于查询商业和学术信息。一些搜索引擎,如Yahoo、Infoseek,也是以主题指南为主体的查询系统。按照主题指商进行查询的主要优点是它反映了人在选择和组织信息时的知识和智慧,收录的网页经过筛选和系统组织,质量较高,条理性比较强,检索结果接近用户的信息需求。它的缺点是搜集信息的速度远远比不上网络资源的增长速度,所建立的数据库的规模都比较小,检索的文件数量有限。8.2.4 化学专利及文献 n专利中蕴含大量的化学信息,而化学信息在很大程度上由专利组
42、成。如化学文摘中,16%以上都和专利相关。每年在不同国家都有成百上千的各类新专利公布,而这些专利涉及范围广、内容包罗万象。n所谓专利就是国家授予发明人的一种特权,在实行专利制度的国家,凡是本国或外国的个人和企业有了创造发明,都可以根据专利法的规定,向本国或外国专利局提出申请,经审查合格,批准授予在一定年限内享有创造发明成果的权利,并在法律上受到保护。这样一种受到法律保护的技术专有权利叫做专利。n目前,世界上约有150多个国家和地区实施专利制度,有将近100个国家公布专利申请说明书和正式批准的专利说明书。每年公布约100多万件专利,其中很多都是同一项发明创造向不同国家重复申请的专利,因此实际发明
43、数量约40万件。n专利文献是当今世界科学技术发展的一个重要标志,每一项新的发明创造或技术改进,通常都首先反映在专利文献上,由于每件专利都凝聚了专利发明者最具有创造性的成果,因此对于我们研究国外科技水平的发展趋势,制定科研计划、评价采用新的科技成就的经济利益等方面,都明显地反映出使用专利情报的重要性。长期以来,世界各国企业之间剧烈竞争的一个显著特点是情报信息的竞争。情报机构工作的一个重要方面就是研究专利文献。一般分为三类:发明专利、实用新型专利、外观设计专利(如中国专利)。美国专利分类:实用新型专利(包括了发明专利)、E为再颁专利,P为植物专利,T为防卫性公告,H为法定发明登记专利,AI 为改进
44、专利。不同国家专利的类型代码及 含义都存在着差别。专利类型专利类型美国专利数据库 n美国专利数据库美国专利数据库-全文检索全文检索,QPAT-US(1974-)http:/ 作为目前全球最大的联机信息服务商,Dialog也是广大科技人员所熟知的一类科技情报检索系统,近年来,国内大部分图书馆己通过Te1net方式与其相连。因此在Internet上也可以通过网络浏览器进行信息检索。其专利信息资源主要提供世界专利数据库索引(WorldPatentIndex):提供全球大约70多个国家的英文专利摘要索引;提供美国注册版权索引(USCopyrights);提供在世界知识产权组织,美国、英国、法国、德国等
45、国登记注册的商标档案(TrademarkScan)。中国专利的检索途径l中国国家知识产权局数据库 (提供全文信息)http:/ n化学文摘专利累积(化学文摘专利累积(1975-)http:/casweb.cas.org/chempatplus/可免费搜索自1971年至今的美国专利文献全文(1993年开始带有完整的专利页面影象文件),以及来自CAS的可以JAVA方式旋转的3D化学结构。包含有CAS登记号和CAS索引字段。免费检索题目和文摘。付4美元可获得专利全文。n知识表达数据系统知识表达数据系统http:/www.KnowledgeE http:/ http:/www.ipdl.jpo.go.
46、jp/lDELPHION知识产权信息网数据库 http:/ http:/opic.gc.ca/l世界知识产权组织网站数据库 http:/www.wipo.int/快速检索:快速检索:只允许两个检索词的组合检索只允许两个检索词的组合检索STEP1:选择时间范围。STEP2:输入检索词。STEP3:选择检索途径,在右边的下拉菜单中提供了三十多个检索途径。日本专利数据库主页:收集了各种公报的日本专利(特许和实用新案),有英语和日语两种工作语言,英文版收录自1993年至今公开的日本专利题录和摘要,日文版收录1971年开始至今的公开特许公报,1885年开始至今的特许发明明细书,1979年开始至今的公表特
47、许公报等专利文献。日文版检索入口英文版检索入口PAJ检索:用英文关键词或专利号检索1993年1月以后日本专利英文题录和摘要PAJ关键词检索专利号检索Publication number同济大学图书馆信息咨询部欧洲专利数据库主页:欧洲专利数据库收录时间跨度大,涉及的国家多,收录了1920年以来(各国的起始年代有所不同)世界上50多个国家和地区出版的共计1.5亿多万件文献的数据。同济大学图书馆信息咨询部特点:n改版后的欧洲专利数据库,更易于非专业检索人员的使用。n共有四种检索方法:快速检索、高级检索、专利号检索、专利分类号检索,每种检索界面都提供了一个快速帮助窗口,它能够引导初级用户顺利地完成检索
48、。n反映同族专利情况,以便选择更易理解的语言来阅读专利全文n提供了PDF和HTML两种格式的专利全文同济大学图书馆信息咨询部联机检索光盘联机检索光盘 n专利信息光盘有两个主要卖主,分别是Micropatent和Rapid Patent(德温特公司)。这些公司都有美国化学专利图象数据库。从光盘上同样可检索到欧洲专利。nMicroPatent公司的专利检索光盘能检索到1976-94年间的美国化学专利,但不包括全文影象。在化学专利影象光盘上可检索到全文,而在网上检索MicroPatent的全文影象需要付费。化学文摘服务社化学文摘服务社(Chemical Abstract Service简称CAS)h
49、ttp:/casweb.cas.org/n是一家世界上最大的拥有化学信息数据库的最有影响力的机构。它的数据库主要有美国的化学文摘和Registery,到目前为止收录有一千五百万文件记录和不少于二千一百万种物质的资料档案。CAS还提供化学反应、商业化学药品、规则化学药品(listed regulated chemicals)和已公开化学专利的数据库。n美国化学文摘(Chemical Abstracts,CA)创刊于1907年,是由美国化学学会化学文摘社(Chemical Abstracts Service,CAS)编辑出版。CA是覆盖了多种文件类型的综合情报源,是检索化学化工文献的主要工具之一。
50、8.2.5 分析化学电子公告牌 The Analytical Chemistry SpringboardThe Analytical Chemistry Springboard nHypermailarchiveoftheChemicalInformationelist(CHMINF-L)(化学信息电子论坛超级邮件档案)http:/atlas.chemistry.uakron.edu:8080/cdept.docs/CHMINF/hmail.htmlnOverviewofchemicalmailinglists(化学电子论坛概略)http:/bionmr1.rug.ac.be/chemistr