EndNote 的 Filter (滤件)是 EndNote 的一个重要部分,在导入文献时起到重要的作用。科研动力本文就滤件的简介,基本操作和基本结构作一个详细的介绍,理解这些内容对于新建滤件有很大帮助。以下的「滤件」指 EndNote 的 Filter 或 Filters
我们从在线数据库下载了文献数据以后,可以导入到 EndNote 的数据库中。这种导入过程就需要滤件。因为从不同数据库下载的数据文件,其结构都是不同的。这些数据文件从本质上都是txt文件,因此都可以使用记事本打开。
EndNote 如何把这些不同结构的数据文件解析成相应的文献内容呢?这就要用到滤件了。因此滤件的功能就是一种转换方法,把不同的数据文件内容转换成相应的文献信息。这种转换过程,滤件还可以控制哪些信息可以导入,哪些信息不要导入。
其实滤件不仅在导入过程中起到关键作用,而且还在 EndNote 在线检索过程中起到重要作用。因为 EndNote 检索在线数据库,也需要把检索到在线数据库的信息转换成文献信息。
EndNote 提供了数百种滤件,可以从这里下载 http://endnote.com/downloads/filters,并安装到 EndNote 中。安装也很简单,把下载的 ZIP 中的文件解压到 EndNote 的安装文件夹下的 Filters 子文件夹内即可。当然如果在安装 EndNote 的时候选择的是「Custom」安装,就可能把所有 EndNote 的滤件都安装了。
但是即使 EndNote 提供了这么多的滤件,但是有时候很多数据库 EndNote 还是没有直接的滤件,此时我们还需要自己新建一滤件。比如科研动力的网友 @绿泡泡 曾经针对润桐专利数据库下载的数据自制的滤件。因为润桐没有提供 EndNote 的滤件,EndNote 也没有针对润桐的滤件。所以此时我们就需要自己新建滤件了。如何新建滤件科研动力打算在另一篇文章中介绍,本文只是对滤件的基本知识作介绍。理解了滤件的基本知识,再新建滤件就简单多了。
但是有的数据文件结构很混乱,数据缺少一致性和标记。此时新建滤件基本不可能。因此针对这种复杂的数据,直接一个个的把文献手动新建,比创建滤件导入可能更快。最后劳动了半天,可能也没法完成滤件的创建。
滤件管理器
滤件可以通过滤件管理器来管理,依次打开菜单 Edit >> Import Filters >> Open Filter Manager 就可以打开滤件管理器了。在管理器我们可以看到已安装或者修改过的所有滤件。
保存滤件
如果是编辑滤件,可以在 EndNote 菜单「File」下选择「Save」或「Save As」。
如果是修改 EndNote 自己原有的滤件,一定要使用另存为命令,这样就不会覆盖原有滤件。另存为新的滤件会保存在个人滤件文件夹下。个人文件夹一般是在「我的文档」中,详见 EndNote 的安装及注意事项
复制滤件
复制滤件可以打开 EndNote 的安装文件夹下的 Filters 子文件夹,直接利用操作系统的复制命令复制即可。
或者在编辑滤件的时候,不做任何修改,另存为一份新的滤件即可。
删除滤件
删除滤件也可以利用操作系统的删除命令,直接删除滤件文件即可。
也可以在滤件管理器中选中滤件,然后选择菜单 Edit >> Clear
编辑或者新建滤件时,可以看到滤件由很多部分组成
About this Filter
这一部分是滤件的基本信息,大致和输出格式的类似,因此也建议把自己新建的滤件都归于一类,好找。
Tempalts
这是滤件最重要的部分,这部分内容在解析和转换数据文件时起到至关重要的作用。这部分内容就是把数据文件转换成文献的各字段内容的。
把鼠标放置于「Tag」一列下的任何一行时,回车可以在此行上新建一行,放置于「Field(s)」时,回车可以此行下新建一行。全部选中一行,可以使用菜单 Edit >> Copy 或者直接「Ctrl+C」复制;或者Edit >> Cut 或者直接「Ctrl+X」剪切;菜单 Edit >> Paste 或者直接「Ctrl+V」可以粘贴复制或者剪切的信息
「Reference Types」可以选择文献类型,默认的文献类型以粗何显示。「Insert Field」可以插入文献的各种字段。
Author Parsing
此部分是分析数据文件中的作者的。注意这些设置的名称是通用作者名称。
Continuation Lines
如果仔细看看一个数据文件,数据文件中的排列是有规律的。数据文件都是以标签形式开头的,每个内容之间会有回车,同一内容之间可能是相同的缩进。这部分就是设置此项的。
Reference Type
有的数据文件中还有文献类型的标签,或者数据文件中文献类型比较复杂,此处的设置就是如何处理这些内容的。
蛋疼吧,遇到这样的数据也是醉了,不过 EndNote 对这些复杂的数据文件都有现成的滤件可用。
Editor Parsing
这个是处理书籍编者的,方法同上在的「Author Parsing」
Field Edting
对于数据文件中的某些字段内容,可能想在导入的时候进行修改一下,此处就是设置这些功能的
如需要修改,首先要在「Field Editing for」中选择一个字段,下面的操作都是针对这个一字段的。修改完毕可以选择「Add」。此时如有需要还可以选择下一个字段的操作,以此类推。比如我们先选择「Tile」字段,此时是在导入数据时针对文献的题目进行操作的。注意此处的字段名称是通用字段名称。
MARC Records
这个就很复杂了,不过幸好一般不用设置这个。MARC 全称是 Machine Readable Cataloging format,机读编目格式。有兴趣的网友可以搜搜这个到底是啥玩意。
此处的设置一般多用于连接文件,因为连接文件多使用的是 MARC 格式,这种格式是 Z39.50 标准的一部分。
因此此处针对滤件来说,一般可以不用设置
Record Layout
因为数据文件中包含多个文献,哪个是每一个文献的开头,哪一具是文献的结尾,此处是设置该功能的。
Source Parsing
虽然我们在模板中精益求精,尽量考虑了诸多方面。但是有时候可能还是会出错。有的数据文件中期刊信息比较复杂,如果我们在模板中设置的相应期刊信息标签,EndNote 也不能正确匹配数据文件中的某些文献信息。那么可以在这里设置一下,这样告诉 EndNote 在读取期刊信息的时候,即使有错了也不要自动跳到下一个标签,尽量都读出来。
其实 EndNote 的滤件创建是一个很复杂的事,尤其是对于很蛋疼的数据。因此创建一个滤件时,首先要对源数据进行处理,源数据处理好了,滤件创建起来就方便多了,而且更能精确导入数据。最好是都能有清楚的标签,去除一些不必要的内容。可以利用 Word 的查找替换功能删掉一些不需要的信息。
如果在数据文件中的某些额外信息很难处理掉,再考虑在滤件中处理这些不必要的信息。
滤件最重要的一部分是 Templates 的处理,模板建立好了,其他的选项一般默认或者选择智能处理即可。对于 EndNote 的不能智能处理的内容,才需要手动进行设置。
但是即使对源数据处理了,又尽量调整滤件的各项设置了,有些数据也很蛋疼。尤其是不提供导出数据的数据库,这时候只能复制文献信息。对于这样的数据,再怎么处理源数据,再怎么调整滤件,最后导入的内容可能还是乱七八糟,这个时候可能一个个的手动建立新文献,都比创建调整滤件省事的多。因此对于这种情况,也不要强求,只能笨办法了,自己手动复制信息吧。
……