虚拟国际权威文件(VirtualInternational AuthorityFile,VIAF)可以使书目记录在跨组织、跨境、跨语言中检索。通过匹配和链接开放权限的文件可以降低成本并增加授权文件的实用性。然而,在跨境、跨语言的情况下,出现了新的问题:如何跟踪数据/元数据(重新)使用?图书档案馆A使用图书档案馆B的(部分)记录时如何参考元数据?如何评估合并到系统中的数据/元数据的可信度?
为了解决跟踪数据来源的问题,图书档案科学界开发了用于描述图书档案馆资源的复杂模型。FRBR模型可以描述同一图书档案馆资源的不同变体,如同一本书的不同印刷本,或不同的语言翻译版本(http://www.ifla.org/publications/functional-requirements-for-bib liographic-records)。因此,它不仅适用于书籍,也适用于任何资源。另外,RDA模型可以描述任何种类的内容,包括在线媒体。RDA还允许将信息来源附加到不同的数据上(http://www.rda-jsc.org/rda.html)。Europeana数据模型可以查询创建元数据记录的人员和资源本身的来源(http://www.europeana.eu/portal/)。
然而,仍然缺少一种能可靠验证元数据来源的方法。由A. Kasten等人开发的数字签名图形数据的框架可以用来跟踪元数据的来源。它用数字签名来标记图形并将数据与网络上的签名一起发布,例如关联打开数据。这可以跟踪元数据的来源,建立一个“信任网络”
[15]。
此外,像语义搜索引擎Sig.ma这样的应用程序能够为LOD的实体搜索提供支持,并根据来源提供过滤结果。不幸地是,该项目已经终止
[16]。
表1总结了LOD技术在德国数字图书档案馆的具体应用及其缺陷,揭示了在图书档案馆研究领域LOD技术进一步的研究方向。
序号 | 内容 | 具体应用 | 缺陷 |
1 | 实体解析 | 识别关联开放数据的两种资源是否指向同一个真实的世界实体的问题 | 需要人工调整,非常昂贵,不能合并大型数据集 |
2 | 模式匹配 | 定义和发布自我描述的词汇,通过模式集成来改进图书档案馆服务 | 需要人工调整叙词表模式匹配不同作品 |
3 | 分布式数据管理 | 用于关联打开或查询在网络上高度分布数据 | 不清楚访问分布式数据的最适方法,需要考虑结果排名 |
4 | 自动索引 | 自动索引科学文档 | 需要图书档案科学家不断监测自动建议的描述符的质量 |
5 | 索引非文本内容 | 解决了传统科学内容的映射、社会媒体资料、研究数据等非文本内容的索引 | 实体解析、跨媒体检索内容还需要解决 |
6 | 数据出处 | FRBR概念被并入到RDA中,以描述任何种类的内容。Europeana数据模型可预测创建元数据记录的人员和资源本身的来源 | 缺少感知信息的来源应用程序 |