05 2018

Linked Scientific DataLei Xu


论文信息:徐雷,潘珺.科学出版物语义数据及其应用研究[J].中国科技期刊研究,2018,29(07):704-710.

Semantic Datasets of Scientific Publications and their Applications

Find more Semantic Publishing Datasets at Google Dataset Search
数据集名称 类型 发布机构或人员 数据集简介
DBLP[1]typical LOD publication data 出版物关联数据 目前由南安普顿大学维护 2010年创建,是Linked Open Data(LOD)中比较典型的一个出版物关联数据集。它是一个计算机领域的书目数据集。
OpenCitations[2] 出版物引文数据 牛津大学、博洛尼亚大学 2010年首次发布,最初数据来源于PubMed开放获取论文数据。在2017年I4OC开放引文运动后,相关组织开始呼吁全领域都开放其论文的引文数据。在http://opencitations.net可以查阅该数据集最新的更新状态。遵循CC0协议。
Semantic Lancet[3] 出版物引文数据 爱思唯尔出版集团 2014发布,作为爱思唯尔出版集团的一个语义出版项目而产生的一个数据集,该数据集使用SPAR、CiTO本体对《Journal of Web Semantics》期刊的引文数据进行了语义关联,并提供了SPARQL、REST等方式的数据访问手段。遵循CC BY-NC 4.0协议。
CEUR-WS[4] 会议论文关联数据 CEUR-WS.org 目前CEUR-WS.org主要处理计算机领域的研讨会论文集的结构化信息。
WikiCite[5] Wikidata引用数据 Wikimedia基金会 WikiCite 于2011年被提议。Wikidata是一个结构化的知识库,包含了大量的数据条目,这些条目之间有丰富的引用关系,WikiCite就是这样一个关于条目之间的引用关系的数据集。
SciGraph[6] 出版物相关的关联数据 斯普林格 SciGraph 是斯普林格自然集团2017年发布的语义出版数据集,包含了科学基金、科研项目、会议、隶属机构以及出版物等信息。与SciGraph类似,Springer LOD Conference[21]专注于会议,如会议的相关元数据信息,如会议名缩写、召开城市和时间等,目前提供了对这些信息的检索接口。遵循CC BY-NC 4.0协议。
OpenAIRE[7] 出版物以及链接科学数据 欧盟委员会 作为一个项目于2009年启动,其间经历过OpenAIRE PLUS项目。目前的项目是OpenAIRE2020,始于2015年,包含出版物以及各种科学数据集。
Nanopublication[8] 纳米出版物 Tobias Kuhn and Juan Banda 遵循纳米出版物原则,目前该纳米出版物主要来源于生物医学相关领域,比如药物交互数据(Drug-Drug Interactions)、基因交互数据(neXtProt protein data)、生化过程数据(WikiPathways)等。
SciKG[9] 学术社交数据 清华大学 2017年发布,SciKG目前包括计算机科学领域的主要概念、专家和论文等知识图谱数据。
AceKG[10] 出版物相关的关联数据 上海交通大学 2018年发布,AceKG包括了大部分领域的论文、作者、期刊、机构、会议、隶属单位等链接数据。
PeerRead[11] 同行评议数据集 Dongyeop Kang et al. 2018年发布,包括了ACL, NIPS and ICLR大约14K投稿数据以及相应的接收/被拒情况,具体的评论内容等。

--This table was updated at 20/04/2018.
[1] DBLP. http://dblp.rkbexplorer.com/.
[2] OpenCitations. http://opencitations.net/.
[3] Semantic Lancet Project. http://www.semanticlancet.eu.
[4] Ronzano F, Fisas B, del Bosque G C, et al. On the automated generation of scholarly publishing linked datasets: the case of CEUR-WS proceedings[C]//Semantic Web Evaluation Challenge. Springer International Publishing, 2015: 177-188.
[5] WikiCite. https://meta.wikimedia.org/wiki/WikiCite. [6] Springer Nature SciGraph. https://www.springernature.com/cn/researchers/scigraph.
[7] OpenAIRE.https://www.openaire.eu/.
[8] Nanopublications.https://old.datahub.io/organization/nanopublications.
[9] Tang J, Zhang J, Yao L, et al. Arnetminer: extraction and mining of academic social networks[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008: 990-998.
[10] Acemap Knowledge Graph.http://acemap.sjtu.edu.cn/app/AceKG/.
[11] NAACL 2018's paper titled:A Dataset of Peer Reviews (PeerRead): Collection, Insights and NLP Applications
Back to Posts