05 2018

Linked Scientific DataLei Xu


论文信息:徐雷,潘珺.科学出版物语义数据及其应用研究[J].中国科技期刊研究,2018,29(07):704-710.

Semantic Datasets of Scientific Publications and their Applications

You could call it Scientific Knowledge Graph or Linked Scientific Data. Find more Semantic Publishing Datasets at Google Dataset Search
数据集名称 类型 发布机构或人员 数据集简介
DBLP[1]typical LOD publication data 出版物关联数据 目前由南安普顿大学维护 2010年创建,是Linked Open Data(LOD)中比较典型的一个出版物关联数据集。它是一个计算机领域的书目数据集。
OpenCitations[2] 出版物引文数据 牛津大学、博洛尼亚大学 2010年首次发布,最初数据来源于PubMed开放获取论文数据。在2017年I4OC开放引文运动后,相关组织开始呼吁全领域都开放其论文的引文数据。在http://opencitations.net可以查阅该数据集最新的更新状态。遵循CC0协议。
Semantic Lancet[3] 出版物引文数据 爱思唯尔出版集团 2014发布,作为爱思唯尔出版集团的一个语义出版项目而产生的一个数据集,该数据集使用SPAR、CiTO本体对《Journal of Web Semantics》期刊的引文数据进行了语义关联,并提供了SPARQL、REST等方式的数据访问手段。遵循CC BY-NC 4.0协议。
CEUR-WS[4] 会议论文关联数据 CEUR-WS.org 目前CEUR-WS.org主要处理计算机领域的研讨会论文集的结构化信息。
WikiCite[5] Wikidata引用数据 Wikimedia基金会 WikiCite 于2011年被提议。Wikidata是一个结构化的知识库,包含了大量的数据条目,这些条目之间有丰富的引用关系,WikiCite就是这样一个关于条目之间的引用关系的数据集。
SciGraph[6] 出版物相关的关联数据 斯普林格 SciGraph 是斯普林格自然集团2017年发布的语义出版数据集,包含了科学基金、科研项目、会议、隶属机构以及出版物等信息。与SciGraph类似,Springer LOD Conference[21]专注于会议,如会议的相关元数据信息,如会议名缩写、召开城市和时间等,目前提供了对这些信息的检索接口。遵循CC BY-NC 4.0协议。
OpenAIRE[7] 出版物以及链接科学数据 欧盟委员会 作为一个项目于2009年启动,其间经历过OpenAIRE PLUS项目。目前的项目是OpenAIRE2020,始于2015年,包含出版物以及各种科学数据集。
Nanopublication[8] 纳米出版物 Tobias Kuhn and Juan Banda 遵循纳米出版物原则,目前该纳米出版物主要来源于生物医学相关领域,比如药物交互数据(Drug-Drug Interactions)、基因交互数据(neXtProt protein data)、生化过程数据(WikiPathways)等。
SciKG[9] 学术社交数据 清华大学 2017年发布,SciKG目前包括计算机科学领域的主要概念、专家和论文等知识图谱数据。
AceKG[10] 出版物相关的关联数据 上海交通大学 2018年发布,AceKG包括了大部分领域的论文、作者、期刊、机构、会议、隶属单位等链接数据。
PeerRead[11] 同行评议数据集 Dongyeop Kang et al. 2018年发布,包括了ACL, NIPS and ICLR大约14K投稿数据以及相应的接收/被拒情况,具体的评论内容等。

--This table was updated at 20/04/2018.
[1] DBLP. http://dblp.rkbexplorer.com/.
[2] OpenCitations. http://opencitations.net/.
[3] Semantic Lancet Project. http://www.semanticlancet.eu.
[4] Ronzano F, Fisas B, del Bosque G C, et al. On the automated generation of scholarly publishing linked datasets: the case of CEUR-WS proceedings[C]//Semantic Web Evaluation Challenge. Springer International Publishing, 2015: 177-188.
[5] WikiCite. https://meta.wikimedia.org/wiki/WikiCite. [6] Springer Nature SciGraph. https://www.springernature.com/cn/researchers/scigraph.
[7] OpenAIRE.https://www.openaire.eu/.
[8] Nanopublications.https://old.datahub.io/organization/nanopublications.
[9] Tang J, Zhang J, Yao L, et al. Arnetminer: extraction and mining of academic social networks[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008: 990-998.
[10] Acemap Knowledge Graph.http://acemap.sjtu.edu.cn/app/AceKG/.
[11] NAACL 2018's paper titled:A Dataset of Peer Reviews (PeerRead): Collection, Insights and NLP Applications
Back to Posts