05 2018
Linked Scientific Data
论文信息:徐雷,潘珺.科学出版物语义数据及其应用研究[J].中国科技期刊研究,2018,29(07):704-710.
Semantic Datasets of Scientific Publications and their Applications
You could call it Scientific Knowledge Graph or Linked Scientific Data. Find more Semantic Publishing Datasets at Google Dataset Search数据集名称 | 类型 | 发布机构或人员 | 数据集简介 |
---|---|---|---|
DBLP[1]typical LOD publication data | 出版物关联数据 | 目前由南安普顿大学维护 | 2010年创建,是Linked Open Data(LOD)中比较典型的一个出版物关联数据集。它是一个计算机领域的书目数据集。 |
OpenCitations[2] | 出版物引文数据 | 牛津大学、博洛尼亚大学 | 2010年首次发布,最初数据来源于PubMed开放获取论文数据。在2017年I4OC开放引文运动后,相关组织开始呼吁全领域都开放其论文的引文数据。在http://opencitations.net可以查阅该数据集最新的更新状态。遵循CC0协议。 |
Semantic Lancet[3] | 出版物引文数据 | 爱思唯尔出版集团 | 2014发布,作为爱思唯尔出版集团的一个语义出版项目而产生的一个数据集,该数据集使用SPAR、CiTO本体对《Journal of Web Semantics》期刊的引文数据进行了语义关联,并提供了SPARQL、REST等方式的数据访问手段。遵循CC BY-NC 4.0协议。 |
CEUR-WS[4] | 会议论文关联数据 | CEUR-WS.org | 目前CEUR-WS.org主要处理计算机领域的研讨会论文集的结构化信息。 |
WikiCite[5] | Wikidata引用数据 | Wikimedia基金会 | WikiCite 于2011年被提议。Wikidata是一个结构化的知识库,包含了大量的数据条目,这些条目之间有丰富的引用关系,WikiCite就是这样一个关于条目之间的引用关系的数据集。 |
SciGraph[6] | 出版物相关的关联数据 | 斯普林格 | SciGraph 是斯普林格自然集团2017年发布的语义出版数据集,包含了科学基金、科研项目、会议、隶属机构以及出版物等信息。与SciGraph类似,Springer LOD Conference[21]专注于会议,如会议的相关元数据信息,如会议名缩写、召开城市和时间等,目前提供了对这些信息的检索接口。遵循CC BY-NC 4.0协议。 |
OpenAIRE[7] | 出版物以及链接科学数据 | 欧盟委员会 | 作为一个项目于2009年启动,其间经历过OpenAIRE PLUS项目。目前的项目是OpenAIRE2020,始于2015年,包含出版物以及各种科学数据集。 |
Nanopublication[8] | 纳米出版物 | Tobias Kuhn and Juan Banda | 遵循纳米出版物原则,目前该纳米出版物主要来源于生物医学相关领域,比如药物交互数据(Drug-Drug Interactions)、基因交互数据(neXtProt protein data)、生化过程数据(WikiPathways)等。 |
SciKG[9] | 学术社交数据 | 清华大学 | 2017年发布,SciKG目前包括计算机科学领域的主要概念、专家和论文等知识图谱数据。2019年又发布了新版本OAG v2,包括MAG和AMiner,详见https://www.openacademic.ai/oag/ |
AceKG[10] | 出版物相关的关联数据 | 上海交通大学 | 2018年发布,AceKG包括了大部分领域的论文、作者、期刊、机构、会议、隶属单位等链接数据。 |
ScholarlyData.org[11]* | 学术会议链接数据 | Andrea Giovanni Nuzzolese et al. | 2016年发布于LOD中,包含一个改进的conference-ontology,提供SPARQL endpoint。 |
PeerRead[12]* | 同行评议数据集 | Dongyeop Kang et al. | 2018年发布,包括了ACL, NIPS and ICLR大约14K投稿数据以及相应的接收/被拒情况,具体的评论内容等。 |
TechKG[13]* | 面向中文学术领域的知识图谱 | 东北大学 | 2018年发布的中文学术知识图谱 |
CiteSeerX-2018[14]* | CiteSeerX数据集 | Pennsylvania State University | CiteSeerX数据集,并和WoS、DBLP等进行了映射 |
SKS[15]* | SKS数据集 | 中科院 | 2019 |
EVENTSKG[16]* | EVENTSKG数据集 | -- | 2019发布的近50年来8个计算机领域的科学事件知识图谱,如学术会议、研讨会等 |
propnet[17]* | 材料科学知识图谱 | David Mrdjenovich, etc. | 2019 |
unarXive[18]* | unarXive | Institute AIFB | 对arXiv数据集中的文本引用信息进行解析,并和MAG映射 |
SoftwareKG [19]* | 科学软件提及知识图谱 | Germany | 社会科学论文中软件提及知识图谱,并和已有知识图谱匹配 |
AIDA [20]* | 科学及专利知识图谱 | Italy | 来自MAG以及Dimensions的文献及专利,并给出了该数据集的主题信息 |
AI-KG: [21]* | AI领域科学知识图谱 | Germany | AI科学文献知识图谱,包含tasks, methods, metrics, materials, others五种类型 |
--This table was updated at 20/11/2019.* for NEW ADDED
[1] DBLP. http://dblp.rkbexplorer.com/.
[2] OpenCitations. http://opencitations.net/.
[3] Semantic Lancet Project. http://www.semanticlancet.eu.
[4] Ronzano F, Fisas B, del Bosque G C, et al. On the automated generation of scholarly publishing linked datasets: the case of CEUR-WS proceedings[C]//Semantic Web Evaluation Challenge. Springer International Publishing, 2015: 177-188.
[5] WikiCite. https://meta.wikimedia.org/wiki/WikiCite. [6] Springer Nature SciGraph. https://www.springernature.com/cn/researchers/scigraph.
[7] OpenAIRE.https://www.openaire.eu/.
[8] Nanopublications.https://old.datahub.io/organization/nanopublications.
[9] Tang J, Zhang J, Yao L, et al. Arnetminer: extraction and mining of academic social networks[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008: 990-998.
[10] Acemap Knowledge Graph.http://acemap.sjtu.edu.cn/app/AceKG/.
[11] http://www.scholarlydata.org/
[12] NAACL 2018's paper titled:A Dataset of Peer Reviews (PeerRead): Collection, Insights and NLP Applications
[13] http://www.techkg.cn
[14] J. Wu, B. Kandimalla, S. Rohatgi, A. Sefid, J. Mao and C. L. Giles, "CiteSeerX-2018: A Cleansed Multidisciplinary Scholarly Big Dataset," 2018 IEEE International Conference on Big Data (Big Data), Seattle, WA, USA, 2018, pp. 5465-5467.
[15] SKS:一种科技领域大数据知识图谱平台. 数据与计算发展前沿[J], 2019, 1(1): 8- doi
[16] EVENTSKG: A 5-Star Dataset of Top-ranked Events in Eight Computer Science Communities
[17] propnet: A Knowledge Graph for Materials Science
[18] unarXive: a large scholarly data set with publications’ full‑text, annotated in‑text citations, and links to metadata 2020 Scientometrics
[19] Investigating Software Usage in the Social Sciences: A Knowledge Graph Approach2020
[20] AIDA: a Knowledge Graph about Research Dynamics in Academia and Industry2020
[21] AI-KG: an Automatically Generated Knowledge Graph of Artificial Intelligence 2020
Back to Posts
[1] DBLP. http://dblp.rkbexplorer.com/.
[2] OpenCitations. http://opencitations.net/.
[3] Semantic Lancet Project. http://www.semanticlancet.eu.
[4] Ronzano F, Fisas B, del Bosque G C, et al. On the automated generation of scholarly publishing linked datasets: the case of CEUR-WS proceedings[C]//Semantic Web Evaluation Challenge. Springer International Publishing, 2015: 177-188.
[5] WikiCite. https://meta.wikimedia.org/wiki/WikiCite. [6] Springer Nature SciGraph. https://www.springernature.com/cn/researchers/scigraph.
[7] OpenAIRE.https://www.openaire.eu/.
[8] Nanopublications.https://old.datahub.io/organization/nanopublications.
[9] Tang J, Zhang J, Yao L, et al. Arnetminer: extraction and mining of academic social networks[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008: 990-998.
[10] Acemap Knowledge Graph.http://acemap.sjtu.edu.cn/app/AceKG/.
[11] http://www.scholarlydata.org/
[12] NAACL 2018's paper titled:A Dataset of Peer Reviews (PeerRead): Collection, Insights and NLP Applications
[13] http://www.techkg.cn
[14] J. Wu, B. Kandimalla, S. Rohatgi, A. Sefid, J. Mao and C. L. Giles, "CiteSeerX-2018: A Cleansed Multidisciplinary Scholarly Big Dataset," 2018 IEEE International Conference on Big Data (Big Data), Seattle, WA, USA, 2018, pp. 5465-5467.
[15] SKS:一种科技领域大数据知识图谱平台. 数据与计算发展前沿[J], 2019, 1(1): 8- doi
[16] EVENTSKG: A 5-Star Dataset of Top-ranked Events in Eight Computer Science Communities
[17] propnet: A Knowledge Graph for Materials Science
[18] unarXive: a large scholarly data set with publications’ full‑text, annotated in‑text citations, and links to metadata 2020 Scientometrics
[19] Investigating Software Usage in the Social Sciences: A Knowledge Graph Approach2020
[20] AIDA: a Knowledge Graph about Research Dynamics in Academia and Industry2020
[21] AI-KG: an Automatically Generated Knowledge Graph of Artificial Intelligence 2020