李悦,孙坦,赵瑞雪,李娇,黄永文,罗婷婷,鲜国建.大规模RDF三元组转换及存储工具比较研究[J].数字图书馆论坛,2020,(11):2~12 |
大规模RDF三元组转换及存储工具比较研究 |
A Comparative Study of Large-scale RDF Triple Conversion and Storage Tools |
投稿时间:2020-11-04 |
DOI:10.3772/j.issn.1673-2286.2020.11.001 |
中文关键词: RDB2RDF;RDF转换;RDF存储;大数据智能;知识图谱 |
英文关键词: RDB2RDF; RDF Conversion; RDF Triple Store; Big Data Intelligence; Knowledge Graph |
基金项目:本研究得到国家社会科学基金项目“科技论文全景式摘要知识图谱构建与应用研究”(编号:19BTQ061)资助。 |
作者 | 单位 | 李悦 | 中国农业科学院农业信息研究所 | 孙坦 | 中国农业科学院农业信息研究所 农业农村部农业大数据实验室 | 赵瑞雪 | 中国农业科学院农业信息研究所 农业农村部农业大数据实验室 | 李娇 | 中国农业科学院农业信息研究所 | 黄永文 | 中国农业科学院农业信息研究所 | 罗婷婷 | 中国农业科学院农业信息研究所 | 鲜国建 | 中国农业科学院农业信息研究所 农业农村部农业大数据实验室 |
|
摘要点击次数: 2433 |
全文下载次数: 2894 |
中文摘要: |
富含语义知识的数据网络是实现大数据智能的基石。资源描述框架(Resource Description Framework,RDF)是用于描述网络资源的W3C标准。大规模转换、存储管理RDF三元组是构建关联数据网络或语义知识图谱,实现数据可查找、可访问、可交互、可再用的重要路径。本文选择国际主流的10种RDF三元组转换工具,以及6种广受欢迎的RDF存储系统,从技术原理、性能特点及应用场景等多个视角进行对比分析,并总结存在问题和不足。提出未来大规模RDF三元组数据转换与存储管理需要实现的目标是实现RDF抽取、转换和加载(ETL)的流程化和集成化,并重点支撑4类典型应用需求场景,包括从非RDF数据到RDF数据的转换,不同RDF数据格式之间的双向转换,RDF三元组在数据库之间的数据迁移,以及RDF数据的动态更新和进化管理。 |
英文摘要: |
Data network rich in semantic knowledge is the cornerstone of realizing big data intelligence. Resource Description Framework (RDF) is the W3C standard for describing web resources. Large-scale conversion and storage management of RDF triples is an important path for building a linked data network or semantic knowledge graph and realizing data Findable, Accessible, Interoperable and Reusable (FAIR principle). In this paper, ten international mainstream RDF conversion tools and six popular RDF triple storage systems are selected, and a comparative analysis is made from the perspectives of technical principles, performance characteristics and application scenarios, and briefly summarize the existing problems and shortcomings. It is proposed that the goal of large-scale RDF triple data conversion and storage management is to realize the flow, integration and integration of RDF Extract-Transform-Load (ETL), and to focus on supporting four typical application requirements scenarios, including: conversion from non-RDF data to RDF data; bidirectional conversion between different RDF data formats; data migration of RDF triples between databases; dynamic update and evolutionary management of RDF data. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |