洪娜,钱庆,方安,吴思竹,杨林.数据驱动的科学工作流及其在生物医学中的应用实践[J].数字图书馆论坛,2014,(3):26~31 |
数据驱动的科学工作流及其在生物医学中的应用实践 |
Data Driven Scientific Workflow and Its Application in Biomedicine |
|
DOI: |
中文关键词: 科学工作流;e-Science;数据密集;共享工作流;Taverna |
英文关键词: Scientific workflow;e-Science;Data intensive;Workflow share;Taverna |
基金项目:本文系国家“十二五”科技支撑计划项目课题“科技知识组织体系共享服务平台建设”(编号2011BAHl0B03)、国家社会科学基金项目“关联数据中潜在知识关联的发现方法研究”(编号11CTQ016)和中央级公益性科研院所基本科研业务费课题“面向大数据的医学科研支撑环境建设初步研究”(编号13R0102)的研究成果之一。 |
作者 | 单位 | 洪娜 | 中国医学科学院北京协和医学院医学信息研究所 | 钱庆 | 中国医学科学院北京协和医学院医学信息研究所 | 方安 | 中国医学科学院北京协和医学院医学信息研究所 | 吴思竹 | 中国医学科学院北京协和医学院医学信息研究所 | 杨林 | 中国医学科学院北京协和医学院医学信息研究所 |
|
摘要点击次数: 2180 |
全文下载次数: 1548 |
中文摘要: |
E-Science关注数字环境下的科研活动,然而随着生物医学大数据的爆发,数据密集型科学研究为e-Science带来了新的挑战。科学工作流通过形式化科学计算的流程,支持在一个专门的程序环境下自动协调多任务多步骤的处理,从而减少科研投入,提高科研效率。文章首先归纳并总结了科学工作流的相关定义,然后分析了当前主流的科学工作流系统,提出科学工作流处理如何应对密集的生物医学数据,并基于Taverna开展了生物医学领域的科学工作流实验。最后总结了科学工作流当前的研究现状和存在的一些问题。 |
英文摘要: |
E-Science focuses on the scientific activities under digital environment. However, with the burst of biomedical big data, data intensive scientific research brings the new chal enges to e-Science. Scientific workflow supports formalizing the flow of scientific computing, automatical y coordinates multi-task and multi-steps process under a special program environment for reducing cost and promoting efficiency. In this paper, we explicit the definition of scientific workflow and then analyze the main current scientific workflow systems, besides, we propose how to deal with intensive biomedical data within scientific workflow, and some experiments have been done by using Taverna workbench. Final y, we conclude state of art of current research and some problems in this field. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |