npj: 材料基因工程专用数据库—新兴材料基础设施架构

npj 知社学术圈 今天

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

图片

随着“材料基因工程”(MGE)重点专项的开展,材料科学的科学研究变得更加数据密集和团队协作,材料界迫切需要现代数据基础设施来促进材料数据和分析工具的共享。其中,材料数据是“当代”材料科学技术发展的重要基础,是新生产要素、国家战略资源、未来国际科技竞争焦点,我国材料数据库建设严重滞后于欧美的快速发展。


来自北京科技大学的张晓彤教授等人总结了MGE专用的现代基础设施的两大需求:一个以用户为中心的表示数据模型,便于高效地汇交和规范化数据;一个能够集成各种数据分析挖掘工具的服务管理框架。基于这些需求,他们研发了材料基因工程专用数据库(MGED)平台,该平台采用基于动态容器模型(DCM)的具有高可用性的MGE专用架构,实现了多源异构材料数据的统一存储和开放共享。其中,动态容器模型允许用户根据汇交数据自主设计专门的存储结构模板,既满足异构数据存储需求,又提升数据汇交便利性。该架构还采用了服务管理框架来集成第三方数据分析服务,并与汇交数据有机结合,实现高效的数据重用和分析挖掘。通过对共享数据和服务的一体化管理,MGED为研究人员提供了一个开放的协作环境,可以快速方便地保存和分析数据,进而提高新材料研发效率。

该文近期发表于npj Computational Materials 7: 88(2021),英文标题与摘要如下,点击左下角“阅读原文”可以自由获取论文PDF。

图片


An infrastructure with user-centered presentation data model for integrated management of materials data and services


Shilong Liu, Yanjing Su, Haiqing Yin, Dawei Zhang, Jie He, Haiyou Huang, Xue Jiang, Xuan Wang, Haiyan Gong, Zhuang Li, Hao Xiu, Jiawang Wan & Xiaotong Zhang


 With scientific research in materials science becoming more data intensive and collaborative after the announcement of the Materials Genome Initiative, the need for modern data infrastructures that facilitate the sharing of materials data and analysis tools is compelling in the materials community. In this paper, we describe the challenges of developing such infrastructure and introduce an emerging architecture with high usability. We call this architecture the Materials Genome Engineering Databases (MGED). MGED provides cloud-hosted services with features to simplify the process of collecting datasets from diverse data providers, unify data representation forms with user-centered presentation data model, and accelerate data discovery with advanced search capabilities. MGED also provides a standard service management framework to enable finding and sharing of tools for analyzing and processing data. We describe MGED’s design, current status, and how MGED supports integrated management of shared data and services.

图片


扩展阅读

 

npj: 粒子扩散数据库的高效构建—自动评估与不确定度量化

npj:电场响应材料数据库—多重高通量计算和机器学习

npj: 剑桥大学的人工智能—阅读文献、析出数据、自动建库、预测磁性和超导

BEable-GPS: 能被碱基编辑器作用的疾病突变数据库 | Genome Biology

本文系网易新闻·网易号“各有态度”特色内容

媒体转载联系授权请看下方

图片