方案描述

数据壳组学大数据平台(DSSHELL OMIC BIGDATA),由数据集成平台、数据中台、模型开发平台、数据解析平台和模型应用平台五大部分组成,通过汇聚各类生命科学领域组学数据、环境数据,融合最新的大数据、高性能计算和AI计算等技术,形成体系化的、符合未来发展趋势的,现代化的数据管理、存储、分析平台,实现研发模式创新,赋能前沿的生命科学研究和尖端的产品研发。

方案价值

建立机构统一的数据服务平台,实现数据的系统化、资产化管理

  • 数据的全生命周期管理:自动化采集、存储、数据安全、分析、应用、资产化
  • 机构内部外部数据的自动化汇聚、采集
  • 消除研究机构“数据孤岛”,“数据沼泽”
  • 提供数据质量管理相关的技术和平台,保证研究数据质量
  • 原始数据、外部数据、结论数据、模型等高价值数据的资产化管理
  • 数据的分类分级保存

建立机构内部新型、高性能数据分析平台

  • 既能升级当前分析平台,又可满足未来高通量场景需求。
  • 面向海量场景的可实现自动化实验数据高通量处理;丰富的功能,hpc、AI模型训练,流程化计算等,可全方位满足研究机构数据管理、分析需求

快速构建机构内部大数据平台

  • 可最大化利用机构已有基础设施平台,而不是重新购买计算集群等昂贵的基础设施快速构建机构内部数据分析平台。
  • 自研计算引擎可同时对接多种类型的计算集群,包括 hpc集群,k8s集群,公有云批量计算集群,最大化利用机构现有算力平台

方案架构

方案架构图