产品描述

数据壳组学大数据平台(DSSHELL OMIC BIGDATA),由数据集成平台、数据中台、模型开发平台、数据解析平台和模型应用平台五大部分组成,通过汇聚各类生命科学领域组学数据、环境数据,融合最新的大数据、高性能计算和AI计算等技术,形成体系化的、符合未来发展趋势的,现代化的数据管理、存储、分析平台,实现研发模式创新,赋能前沿的生命科学研究和尖端的产品研发。

产品特性

适用研发机构的现代化大数据平台

满足生命科学全场景、多维度的数据处理需求,覆盖数据的自动化采集、存储、安全管理、分析等全生命周期过程,融合多种数据处理模式,支持基于HPC生态的海量数据计算模拟,支持基于流程引擎的复杂流程化数据分析,支持基于神经网络的常规AI模型训练、大模型训练,支持基于MR、Spark的海量数据批计算

先进的计算引擎

自研计算引擎支持复杂计算流程,支持多种容器技术,自动化任务并行,支持丰富的计算集群类型,强大的容错能力,支持任务checkpoint,自适应任务资源重设提交

易部署和快速扩展

平台可最大化利用已有基础设施平台,而不是重新购买计算集群等昂贵的基础设施。自研计算引擎可同时对接多种类型的计算集群,包括 hpc集群,k8s集群,公有云批量计算集群,最大化利用机构现有算力平台,同时可快速扩展机构算力;后端存储支持对象存储,分布式文件存储等

丰富的流程仓库和教程库

覆盖基因组,蛋白组,表型组等领域
  • RNA-seq
  • ATAC-seq
  • 单细胞 RNAseq
  • WGS/靶向测序
  • 基因组数据高度并行多分类
  • 小RNA测序分析
  • 病毒整合事件分析
  • CRISPR编辑数据
  • MARS-seq
  • Hi-C
  • HGTSEQ
  • 蛋白质3D结构预测
  • 系统发育定位
  • HLA分型
  • ChIP-seq
  • DIA蛋白质组学质谱测量的自动定量
  • 蛋白质组学无标记定量 (LFQ) 分析等
查看详情

产品架构

产品架构图