方案描述

数据壳精准医学大数据平台,由数据集成平台、数据中台、模型开发平台、数据解析平台和模型应用平台五大部分组成,通过汇聚各类研发系统数据,形成现代化的数据管理、处理体系,实现基于大数据和AI技术的研发模式创新,赋能前沿的精准医学研究、尖端的医学产品开发。

方案价值

现代化精准医学大数据平台

满足精准医学全场景、多维度的数据处理需求,覆盖数据的自动化采集、存储、安全管理、分析等全生命周期过程,融合多种数据处理模式,支持基于HPC生态的海量数据计算模拟,支持基于流程引擎的复杂流程化数据分析,支持基于神经网络的常规AI模型训练、大模型训练,支持基于MR、Spark的海量数据批计算

先进的计算引擎

自研计算引擎,支持复杂基因组分析流程、图像分析流程,支持多种容器技术,自动化任务并行,支持丰富的计算集群类型,强大的容错能力,支持任务checkpoint,自适应任务资源重设提交

易部署和快速扩展

平台可最大化利用已有基础设施平台,避免重新购买计算集群等昂贵的基础设施。自研计算引擎可同时对接多种类型的计算集群,包括 hpc集群,k8s集群,公有云批量计算集群,最大化利用机构现有算力平台;后端存储支持对象存储,分布式文件存储等

丰富的流程仓库和教程库

可配套数十个高质量的精准医学分析流程,覆盖基因组,蛋白组,表型组等领域,包括 WGS/靶向测序,病毒整合事件分析,DIA蛋白质组学质谱测量的自动定量,蛋白质组学无标记定量 (LFQ) 分析等
查看详情

方案架构

方案架构图