产品描述

Dsshell AI是数据壳自主研发的AI训练平台。产品为基因组数据处理、表型组数据处理、生物医学统计、传感器数据处理、人工智能深度学习模型训练、机器学习、交互式数据处理、 数据可视化、R画图、内部lims系统等诸多场景量身打造了高效、便捷、易用的工具平台。在此平台下,不管是以实验为主的研究人员,还是专门的数据分析人员,无需关注环境依赖,集中精力进行擅长的数据分析。

平台特色

数据便捷高速同步

满足精准医学全场景、多维度的数据处理需求,覆盖数据的自动化采集、存储、安全管理、分析等全生命周期过程,融合多种数据处理模式,支持基于HPC生态的海量数据计算模拟,支持基于流程引擎的复杂流程化数据分析,支持基于神经网络的常规AI模型训练、大模型训练,支持基于MR、Spark的海量数据批计算

资源池配额机制

平台划分为私有资源池和共享资源池,灵活的对机构、用户组、用户做资源的控制,并支持动态调整。获得私有资源池配额的用户,用户使用私有资源池的配额创建持久的训练任务;共享资源池是全局共享,动态释放资源,可以支撑大资源消耗的任务,使资源有效的循环使用。

可视化工具

平台提供AI训练使用的可视化工具,例如Jupyter、R-Studio,可以直接预览图形化数据、报告。训练流程通过可视化界面拖拽拼接。

通讯代理机制

平台支持容器内部服务的代理,通过代理,用户可以实现内部服务的外部访问,支持基于TCP/IP协议的上层协议,例如HTTP、SSH、FTP、S3等等,这样也就能实现了第三方工具的直接访问,例如:SSH客户端、FTP客户端。

任务快照机制

平台支持容器快照,定时备份环境和数据,并能够一键恢复镜像点,确保数据不丢失。

产品架构

产品架构图