在人工智能与高性能计算需求呈指数级增长的今天,数据存储的效率与可靠性已成为算力释放的关键支撑。上海霄云信息科技有限公司正式推出全新一代AI存储产品——霄云银河存储。这款专为人工智能模型训练、高性能计算(HPC)、生命科学等场景设计的存储系统,以“极速、高可用、全链路可视”为核心,重新定义企业级存储的性能边界。
三大核心场景,释放存储潜能
1.人工智能模型训练与推理
内置GPU Direct Storage技术,数据无需经CPU中转即可直达GPU显存,读性能达90GB/s,写性能75GB/s,大幅提升万亿参数大模型训练效率。
单个元数据服务器(MDS)可支持50亿文件管理,优化CheckPoint存储效率,加速模型训练恢复流程。
2.高性能计算(HPC)
支持百万级IOPS与微秒级延迟,通过并行文件系统与IB高速网络,满足气象模拟、石油勘探计算等场景对海量数据并行处理的需求。
Multi-Rail多网卡聚合技术实现带宽利用率90%+,确保多客户端并发访问无拥塞。
3.生命科学
高效处理基因测序、蛋白折叠等超大规模非结构化数据,结合RAID 10/5/6冗余架构,保障科研数据完整性与分析连续性。
颠覆性设计,打造高可靠架构
霄云银河存储采用“应用-双控-存储”三层架构,以软硬件协同创新重构存储底层逻辑:
双控服务器层
内置高性能并行文件系统,支持无缝横向扩展,性能随节点增加线性提升。
双控机箱10秒级故障切换,配合共享硬件RAID,实现控制器故障时业务零中断。
存储节点层
全闪存RAID阵列,支持热插拔与在线扩容,数据冗余无需软件同步,一方面降低软件复杂性,另一方面无需节点间交换数据,不占用IB网络带宽。
统一命名空间管理,新增节点自动纳入资源池,扩展性提升。
高速互联网络
支持Infiniband/ROCE RDMA网络协议,提供400Gbps级传输速度,构建低延迟、高带宽数据通道。
六大功能特性,定义未来存储
1.GPU Direct Storage
数据直通GPU显存,消除CPU瓶颈,模型训练速度提升2倍以上。
2.CheckPoint智能优化
自动空间治理系统,优化存储资源分配,加速模型训练恢复效率。
3.极速故障恢复
双控高可用系统最快10秒内完成I/O接管,保障关键业务连续性。
4.企业级安全与管理
CSI私有客户端容器化部署,适配K8s生态。
用户配额+ACL访问控制,满足金融、医疗等行业合规需求。
5.硬件级冗余
支持RAID 10/5/6.硬盘故障时自动重建,数据安全性超越传统软件RAID方案。
6.全链路监控系统
独立模块化设计,实时可视化IO性能、硬件状态及网络负载,助力精准故障定位。
技术亮点:重新定义存储效率
硬件RAID vs软件RAID
通过专用硬件处理XOR运算,彻底释放CPU资源,同时避免节点间数据交换占用网络带宽。
统一命名空间
跨节点文件系统无缝整合,用户无需手动映射路径,管理效率提升3倍。
IB网络+Multi-Rail双保险
InfiniBand提供400Gbps基础传输速度,配合Multi-Rail负载均衡,实现大规模并行访问无拥塞。
开启存储新纪元
霄云银河存储不仅是存储设备,更是AI基础设施的中枢。通过软硬件协同优化,解决了传统存储在扩展性、延迟与管理复杂度上的痛点,让数据流动真正匹配算力增长,助力企业抢占AI时代先机。
关于霄云科技
上海霄云信息科技有限公司(简称:霄云科技)成立于2015年,是一家深耕高性能分布式存储领域的高新技术企业。核心技术团队用10年+的时间,承担和钻研上海市科委“PB级海量存储系统”课题,并实现科研成果转化。霄云科技的自研创新高性能分布式存储产品,追求高品质和高可靠性,具备自主知识产权和高技术壁垒,已经服务医疗、金融、电信、教育、制造等多个行业客户,深受用户好评。
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。