随着深度学习算法进步,云计算、大数据以及GPU等技术的飞速发展,AI及机器学习的相关技术从算法、算力和数据三个维度实现了全面的提升,爆发了新一轮人工智能发展浪潮。在我国,人工智能与实体经济正深度融合,成为新一轮科技革命和产业变革的重要驱动力量。
远上数据积极应对产业数字化转型升级的诉求,适时推出了机器学习存储解决方案,应对数据作为关键生产要素的使用过程中,海量数据的采集、存储、访问和应用挑战。

远上机器学习存储解决方案,通过MOS智能存储引擎提供海量、弹性、高性价比的存储服务,兼容POSIX语义的文件接口、HDFS接口、S3接口、CSI接口,方便与多种训练平台对接,通过分布式缓存技术,加速机器学习效率。同时,数据管理服务提供丰富的管理策略,简化数据的管理和价值挖掘。
-
支持非结构化、半结构化和结构化数据的汇聚和海量存储
DataIngestor支持对多种数据源的数据汇聚
支持通过NFS / CIFS / FTP / POSIX/ S3/HDFS等多种接口协议写入
单命名空间支持百亿小文件,EB级存储
-
标签检索、智能数据管理
支持对象自定义标签,百亿文件秒级检索
数据分层存储,满足高性能和大容量需求的同时保障总体拥有成本最低
支持多副本和纠删码,兼顾训练的性能和原始数据归档的需求,存储成本相比NAS存储降低40%
-
多访问协议支持
兼容POSIX、HDFS、S3、CSI主流访问协议,实现一套存储支撑人工智能不同阶段数据访问方式
-
客户端分布式缓存加速,释放GPU潜力
针对机器学习训练阶段一写多读的I/O特点,分布式缓存技术可以大大提升多机多卡训练集群下的整体I/O性能,平均GPU利用率可达97%以上