以上几种分布式技术都用各自使用的应用场景,都可以安装在通用的X86架构的服务器上。
HDFS
是大数据解决方案里常用的分布式文件系统,提供HDFS接口协议,HDFS的namenode 负责文件系统的metadata,datanode负责真正的数据块。数据安全支持副本,EC等。
CEPH
Ceph 最初发展的cephfs,随时社区的发展,目前演变成统一存储平台,支持多种数据类型。开源ceph 在对接块存储上有RBD 接口协议,在对接对象RGW上支持swift,S3。在文件系统上有cephfs。在对接大数据平台上社区也提供S3A的技术架构。ceph在数据安全支持多层级bucket,支持副本,EC数据安全策略,能满足多种数据级别安全要求,得益于数据存储接口丰富,可以适配企业中大多数存储需求
GlusterFS
GlusterFS是典型的分布式文件系统,遵从POSIX系统接口标准,在处理大文件应用请求时,GlusterFS相对比较有优势。适用于单一应用场景下的业务访问
SWIFT
Swif是对象存储系统,提供对象存储解决方案,swift必须采用swift gw 进行业务访问,就目前来看,Amazon S3已经成为事实的标准,如若把OpenStack Swift作为必须项势必会让各厂商投入较重的研发力量在OpenStack Swift中,从而相对弱化Amazon S3研发。
2.OpenStack Swift 接口定义复杂,除了标准的OpenStack Swift 实现外,基本没有第三方实现一个较完善的语意