>[info] Github: [https://github.com/happyfish100/fastdfs](https://github.com/happyfish100/fastdfs) [TOC] ## 一、分布式文件系统 通过独立文件服务器可以解决一些问题,如果某天存储文件的那台服务突然down了怎么办?可能你会说,定时将文件系统备份,这台down机的时候,迅速切换到另一台就OK了,但是这样处理需要人工来干预。另外,当存储的文件超过100T的时候怎么办?单台服务器的性能问题?这个时候我们就应该考虑分布式文件系统了。 业务继续发展,单台服务器存储和响应也很快到达了瓶颈,新的业务需要文件访问具有高响应性、高可用性来支持系统。分布式文件系统,一般分为三块内容来配合,服务的存储、访问的仲裁系统,文件存储系统,文件的容灾系统来构成,仲裁系统相当于文件服务器的大脑,根据一定的算法来决定文件存储的位置,文件存储系统负责保存文件,容灾系统负责文件系统和自己的相互备份。 **优点**:扩展能力: 毫无疑问,扩展能力是一个分布式文件系统最重要的特点;高可用性: 在分布式文件系统中,高可用性包含两层,一是整个文件系统的可用性,二是数据的完整和一致性;弹性存储: 可以根据业务需要灵活地增加或缩减数据存储以及增删存储池中的资源,而不需要中断系统运行 **缺点**:系统复杂度稍高,需要更多服务器 | 指标 | 适合类型 | 文件分布 | 系统性能 | 复杂度 | FUSE | POSIX | 备份机制 | 通讯协议接口 | 社区支持 | 开发语言 | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | FastDFS | 4KB~500MB | 小文件合并存储不分片处理 | 很高 | 简单 | 不支持 | 不支持 | 组内冗余备份 | Api HTTP | 国内用户群 | C语言 | | TFS | 所有文件 | 小文件合并,以block组织分片 | | 复杂 | 不支持 | | Block存储多份,主辅灾备 | API http | 少 | C++ | | MFS | 大于64K | 分片存储 | Master占内存多 | | 支持 | 支持 | 多点备份动态冗余 | 使用fuse挂在 | 较多 | Perl | | HDFS | 大文件 | 大文件分片分块存储 | | 简单 | 支持 | 支持 | 多副本 | 原生api | 较多 | Java | | Ceph | 对象文件块 | OSD一主多从 | | 复杂 | 支持 | 支持 | 多副本 | 原生api | 较少 | C++ | | MogileFS | 海量小图片 | | 高 | 复杂 | 可以支持 | 不支持 | 动态冗余 | 原生api | 文档少 | Perl | | ClusterFS | 大文件 | | | 简单 | 支持 | 支持 | | | 多 | C | ## 二、FastDFS介绍 `FastDFS`是一个开源的轻量级分布式文件系统。它解决了大数据量存储和负载均衡等问题。特别适合以中小文件(建议范围:4KB < file\_size <500MB)为载体的在线服务,如相册网站、视频网站等等。在UC基于FastDFS开发向用户提供了:网盘,社区,广告和应用下载等业务的存储服务。 `FastDFS`为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用`FastDFS`很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。 ![](images/screenshot_1589767087329.png) FastDFS服务端有三个角色:跟踪服务器(tracker server)、存储服务器(storage server)和客户端(client)。 Tracker相当于FastDFS的大脑,不论是上传还是下载都是通过tracker来分配资源;客户端一般可以使用ngnix等静态服务器来调用或者做一部分的缓存;存储服务器内部分为卷(或者叫做组),卷于卷之间是平行的关系,可以根据资源的使用情况随时增加,卷内服务器文件相互同步备份,以达到容灾的目的。 ### 2.1\. tracker server 跟踪服务器,主要做调度工作,起负载均衡的作用。在内存中记录集群中所有存储组和存储服务器的状态信息,是客户端和数据服务器交互的枢纽。相比GFS中的master更为精简,不记录文件索引信息,占用的内存量很少。 Tracker是FastDFS的协调者,负责管理所有的storage server和group,每个storage在启动后会连接Tracker,告知自己所属的group等信息,并保持周期性的心跳,tracker根据storage的心跳信息,建立group==>\[storage server list\]的映射表。 Tracker需要管理的元信息很少,会全部存储在内存中;另外tracker上的元信息都是由storage汇报的信息生成的,本身不需要持久化任何数据,这样使得tracker非常容易扩展,直接增加tracker机器即可扩展为tracker cluster来服务,cluster里每个tracker之间是完全对等的,所有的tracker都接受stroage的心跳信息,生成元数据信息来提供读写服务。 ### 2.2\. storage server 存储服务器(又称:存储节点或数据服务器),文件和文件属性(meta data)都保存到存储服务器上。Storage server直接利用OS的文件系统调用管理文件。 Storage server(后简称storage)以组(卷,group或volume)为单位组织,一个group内包含多台storage机器,数据互为备份,存储空间以group内容量最小的storage为准,所以建议group内的多个storage尽量配置相同,以免造成存储空间的浪费。 以group为单位组织存储能方便的进行应用隔离、负载均衡、副本数定制(group内storage server数量即为该group的副本数),比如将不同应用数据存到不同的group就能隔离应用数据,同时还可根据应用的访问特性来将应用分配到不同的group来做负载均衡;缺点是group的容量受单机存储容量的限制,同时当group内有机器坏掉时,数据恢复只能依赖group内地其他机器,使得恢复时间会很长。 group内每个storage的存储依赖于本地文件系统,storage可配置多个数据存储目录,比如有10块磁盘,分别挂载在/data/disk1-/data/disk10,则可将这10个目录都配置为storage的数据存储目录。 storage接受到写文件请求时,会根据配置好的规则(后面会介绍),选择其中一个存储目录来存储文件。为了避免单个目录下的文件数太多,在storage第一次启动时,会在每个数据存储目录里创建2级子目录,每级256个,总共65536个文件,新写的文件会以hash的方式被路由到其中某个子目录下,然后将文件数据直接作为一个本地文件存储到该目录中。 ### 2.3\. client 客户端,作为业务请求的发起方,通过专有接口,使用TCP/IP协议与跟踪器服务器或存储节点进行数据交互。FastDFS向使用者提供基本文件访问接口,比如upload、download、append、delete等,以客户端库的方式提供给用户使用。 另外两个概念: * **group**:组, 也可称为卷。 同组内服务器上的文件是完全相同的 ,同一组内的storage server之间是对等的, 文件上传、 删除等操作可以在任意一台storage server上进行 。 * **meta data**:文件相关属性,键值对( Key Value Pair) 方式,如:width=1024,heigth=768 。 ### 2.4\. 优缺点 * 优点: * 机器配置要求低。不管是上传下载,同步恢复,都对机器的负载要求非常低。 * 支持相同内容的文件只保存一份,节约磁盘空间 * 支持在线扩容机制,增强系统的可扩展性 * 支持主从文件,支持自定义扩展名 * 主备Tracker服务,增强系统的可用性 * 缺点: * 不支持断点续传,对大文件将是噩梦(FastDFS不适合大文件存储) * 对跨公网的文件同步,存在较大延迟,需要应用做相应的容错策略 * 同步机制不支持文件正确性校验,降低了系统的可用性 ### 2.5\. 上传交互过程 ![](images/screenshot_1589767257188.png) 1. client询问tracker上传到的storage,不需要附加参数 2. tracker返回一台可用的storage 3. client直接和storage通讯完成文件上传 ### 2.6\. 下载交互过程 ![](images/screenshot_1589767296554.png) 1. client询问tracker下载文件的storage,参数为文件标识(卷名和文件名) 2. tracker返回一台可用的storage 3. client直接和storage通讯完成文件下载 ### 2.7\. 文件ID-FID 文件索引结构如下图,是客户端上传文件后存储服务器返回给客户端,用于以后访问该文件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。 ``` group1/M00/02/44/wKgB2lt1P3iABfncAADcK7fkpiI88888.png ``` * 组名:文件上传后所在的存储组名称,在文件上传成功后有存储服务器返回,需要客户端自行保存。 * 虚拟磁盘路径:存储服务器配置的虚拟路径,与磁盘选项store\_path\*对应。 * 数据两级目录:存储服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。 * 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。 ### 2.8\. 快速定位文件 知道FastDFS FID的组成后,我们来看看FastDFS是如何通过这个精巧的FID定位到需要访问的文件。 * 通过组名tracker能够很快的定位到客户端需要访问的存储服务器组,并将选择合适的存储服务器提供客户端访问; * 存储服务器根据“文件存储虚拟磁盘路径”和“数据文件两级目录”可以很快定位到文件所在目录,并根据文件名找到客户端需要访问的文件。 ![](images/screenshot_1589767477475.png)